情報組織化研究グループ9月例研究会「Linked Open Dataの基礎とこれからの情報活用」
日時:2013年9月21日(土) 14:30~17:00
発表者 :嘉村哲郎氏(東京藝術大学芸術情報センター/総合芸術アーカイブセンター, NPO法人 リンクト・オープンデータ・イニシアティブ)
テーマ :Linked Open Dataの基礎とこれからの情報活用
- 嘉村さんの背景
- 総合芸術アーカイブセンター 芸術情報研究員
- 文化情報学(MLA 観光情報)を扱う学問分野
- Linked Open Data イニシアチブ
Open Data概要
- ビックデータとよく使われる
- 2009年 TEDのプレゼンで Raw Data Noe a Year OpenData
- 政府、科学研究、コミュニティ
- オープンの解釈
- 誰もが自由に利用、再配布、再利用
- 条件はつけない(非営利とか、教育目的に限るのはオープンじゃない)
- パブリックドメイン、ドメイン表記
- 公共、学術、文化機関がオープンデータの対象
- オープン・ガバメント
- 政府が率先して始まった→オープンガバメント
- 政府自治体等公的機関が保有するデータを公開する
- 公開したデータを活用したサービスの提供、データをもとにした政策提言の創出
- 公的な機能をより多くの主体で分担して担い、コストの削減と経済の活性化を目指す
- 2009年 欧米からはじまった
- G8サミットで合意された「オープンデータ憲章」 | カレントアウェアネス・ポータル
- オープンデータ憲章(概要)
- オープンガバメントポータル
- 米国の例
- カテゴリ:50
- データ・セット数:97,536
- データ形式:49
- モバイルアプリ:137
- 市民作成アプリ:349
- 再利用できることが重要に
- ライセンスをつけずに公開するのは×(利用しにくい...)
- まとめ
- 欧州の例
- 公共セクターの情報の利活用に関する指令(EU PSI指令2003/98/ECI)
- http://www.psi.org/psi/europe
- Orphan Works DirecTIve
- PSI大規模改正(2013/3/7)
- オープンデータの義務対象にMLKが追加
- Europeana支援
- 数年以内に発信が始まる?
- 孤児作品のデジタル化
- BLの43%が孤児作品らしい
- データカタログサイト CKAN
- Wikipedia編集ワークショップ
- オープンデータ街歩きワークショップ横浜
Linked Open Data
- Linked Data
- 標準化されたデータのウェブ
- IRI=URL
- LOD基本原則
- IRIをあらゆる事物=リソースの識別子につかう
- IRIの利用にはHTTPの技術
- IRIにアクセスすると事物に関する構造化データが得られる
- データには他のIRIへのリンクを含む
- Cool IRI
- 実体と表現を区別する方法論
- Web NDL Authorities
- サーバでアクセス元によって自動で転送している
- 国会図書館いう夏目漱石は実体として参照するアドレスに集約される
- 国立国会図書館 名称実体URI
- 構造化データ RDF
- メタデータ(コンピュータが内容を理解するための記述)
- 再利用性
@prefix dc:<http://purl.org/dc/terms/>. @prefix ex:<http://example.jp/>. ex:001 a ex:artwork; dc:title "カフェ"@ja; dc:created "1949"; dc:medium "油彩/キャンバス"@ja;
- リンクするデータ
- LODはリレーショナルデータベースでいうところのID(識別子)をIRIとするイメージ
- ネットワークで参照できる
- SPARQL
- SPARQL Endpoint
- RDF StoreへのSPARQLクエリを受け付けるURI
- クエリを試せる入力フォームを備えている場合がある
- Public SPARQL Endpoints availability
- DBpedia Japanese
- APIとSPARQL Endpoint
- LODAC
- Linked Open Data for ACademia
- Linked Dataのアプローチで様々な学術情報を公開して,活用することを目的
LOD利用事例
- The British Library
- datahub
- CKANが自治体データが中心であるのに対して、研究情報を含む点が特徴
- GeoNLPプロジェクト
- 鯖江市の観光案内アプリケーション
まとめ
- 再利用される情報はインターネット経由でアクセスして他のデータからリンクして利用できるオープンライセンスが望ましい
- 著作権を可能な限り放棄する
- 著作権や作者の意思表示等で「完全に自由に利用可能」
- 公共・地域・文化・芸術・学術あらゆる情報がリンクすることでウェブ上に分散する関連情報をより使いやすく
- 5つのステップのうち、4、5を目指す意義
- 利用の立場
- インターネットに接続されたコンピュータからデータのリンクできる
- データの一部(例えば項目の一つ)を取り出して使うことができる
- 他のデータと複数組み合わせて使うことができる
- データのリンク情報から関連する情報を発見することができる(ただし、RDFデータ構造を理解する必要あり)
- 公開の立場
- データ項目へのアクセスを細かく設定でき、利用者にあわせて設計できる
- 他のデータ公開者からデータに対してのリンクができる
- 利用の立場
質問
- ★4へは具体的にどう変換する?
- プログラム変換、最近はマッピング方式で簡易にできる
- OpenRefineやMake your own RDF(ただし、どんなことができる/出来ないかは要確認)
ちょっとした感想
- 今あるLODではないデータを変換するか、新しいものをLODにするのか
- 各機関でそれぞれ公開しているデジタルアーカイブ
- メタデータの属性のデザインは自由で、とてもむずかしい
- その分野で一般的であるとともに、そこから外れる属性をどう表現するか
- IDはIRIに?
- CiNiiなどはNCIDをキーにしたURLだが、こんなイメージなのだろうか
Linked Data: Webをグローバルなデータ空間にする仕組み
- 作者: トムヒース,クリスチャンバイツァー,武田英明
- 出版社/メーカー: 近代科学社
- 発売日: 2013/02/04
- メディア: 単行本
- 購入: 2人 クリック: 24回
- この商品を含むブログ (2件) を見る