klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

情報組織化研究グループ2月例研究会 レビュー『Linked Data: Webをグローバルなデータ空間にする仕組み』

日時:2014年2月1日(土) 14:30~17:00
発表者 :
小村愛美氏(神戸大学附属図書館)
テーマ :レビュー『Linked Data: Webをグローバルなデータ空間にする仕組み』
概要:
「Linked Data」、あるいは「Linked Open Data(LOD)」という言葉に接したことのある人は、ここ数年明らかに増えているだろう。図書館の書誌データはこのLinked Data形式と親和性が高いとされ、当グループの研究会テーマにも取り上げられるなど関心の高さがうかがわれる。
 そんな中、本書はLinked Dataの包括的な解説本が初めて日本語に翻訳されたものとして注目を集め、当グループ内にも本書を輪読する勉強会が立ち上げられた。発表者はこの勉強会参加者であり、輪読が一巡したことを受けて本書の内容を紹介させていただく。目録業務の経験も、情報組織への造詣もほとんどない人間がLinked Dataに触れてみた、という視点で語ってみたい。
http://josoken.digick.jp/meeting/news.html#201401

昨年9月の嘉村哲郎さんの発表に伺って、LODのお話を聞く2回め。主な内容は輪読会と、小村さんが見聞きした・学んだことの報告。原著は2011年、日本語版は2013年に刊行された。その間に状況はどんどん進んでいったため、小村さんからの補足や関西での状況なども併せて紹介いただいた。
Linked Open Dataの基礎とこれからの情報活用 2013.9例会(情報組織化研究グループ)

Linked Data: Webをグローバルなデータ空間にする仕組み

Linked Data: Webをグローバルなデータ空間にする仕組み

こちらの本を自分でも読み進めてみたものの、他の方がどんな風に読んだのか知りたくて参加してみた。報告スライドは後日掲載されるそうなので、ここでは簡単な記録を。ちなみに原著者のChristian Bizer氏は現在は、Universität Mannheimにいらっしゃるらしい。

Twitterしながら、メモをとったのでそれも併せて。すでにまとめをしてくださったので、ありがたく。
小村愛美「レビュー『Linked Data』」@情報組織化研20140201 #LinkedData - Togetterまとめ

2014.2.3追記
当日のスライドが発表されました。

140201josoken linkeddata




この発表は2013年7月からはじまった勉強会『Linked Data』輪読がもとになっている。
勉強会記録(情報組織化研究グループ)

以下、1から7章までの内容紹介。レビューのまとめって、何なんだという感じもしますが…
ちなみにページ数や項目番号は初版第二刷りのものを記載してみた。赤字は自分が読んだ時に付箋を貼ったもの。

1章
  • 社会の変化と背景(1.1)
    • データの氾濫とデータの需要
  • 構造化されたデータ(1.2)
    • 定型的と公開方法のそれぞれに制約がある
  • よりよいモデルとしてのRDF(1.3)
    • データ同士のリンク
    • データ間の関係性の記述
2章
  • Linked Dataはまったくの新星ではない
    • Webの構成をデータ共有に適用した
  • Linked Dataの4つの基本原則(p.7)
    • あらゆる事物にURIを付与(2.2)
    • だれでも時うつの内容が確認できる(2.3)
    • URIを参照した時は標準の技術を仕様して関係する他の情報を利用できる(2.4)
    • より多くの事物を発見できるように他のURIへのリンクを含める(2.5)(2.5)
      • 関係リンク(2.5.1)、同一性リンク(2.5.2)、語彙リンク(2.5.3)

この箇所について質問があった+自分もよく分からず、付箋を貼っていたので、ちょっとまとめ。


あるデータセットがあるとする。それはBig Lynx社の常務取締役Dave Smith*1に関するデータセット。このDave Smithさんが生まれた土地名は、地理情報へのリンク(←関係リンク)が埋め込まれている。このデータセット自体が持つ固有のURIが同一性リンク。
語彙リンクについて、本書以外のところを参照してみた。Europeanaのメタデータについての講義がノースカロライナ大学のMOOCで公開されている。
Europeanaのメタデータについての講義がノースカロライナ大学のMOOCで公開 | カレントアウェアネス・ポータル
Unit2~3にかけて*2Dublin CoreやどうやってMetadata Schemaを作っていくのかという話をしている。
DBpedia Japaneseで公開されているデータをRDF形式でダウンロードしてみた。ここの一部

<rdf:RDF
	xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
	xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
	xmlns:owl="http://www.w3.org/2002/07/owl#"
	xmlns:dbpedia-owl="http://dbpedia.org/ontology/"
	xmlns:dcterms="http://purl.org/dc/terms/"
	xmlns:foaf="http://xmlns.com/foaf/0.1/"
	xmlns:prop-ja="http://ja.dbpedia.org/property/"
	xmlns:prov="http://www.w3.org/ns/prov#" >
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/パブロ・ピカソ">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/レンブラント・ファン・レイン">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/内燃機関">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/オペラ">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/ガスタービンエンジン">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/1452年">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/ジェロラモ・カルダーノ">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/クリストファー・コロンブス">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/ビル・ゲイツ">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/1519年">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/ルネサンス">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/コンタクトレンズ">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/西洋美術史">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/黒澤明">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/登山">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/2千年紀">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/1503年">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/黄金比">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/工学">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/ヴァイオリン">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>
  <rdf:Description rdf:about="http://ja.dbpedia.org/resource/発明">
    <dbpedia-owl:wikiPageWikiLink rdf:resource="http://ja.dbpedia.org/resource/レオナルド・ダ・ヴィンチ" />
  </rdf:Description>

のうち、

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
	xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
	xmlns:owl="http://www.w3.org/2002/07/owl#"
	xmlns:dbpedia-owl="http://dbpedia.org/ontology/"
	xmlns:dcterms="http://purl.org/dc/terms/"
	xmlns:foaf="http://xmlns.com/foaf/0.1/"
	xmlns:prop-ja="http://ja.dbpedia.org/property/"
	xmlns:prov="http://www.w3.org/ns/prov#" >

が、こんなターム(語彙)を使いますよ、という宣言をしている。

別の例。Dublin Core(ダブリン・コア): ウェブ資源メタデータの共通語彙の例を引用する。

<rdf:RDF
  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xml:lang="ja">
 <rdf:Description rdf:about="http://www.kanzaki.com/docs/sw/">
  <dc:creator>神崎正英</dc:creator>
  <dc:date>2001-09-04</dc:date>
 </rdf:Description>
</rdf:RDF>

ここでは、Dublin CoreDCMI Metadata Termsを使うよ、と宣言している。


えーっと、この辺りの理解があやふやなので、ぜひ本家をご確認ください。私はこの箇所を次章、4.4.「データを記述するための語彙を選択して用いるには」につながるのかと理解しました。明らかにそれは違うだろ、というご指摘をください。

ちなみにLinked Dataの語彙やデータセットの関する情報はこちらに掲載されている、らしい。
Library Linked Data Incubator Group: Datasets, Value Vocabularies, and Metadata Element Sets

ご発表にもどります。

  • Linked Dataの公開の段階(2.6)
    • オープンライセンスでデータ形式不問(pdfや画像)
    • 機械可読形(Excel
    • 汎用的な形式式(csv
    • RDFを使用
    • 他のデータ源とリンク
    • csvまでなら素人でも行けるよね!
3章

-

4章
  • URIを発行(4.1)
  • CoolなURI(4.1.2)
    • URIを見てもデータの形式が分からなないものよりも、拡張子をつけているほうがCool
  • データセットの記述(4.3)
    • 製作者、更新状況、ライセンス
    • ライセンスの重要性(4.3.3)
      • CCの紹介
      • ライセンスの非明示はデータの再利用を妨げる
5章
  • 公開パターン(5.1)
    • リレーショナル・データベースからLinked Dataへ(5.2.4)
    • 静的な構造化データからLinked Dataへ(5.1.1)
  • RDF化ツール
    • RDF Fizers?
6章

これに関係するかわからないけど先月、リニューアルしたWOSについて、Web of Scienceの大規模なバージョンアップを発表 - トムソン・ロイターによると、以下の話題はリッチスニペットにあたるのだろうか?

また、Google Scholar等のオープンウェブプラットフォームと相互リンクいたします。Google ScholarなどからダイレクトリンクでWeb of Scienceのコンテンツが利用できるようになり、より研究のための検索効率が簡便化されます。連携は順次実施され、年内に完了する予定です。

戻ります。

まとめにかえて


勉強会とかアプリケーションとかのリンク集は、後日に公開予定のスライドを参照します。

感想
  • 一人で読みながら、ひっかかったことが取り上げられていたり、自分ではスルーしていた点が取り上げられていたり
    • 他の方がどう読んだかを知ることができて、少しだけ自分の理解が深くなったような気が
    • 一緒に本を読むって大切だなぁと。
  • 本以外にもたくさんの事例や勉強会などを紹介いただいた
    • 縁あって?せっかくなのでもう少し、関わってみようと思う

ぼんやりしたまとめですが、以上がざっとのまとめ。
ありがとうございました。

*1:この本では架空の会社を例にデータ例が紹介されている。実際にこんな人はいない

*2:2013.2の時点で、Unit4の途中までしか到達してませんので、あとのUnitでも出てくるかもしれません