klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

情報組織化研究グループ1月月例会「GUIを用いた関連語編集機能とメタデータへの関連語登録機能を実装したDigital Cultural Heritageの実践例」

日時:2012年1月28日 14:30-17:00

タイトル:GUIを用いた関連語編集機能とメタデータへの関連語登録機能を実装したDigital Cultural Heritageの実践例
講演者:研谷紀夫氏(東京大学*1
URL:http://www.tezuka-gu.ac.jp/public/seiken/meeting/news.html#201201

目次:
研究背景
文化資源統合アーカイブの構築
社会情報研究資料センターDigital Cultural Heritageの構築
まとめ

キーワードとなった「Digital Cultural Heritage」ですが、そのまま使われているようです。「デジタルな文化遺産」ということですが、「Digital Archive」ではなく「Digital Cultural Heritage」を使う理由(特徴)がいくつかちりばめてあったように思います。研究会では直接言及されなかったですが(と思います)、2009年のartscapeによるインタビュー記事がありました。*2

──『DA研究』では、デジタルアーカイブをタイトルにしながら、本文では、デジタルアーカイブをDCHに変えています。その理由はなんでしょうか。
研谷──デジタルアーカイブというといろいろな定義がされています。本来アーカイブには記録資料、文書資料、あるいはそれを収容する施設という意味がありますが、博物館や図書館とは違うのかという観点が出てきます。デジタル化するということは、文書館、博物館、図書館といった枠を超えた文化遺産・文化資源を横断的にとらえる視点が必要だろうと思います。これがデジタル化の一つの長所であり、3つの施設全体をとらえ直し、再定義しようということで、アーカイブという言葉を使わずにDCHを選択しました。
また、「ヘリテージ」がキーワードで、持続して継承していく意味を込めておく必要性を感じ、国際的にはDCHが使われている背景もありました。

1.研究背景(2005-)

  • デジタル技術と資料特性にあわせた分類・構成法の試行課題
    • 資料の利用の立場とデジタル技術の特性
      • 研究者のメモ、本、紙類、標本、写真…等々が対象
      • MLKそれぞれにまたがる資料が対象でそれらの分類を包括したい
      • 時空間、社会組織や人物(固有名詞)などの歴史上の事物の関係を反映させたい
      • それにデジタル技術の特性をあわせたい
      • 一つの資料に複数の分類や構成を適応
      • 複数の分類体系を適応
    • 歴史的事項(事件、事物、人物)と関連付ける
      • ある事項に対して、「物体」「時間・時代」「空間」という側面から記述することも、それらの側面をさらにヒエラルキー状に展開させた側面からも記述できる
      • さらにそれに資料を結びつける
      • 資料を参考にした図

2.文化資源統合データベース

  • 世の中に存在する様々な事物概念を体系化
  • 各資料を事物・概念体系に関連させる
  • 各事物概念同士の関係が提示される

→上位オントロジ

上位オントロジとは
  1. 主述の関係を様々な事物の概念・性質・意味を定義する
  2. 世界に存在する様々な概念・事物・情報を対象として、その体系化を目指す
  3. 汎用性をめざし、再利用可能な共有化された知識とする
  4. 一定の規則の基づいたルール・言語で記述する
本研究の課題
  1. 主述の関係を(筆者補足:用いて?)様々な事物の概念・性質・意味を定義する
  2. 資料の内容上(筆者補足:資料世界、資料に記述されたもののこと)に存在する様々な概念・事物・情報を対象として、その体系化を目指す
  3. 汎用性をめざし、再利用可能な共有化された知識とする
  4. 一定の規則の基づいたルール・言語で記述する(歴史情報に関した関係子の設定)
  • グリアーノ*3の上位オントロジを用いる
  • 概念・事物を12項目の第一分類項目に分類
    • ここでの「概念」「事物」とはそれぞれ「人類学といった学問、学説」「歴史上に存在したもの・人」のこと
    • a.場所空間、b.時間…k.社会(人・組織)など
    • その人が何をしたか、どういう人かを表す「主要関係子」
文化資源統合アーカイブ(非公開)
  • http://cr-arch.chi.iii.u-tokyo.ac.jp/
    • 主なコンテンツ例:坪生庄五郎
    • 資料一覧、地図年表からの検索の中に、「事物つながり検索」
      • 上記の12項目のオントロジを使用した分類体系
      • 出所原則に基づいた分類
      • その他にメディア(資料媒体)、人間関係、組織
    • 課題
      • 知識体系の標準規格での表現
      • GUIベースでの情報知識編集

3.社会情報研究資料センターDigital Cultural Heritageの構築

  • 坪生庄五郎、小野秀雄、プロパガンダ関係資料
    • 研究室外の大学院所蔵資料も対象になった
  • トピックマップでの表現
  • GUIベースでの情報知識編集
トピックマップとは*4 *5
  • 情報・知識を分類、体系化し見つけやすくするための技術
  • 問題領域における主題、主題間の関係、及び情報リソースとしての関係とトピック(Topic)、関連(Association)、および出現(Occurrence)という構成他所でモデル化してコンピュータ処理可能にする
  • 主題を同定/識別するためにPSI(Published Subject Identifier)と呼ばれる仕組みをもつ
  • IRIが指し示すアドレスに置かれ、主題が何を意味しているのか人が理解できるように記述した情報リソースはPublished Subject IdentifierまたはPSD(Published Subject Descriptor)と呼ばれる
  • リッチな表現と外部出力

http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:TopicMapKeyConcepts2.PNG

4.まとめ

  • 皇族・貴族の典拠データベース
    • エクスポートしてDigital Cultural Heritageに使用することも
  • 課題(2005-2011)
    • 世の中に存在する様々な事物概念を体系化
    • 各資料を事物・概念体系に関連させる
    • 各自物概念同士の関係を定義する
    • 様々な事物・概念体系の観点から資料を見る
    • 知識体系を標準規格で体系化する
    • 知識体系をGUIなどを用いて編集する
  • 結果と課題
    • 上記の課題へのアプローチは概ね完了した
    • 公開と実証そすすめる
    • すでに1のシステムで構築した知識体系を変換し、ツールはトピックマップの小規模追加、修正、関係の追加にとどまっている
    • 完成したツールを用いて、規模の大きい知識体系の構築と実証が必要である

フロアより

  • FreeMindなどのマインドマップは参考にしたか
    • yes.関係付けをFreeMindのようにできたらと思っている
  • オープンソース化、ツール化
    • 将来的には(業者と開発しているので著作権が東大にあるという訳ではないようです)
  • どんなユーザを想定しているのか、研究者?スタッフ?
    • 資料の知識・経験のあるスタッフ。一般ユーザに情報を提供する立場の人
  • そのような人は研究者だったりすることもある
    • 自分の研究のためにトピックマップを作成して…という事例がありうるか
  • プロパガンダ資料について
    • この資料は研究途上だが、固有名詞に絞りつつある
  • ポストグレス?
    • yes

自分の頭に浮かんだこと

  • あのひと検索スパイシーがパッと浮かんだ
    • 時間軸でトピックマップを見ることはできるのだろうか
  • 本旨と少し離れるが、著者名典拠情報への話も聞いてみたい

*1:http://www.asahi-net.or.jp/~zi9n-tgy/

*2:http://artscape.jp/study/digital-achive/1206583_1958.html 東京大学 研谷紀夫氏に聞く:『デジタルアーカイブにおける「資料基盤」統合化モデルの研究』出版について:デジタルアーカイブスタディ|美術館・アート情報 artscape(accessed2012/1/28)

*3:http://www.loa.istc.cnr.it/guarino.html Nicola Guarino(accessed2012/1/28)

*4:http://ja.wikipedia.org/wiki/%E3%83%88%E3%83%94%E3%83%83%E3%82%AF%E3%83%9E%E3%83%83%E3%83%97 トピックマップ - Wikipedia(accessed2012/1/28)

*5:Linked Dataのひとつ?応用?という理解をしたのですが、Linked Dataへの言及はなかった気も