klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

情報組織化研究グループ6月例研究会「デジタル化資料のデータベース(NDL,HathiTrust等)と連携した検索環境整備」

日時:2014年6月14日(土) 14:30~17:00
会場:大阪学院大学
発表者:大西賢人氏京都大学附属図書館)、鳥谷和世氏(神戸大学附属図書館)、柴田育子氏(一橋大学附属図書館)
国立情報学研究所教育研修事業 平成25年度学術情報システム総合ワークショップ成果物
http://www.nii.ac.jp/hrd/ja/ciws/report/h25/index.html

平成25年度の学術情報システム総合ワークショップでも研究成果発表。
教育研修事業 - 学術情報システム総合ワークショップ - カリキュラム- 平成25年度

最終報告は、上記ウェブサイトに掲載。その他、 ku-librarians: 図書系職員勉強会の記録も
2014-04-18 - 勉強会の予定・記録 - ku-librarians: 図書系職員勉強会

資料はウェブサイトに掲載済みなので、簡単にまとめと記録+αを。

  • テーマ:デジタル化資料のデータベース(NDLサーチ, HathiTrust等)と連携した検索環境整備
  • 目標:CiNii BooksとNDLサーチ, HathiTrust等のデジタル化資料DBとの連携の可能性をさぐる
  • 調査目的:各DBがもつ識別IDをキーにしたリンクの可能性を調査


冊子体書誌とデジタル化資料がリンクしていない、そのためユーザ(利用者とサービス担当者も含め)がデジタル化資料を検索しにくい現状への解決策として、各DB間をIDでリンクさせる、そのためのIDでマップの作成(各DBがどのようなIDを使っているか)を半年かけておこなわれた。

簡潔にまとめてあるので、翻訳するまでもないが、CiNiiBooks×NDLサーチ・HathiTrustを探るための、キーとしてのID。

発表は大西氏からであったが、3人分の発表をしていただいた。テーマはそれぞれ、

  • 鳥谷:CiNii Books, NDLサーチ, NDLデジタル化資料のIDマップ作成に向けた調査/検討
  • 大西:CiNii Books, HathiTrustのIDマップ作成に向けた調査/検討
  • 柴田:CiNii Books, WorldCat(xISBN), HathiTrustのESTCの識別子を使用したIDマップ作成に向けた調査/検討

3名の調査内容を簡単に記録しておく。

JPNOを含む/含まないNC書誌データの分析(対NDL)
  • NC書誌(1968年以前)のうち、JPNO(全国書誌番号)を持つNC書誌は全体の2割
  • JPNOを持たない8割に対してタイトル部分/完全一致検索、および出版年とのAND検索で1件のみヒットしたものの同定可否
    • NC書誌から:76-88%の間で同定可能
      • 書誌作成単位が異なるため和古書は除外
    • NDL書誌から:76-97%の間で同定可能
  • NDLデジタル化資料が物理単位での書誌作成が基本のためか、1件ヒット率はNC書誌からの方が低い
  • すでにJPNOを保有するNC書誌も100%正確ではなく(流用の時に消し忘れ?)、対応するNDL書誌を網羅していない
  • ユーザからのフィードバックによる保有するJPNOの精度を評価し、反映させるしくみ

参考:

たぶん、このあたりとも密接に関係するのだろうと思う
教育研修事業 - 国立情報学研究所実務研修 - 過去の記録 - 平成24年度
質疑応答の時もIDでマップは書誌に持たせるのではなく、外部
に持つイメージをしているというお話もあった。

CiNii Books, HathiTrustのIDマップ作成に向けた調査/検討
  • HathiTrustのデジタル化資料のうち、日本からもアクセスできる(=パブリック・ドメイン)ものは3割に対して、ID分析を行う
  • 上記のHathiTrustとNC書誌のIDによる書誌同定調査
    • ISSN→N1から7(最初のN文字)までのタイトル一致による検証:9-7割の間で一致
    • ISBB→N1から7(最初のN文字)までのタイトル一致による検証:N5から8割で安定
    • LCCN*1→N1から7(最初のN文字)までのタイトル一致による検証:不一致の割合は変化なし*2
    • OCLC#*3→N1から7(最初のN文字)までのタイトル一致による検証:8-5割の間で一致
  • 同定可能な書誌数が多いLCCN。NC書誌のLCCNをどう活用するか
  • ISSN,ISBNの精度は他と比較して高い
  • タイトルと出版年のみの同定は同定率は減少するが同定可能
  • 日本語コンテンツの分析の必要
CiNii Books, WorldCat(xISBN), HathiTrustのESTCの識別子を使用したIDマップ作成に向けた調査/検討
  • NC書誌のうち、注記記述されたESTC(English Short Title Catalogue)をキーにして、HathiTrustとのリンクの検証
  • ESTCのあるNC書誌→NCタイトル→WorldCat APIを利用してOCLC#を取得→HathiTrustを検索
  • HathiTrustのメタデータがそもそもESTC#を保有していない(9%)
  • 保有していたとしても完全一致、ほぼ一致も半数を超えない
  • ESTC#をキーにしたWorldCat経由でのHathiTrustのリンクは困難

先に書いたが、IDマップは書誌に含むのではなく、外部に持ち、閲覧のみならず、目録作成、ILL業務でも汎用できる可能性を持つ。また、他のサービス(件名、DB連携、ディスカバリー)との情報提供も考えられる。

他のサービスへのリンクは大切。ユーザのフィードバックを活かせる仕組みは大切。

*1:質疑応答の際に言及があったのだが、時代によって?目録規則の改訂によって?変わっている、らしい。何がどう違うのか把握できたら追記します

*2:ここだけ検証方法が異なっていて、上がタイトルの一致のみだけであったが、出版年も検証されていた

*3:同上。こちらも時代によって変わっている、らしい