情報組織化研究グループ6月例研究会「デジタル化資料のデータベース(NDL,HathiTrust等)と連携した検索環境整備」
日時:2014年6月14日(土) 14:30~17:00
会場:大阪学院大学
発表者:大西賢人氏(京都大学附属図書館)、鳥谷和世氏(神戸大学附属図書館)、柴田育子氏(一橋大学附属図書館)
国立情報学研究所教育研修事業 平成25年度学術情報システム総合ワークショップ成果物
http://www.nii.ac.jp/hrd/ja/ciws/report/h25/index.html
平成25年度の学術情報システム総合ワークショップでも研究成果発表。
教育研修事業 - 学術情報システム総合ワークショップ - カリキュラム- 平成25年度
最終報告は、上記ウェブサイトに掲載。その他、 ku-librarians: 図書系職員勉強会の記録も
2014-04-18 - 勉強会の予定・記録 - ku-librarians: 図書系職員勉強会
資料はウェブサイトに掲載済みなので、簡単にまとめと記録+αを。
- テーマ:デジタル化資料のデータベース(NDLサーチ, HathiTrust等)と連携した検索環境整備
- 目標:CiNii BooksとNDLサーチ, HathiTrust等のデジタル化資料DBとの連携の可能性をさぐる
- 調査目的:各DBがもつ識別IDをキーにしたリンクの可能性を調査
冊子体書誌とデジタル化資料がリンクしていない、そのためユーザ(利用者とサービス担当者も含め)がデジタル化資料を検索しにくい現状への解決策として、各DB間をIDでリンクさせる、そのためのIDでマップの作成(各DBがどのようなIDを使っているか)を半年かけておこなわれた。
簡潔にまとめてあるので、翻訳するまでもないが、CiNiiBooks×NDLサーチ・HathiTrustを探るための、キーとしてのID。
発表は大西氏からであったが、3人分の発表をしていただいた。テーマはそれぞれ、
- 鳥谷:CiNii Books, NDLサーチ, NDLデジタル化資料のIDマップ作成に向けた調査/検討
- 大西:CiNii Books, HathiTrustのIDマップ作成に向けた調査/検討
- 柴田:CiNii Books, WorldCat(xISBN), HathiTrustのESTCの識別子を使用したIDマップ作成に向けた調査/検討
3名の調査内容を簡単に記録しておく。
JPNOを含む/含まないNC書誌データの分析(対NDL)
- NC書誌(1968年以前)のうち、JPNO(全国書誌番号)を持つNC書誌は全体の2割
- 90%程度の精度でNDL書誌にリンク可
- JPNOを持たない8割に対してタイトル部分/完全一致検索、および出版年とのAND検索で1件のみヒットしたものの同定可否
- NC書誌から:76-88%の間で同定可能
- 書誌作成単位が異なるため和古書は除外
- NDL書誌から:76-97%の間で同定可能
- NC書誌から:76-88%の間で同定可能
- NDLデジタル化資料が物理単位での書誌作成が基本のためか、1件ヒット率はNC書誌からの方が低い
- すでにJPNOを保有するNC書誌も100%正確ではなく(流用の時に消し忘れ?)、対応するNDL書誌を網羅していない
- ユーザからのフィードバックによる保有するJPNOの精度を評価し、反映させるしくみ
参考:
たぶん、このあたりとも密接に関係するのだろうと思う
教育研修事業 - 国立情報学研究所実務研修 - 過去の記録 - 平成24年度
質疑応答の時もIDでマップは書誌に持たせるのではなく、外部
に持つイメージをしているというお話もあった。
CiNii Books, HathiTrustのIDマップ作成に向けた調査/検討
CiNii Books, WorldCat(xISBN), HathiTrustのESTCの識別子を使用したIDマップ作成に向けた調査/検討
- NC書誌のうち、注記記述されたESTC(English Short Title Catalogue)をキーにして、HathiTrustとのリンクの検証
- ESTCのあるNC書誌→NCタイトル→WorldCat APIを利用してOCLC#を取得→HathiTrustを検索
- HathiTrustのメタデータがそもそもESTC#を保有していない(9%)
- 保有していたとしても完全一致、ほぼ一致も半数を超えない
- ESTC#をキーにしたWorldCat経由でのHathiTrustのリンクは困難
先に書いたが、IDマップは書誌に含むのではなく、外部に持ち、閲覧のみならず、目録作成、ILL業務でも汎用できる可能性を持つ。また、他のサービス(件名、DB連携、ディスカバリー)との情報提供も考えられる。
他のサービスへのリンクは大切。ユーザのフィードバックを活かせる仕組みは大切。