klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

FRBRからLRMへ:書誌情報にかかわる新たな概念モデルについて

2018年4月28日@大阪学院大学
14:30‐17:00
発表:和中幹雄氏(大阪学院大学
月例研究会案内(情報組織化研究グループ)

この手のお話に全く追いついておらず、LRM(IFLA Library Reference Model)の話はほぼ初見。3月に公開された「カレントアウェアネス」(CA1923)を補足する発表だった。字数制限で書けなかった点、具体例や各実体、属性、関連の定義のお話が中心だった。
紹介された文献(日本語で読めるもの)は以下の3つ。

CA1923 - 動向レビュー:IFLA Library Reference Modelの概要 / 和中幹雄 | カレントアウェアネス・ポータル

和中幹雄. FRBR-LRM(FRBR, FRAD, FRSADの統合案)の概要メモ. 資料組織化研究‐e. No.69(2016.10) p. 27-41.
http://techser.info/wp-content/uploads/2016/10/69-20161027-3-PB.pdf

千葉孝一. FRBR再考. 資料組織化研究‐e. 資料組織化研究‐e. No.69(2016.10) p. 1-17.
http://techser.info/wp-content/uploads/2017/04/FRBR__0416.pdf

原典は下記から
IFLA -- IFLA Library Reference Model (LRM)

カレントアウェアネスをはじめ、文献で説明されている箇所は重複するので、気になった部分やよくわからなからなかったところだけメモ。

歴史的な経緯

(1)FRBRのバージョンアップ
1998年に誕生したFRBRは想像以上に広がって、2009年にFRAD(著者名典拠)や2010年にFRSAD(件名や分類)が発表されている。
誕生から20年を経て、セマンティックウェブを前提とする現代において、その定義のあいまいさや、FRADとFRSADとの間に生じる用語のずれモデル同士の異同を解消するための新モデル=LRMという立ち位置。
ちなみに、FRBRにもとづいたRADであるが、LRMに対応するためのtool kitを公開予定である。新NCRも何かしら影響されるのだろうか…?

(2)その名称から「FRBR」がなくなり、むしろFRBRから一度なくなった「Library」が復活した
(図書館)外とつながるために外を意識したモデルであった(という私の理解)FRBRに対して、LRMは(図書館とは)違うモデルとの相互運用性を担保するために(図書館側からの)姿勢を示すことを目的にしている、というお話であった。
それの表れとしてOMR(Open Metadata Registry)の名前空間に登録されている、FRBR(FRBRer)、FRAD、FRSAD、LRM、FRBRoo(object orientated。博物館と図書館の統合モデル)の各クラス数、プロパティ数、総エレメント数を比較すると、LRMはずいぶん少なくなる、と予想される(カレントアウェアネスの表1)。
むしろ、FRBRooやPRESSoo(逐次刊行物の概念モデル。LRMは逐次刊行物についてはこちらに任せているのでLRMでは逐次刊行物の部分はシンプル)などほかのコミュニティとの調整を意識しているらしい。ところで、FRBRooは「FRBR」という文字が入っているが、まったくのほかのコミュニティというポジションなのだろうか…?FRBR→LRMになることで、FRBRooの名前はそのままなのだろうか…?

内容のはなし

(3)概念モデルの仕様書により近い形
ID、Name、Definition、Constrainsts、Scope Note、そしてExamplesという表形式ですべて表現されている。FRBRが記述で表現されているがゆえに、これらが混在していてわかりにくくなっていた点を解消しようとしている。機械処理を前提としている。

(4)実体の階層化

  • Res
    • Work
    • Expression
    • Manifestation
    • Item
    • Agent
      • Person
      • Collective agent
    • Nomen
    • Place
    • Time-span

たとえば、Agentの定義は下位(PersonとCollective agent)にあてはまり、それぞれ定義を繰り返さない

(5)LRMで新しく登場する実体

  • Res
    • ラテン語でthing
    • LRMがとりあつかう世界の書誌情報における「ありとあらゆるもの」
  • Agent
    • 個人・団体・家族だったもの
    • LRMからは架空の人物はAgentから外れる。これによりRADにも影響する
      • 和中先生いわく、議論はあったがわりとあっさりと通った、そう。
  • Nomen
    • 実体と実体を指し示す名称との関連
    • Linked Data仕様
立ち位置

(6)属性より関連重視
電子な世界において、ManifestationやItem、その属性よりも、WorkやExpressionで紐づけられることが重要になる。
質疑応答で言及された「ハブとしてのLRM」

(7)エンドユーザに焦点
いわゆる図書館内部プロセスに必要な「管理データ」や図書館員固有のタスクであるJsitifyが対象外になる

概念モデルを輸入すること

(8)北米とヨーロッパ中心
策定者であるIFLA FRBR Review Groupは有志の研究者グループ。そこにアジア勢は中国から1人

(9)翻訳と概念の理解のすれ違いの困難さ
Personを個人と訳すのか、問題。ダブリンコアをはじめとするほかのメタデータスキーマとの兼ね合いもあり、また翻訳すること自体が、概念モデルと微妙にずれてしまう危険性をはらむ。考え方を英語名にして定義だけ日本語にしたらいいのか?とはいえ、読むハードルは英語だと高くなりがち。

E-book usage: counting the challenges and opportunities

しばらく何も書いていなかったので、最近読んだものをメモしておく。
電子リソースとかその統計とかについて、関わる機会のなかで「E-BOOKは課題」ということを何度も耳にしていた。

スタートは2年前のE-BOOKフォーラムの報告書。
JUSP ebook forum(2016-07)
http://jusp.jisc.ac.uk/news/JUSP-ebook-discussion-forum-report-20160714.pdf

その1年後にフォーラム後の動きとして、課題と展望について発表された。もしかすると、またそのうち、続報が来るかもしれない。
insights.uksg.org

E-BOOKの利用統計については、EJとは違う課題もある。たとえば購入スタイルについて、DDA(demand-driven acquisition)、PDA(patron-driven acquisition)EBA(evidence-based aquisition)のように利用統計にもとづいて購入方法はE-BOOKに特徴的である。

また、複数のアグリゲーターやパッケージで提供される点もあげられる(High Wireとかあるけど)。異なるプラットフォームをまたがってタイトル単位の利用統計を集計しようとすると、ISBNが付与さられていなかったり、付与されていても各アグリゲーターメタデータが不充分であることでうまく集計できなくなるという。執筆者が収集したいくつか事例が紹介されていたが、のExcelのVLOOKUPを使うような素朴な?方法をとっている館も多いという。共通のIDについての取り組みとして、NBK(National Bibliographic Knowledgebase)というものが紹介された。

https://www.jisc.ac.uk/rd/projects/national-bibliographic-knowledgebase

英・Jisc、コレクション管理や発見可能性の改善を目的とした“National Bibliographic Knowledgebase”の開発を開始 | カレントアウェアネス・ポータル

いわく、KBARTⅡではE-BOOKの正確なメタデータの重要性は認識しており、KB+(ジャーナル)とあわせて電子リソース整備のナショナルレベルの二本柱だそう。カレントアウェアネス-Rでも言及されているように、GOKbと共にパッケージを越えたE-BOOKのをプラットフォームを目指すという。GOKbと違って、なぜKB+とは別に作ったのだろう??

COUNTERに関してはRelease5がひかえているが、現行のBR1(月別・タイトル別タイトルリクエスト成功件数)とBR2(月別・タイトル別セクションへのリクエスト成功件数)との間に互換性がないことが解決事項として指摘されている。また「いま、読めているコンテンツ」が、買い切り・購読・unowned(訳語がわからない…)なのかを見分けられないと、 見直しに活用するには不十分である。反対にサービスの質維持のために「いま、読めていないコンテンツ」が、非購読だからなのか切り替え忘れなのかも重要な情報である。もっとも「使えるはずのコンテンツをもれなく提供しているか」というチェック機能を十分なものにするには、購読管理や予算管理の業務と利用統計がお互いに参照可能な状態になっていないと難しいのであるが。いずれにしても、IDが不十分であるのはE-BOOK管理の上で課題であるということが何度も繰り返されている。

ここで、コンソーシアム/各機関であれ、購入/中止であれ、利用統計の動機にあるのは「いかに予算を効率的にE-BOOKに使うか」という視点である。Webサービスへの活用とか、予算の振り分け(APCに使うとか?)に利用しているところもあるのだろうけど、総論として紹介されるのは、decision-makingを支援する、ということである。ミクロな観点からだと他の動機もあるのかもしれないけど…

機関リポジトリと識別子

気になることを調べる短記事シリーズ~リハビリ編~

ふと、複数の機関リポジトリ、あるいは機関リポジトリと出版社サイトというように複数のサーバから論文が公開されることの問題ってなんだろと考えて、ひとつは利用統計がばらけること?と思った。そして、それって論文の識別子のもとに集計できればいいのでは?とも思った。

もうひとつPost-printは出版社版と原則は同じ内容だけど、"違う"ものだから機関リポジトリのコンテンツに、DOIを付与できない(ここでいうDOIは学位論文とか紀要論文に対して、機関リポジトリが付与するDOIではなくて、出版社版のDOI)。

つまり、Post-printを認める出版社はその条件として、自社サイトへのリンクを挙げることが多いが、それは「機関リポジトリのコンテンツと出版社サイトで公開されているコンテンツが同一である」ということを示すのではなく、「Post-printはあくまで出版社版への補助(というべきかなんと言うべきか)」だからDOIをURIを記述することが求められているのだろう。たとえば

Furthermore, the author may only post his/her version provided acknowledgement is given to the original source of publication and a link is inserted to the published article on Springer's website.

www.springer.com

最初の疑問に立ち返って、IRのメタデータに「DOI」という項目を持っていれば、Post-printと出版社版をつなぐことは可能なのだろうか、つまり、出版社サイトとアグリゲーターの利用統計に、機関リポジトリ(Post-print)も加えて「この論文のトータル◯件利用されました」と計算することはできるのだろうか?機関リポジトリだけでなく、Figshareや ResearchGateでもDOIを取得することができるが、それらと出版社版との関係を示す項目は無いのだろうか?

あるいは、ORCIDなどの著者識別子のもとに著者ごとの研究成果一覧を集計すること…は機関リポジトリの取り組みとしてはすでにあるようだ。

IRUS-UK and ORCIDs | Jisc scholarly communications

これはIRUS-UK(英国内の機関リポジトリの利用統計アグリゲーターサービス)におけるORCIDとの取組事例。
研究者DBとしての側面をIRが持つとすると著者名典拠管理のキーとしてORCIDを使っている、らしい。

COUNTER Code of Practice Release 5 Draft

かえってきた気になったことを調べる短記事シリーズ。

2017年1月付でCOUNTER Code of Practice Release 5(以下、Release5)のドラフト版が公開された。

docs.google.com

COUNTER実務指針第5版草案公開 フィードバック受け付け中 | カレントアウェアネス・ポータル


Release4からの変更点や主な特徴をまとめたイントロダクションを中心に見ていく。

www.projectcounter.org

特徴的に現れるのはレポートである。Release4までは36種あったレポートは11種までに簡略化された。
その代わりに、Data_Type、Access_Type、Is_Archive、Metric_Type、Section_Type…等々といった「type」によって、状況に応じた定義がされるようになった。

Data_Typeは、対象の種別を定義する。これによりレポートの大枠が決まる。

  • Book
  • Database
  • Dataset
  • Journal
  • Multimedia
  • Platform
  • RepositoryItem

たとえば、Platformの場合、レポートは「Platform Report 1」か「Expanded Platform Report」のいずれかである。

Access_Typeは、対象へのアクセス方法を定義する。これにより、例えば講読誌とオープンアクセス誌を区別することができる

  • Controlled
  • OA_Delayed
  • OA_Gold_APC
  • OA_Gold_Non_APC
  • Other_Free_to_Read

Is_Archiveはその名のとおり、バックファイルかカレントかを定義する。

Metric_Typeは、Release4では25種あったが、Release5では12種に簡略化された。どう訳したら良いのか分からないのだけど、itemに対しては「investigations」「requests」「no_license」「limit_exceeded」で、DatabaseとPlatformに対しては「searches」で定義されている。たとえば、「unique_item_requests」は、同一セッションにおいて、記事をPDFやHTMLで閲覧するためにリクエストされた回数をカウントする。「unique_item_investigations」は、あるセッションのなかで、フルテキストを閲覧するためにクリックされた回数をカウントする。

Release5では、章・節レベルをSection_Typeで定義する。

  • Article
  • Book
  • Chapter
  • Section

その他のtypeとの組み合わせで、Release4で主に資料種別で定義されたレポートが、簡略化されつつも、様々な利用状況(電子ブックの1章の利用統計のカウント、等)に応じたレポートが可能となった。

これまでタイトルレベルのみであったが、Release5によってJournalやBookに収録されるArticleレベルの利用統計も取れるようになったことは大きいのかなぁと思う。

英訳と理解があやふや(特にMetric_Type)なので、気がついたら随時、修正します。

「日本目録規則(NCR)2018年版」(仮称)関西検討集会

日時:2017年3月5日 12:30-16:30
会場:大阪市立中央図書館 5階大会議室
内容:

  1. NCR2018年版の概要(渡邉隆広 目録委員長)
  2. 条文案各章の概要
    1. 体現形・個別資料の属性(野美山千重子委員 トーハン図書館事業部)
    2. 著作・体現形の属性とアクセスポイント(木下直委員 東京大学
    3. 個人・家族・団体の属性(河野江津子委員 慶應義塾大学
    4. 関連の記録(村上遥委員 東京外国語大学
    5. データ事例(田代篤史委員 国立国会図書館
  3. 「新NCRへの期待と要望」和中幹雄氏(情報組織化研究グループ)
  4. 質疑・討議


NCR2018年版(仮称)


改めてタイトルを見ると、字面が重々しいですね。
というのも「目録」というワードが残ったのが意外なような、そうでもないような、NCR2018(仮称)。
記録担当の方々がきっちり記録されていたので、そのうちちゃんとしたものが公開されそうですが、個人の日記として頭を整理するために書き残しておく。

日本図書館協会目録委員会と国立国会図書館収集書誌部での検討の成果として、2017年2月に発表されたNCR2018(仮称)について、ウェブサイトを通じた情報公開・パブリックコメントの募集も行われているが、集会というかたちで直接に説明や質疑ができる機会をということでお邪魔してきた。まずは、渡邉委員長から概要と今後のスケジュールが説明された。

2017.5 東京集会
2017.7まで パブリックコメント募集
2018.3 PDF(完成版)を公開⇒冊子体でも刊行

となっている。これから1年かけて完成へと向かう。パリ原則とISBDにもとづいたNCR1987年版から30年、FRBR(1997)から20年、RDA(2010)から7年。Web環境に適するために、NCR2018年版はRDAに倣ったものへと大幅な改訂がされる。これらの特徴は大きく13点挙げられる。

  1. FRBR等の概念モデル
  2. 典拠コントロール位置づけ
    1. 著作を個人を独立した実体⇔従来は標目参照のみ
  3. 全著作の典拠コントロール
  4. 内容的側面(著作・表現型)と物理的側面(体現形・個別資料)の整理
  5. 関連の記録
  6. 書誌階層構造
    1. NCR87を維持(ただし書誌単位は廃止)
  7. エレメントの設定
    1. 全てエレメント⇔従来はエリアの中にエレメント
  8. 語彙のリスト
  9. 意味的側面(エレメントの記録の範囲と方法)のみを扱い、構文的側面(記録方法、記述文法)は扱わない
  10. 機会可読性の向上
  11. アクセス・ポイントの言語・文字種と読み、排列
    1. 日本語は漢字仮名まじり形、排列の規定は設けない
  12. RDAとの互換性
  13. NCR1987との継続性


抽象度の高めなワードが飛び交うため、用語集へ期待や翻訳の精緻さが求められる場面が多いように感じた。配布資料には用語集と索引があったので、完成版にむけた用語集にも期待したい。

規則の構成はFRBRの実体の沿ったものとなっている。なお、RDAでも未刊である箇所はNCR2018でも保留となっており、目次がすべて揃う訳ではないそう。

キーワードは、実体、属性、アクセス・ポイント、関連。これを噛み砕きつつ、集会の概要を記録していく。

実体というのはFRBRの概念の一つであるが、書誌情報において重要と思われる概念を指す。具体的には、著作・表現形・体現形・個別資料、個人・団体・家族、概念・物・出来事・場所である。これらの実体間がどのような関係になっているのかを示すのが関連。


https://upload.wikimedia.org/wikipedia/commons/8/80/FRBR-Group-1-entities-and-basic-relations.svg

この有名な図にある楕円が実態、矢印が関連である。

目録を利用するユーザ(この場合は図書館員や利用者のみならず、もっと広い意味でのユーザである)にとって、もっとも重要な実体が、体現形である*1。これは従来の目録をとる対象とほぼ同義。この体現形の中身に相当するのが属性である。属性を表すものがエレメントと呼ばれる。

体現形の属性を表すエレメントには、タイトルや責任表示、出版表示などがある。これらのエレメントはすべて同等というわけではなく、コアエレメント(必須)が定められていたり、エレメント・サブタイプ(例:本タイトルに対する並列タイトル)サブエレメント(例:出版表示における出版地や出版者)といった階層を有したりする。

RDAにそっているとは言え、日本語独自の問題(ヨミや併記された語句など)に対する処理などもあわせて紹介された。体現形の属性で特徴的な点として、タイトルと責任表示が別のエレメントとして扱われている点があげられる。しかしながら、本タイトルと責任表示が何度も繰り返されるような資料に対して、エレメント同士の関係を何かしら記述する文法がなければ(記述文法は規則の外であるが)ならないので、規則と同時に文法も同時並行していく必要がある。また、NCR1987との比較で言及されたのは、版表示と版次について。前者が「版に関する事項」、後者が「NCR1987の版表示」に該当する(ややこしい…)

もうひとつ、体現形の属性において特徴的なのは、資料種別ではなくエレメントごとにまとまっている点である。図書か雑誌かその他かによってエレメントが変わらない。これはキャリア種別を重要視しないという訳ではなく、むしろキャリアを表す粒度を細かくした結果である。キャリアは機器種別とキャリア種別との組み合わせによって表現される。従来、別レベルのものを一緒にしていたため、CD-ROMの地図資料が地図だとは分からないという不具合があった。NCR2018では、例えばCD-ROMの地図資料だと

(表現種別:静止画)、機器種別:コンピュータ、キャリア種別:コンピュータ・ディスク

となる。機器種別とキャリア種別は原則、1対1対応であるが、例外もあり。おそらくこのままユーザに提示してもなんのことかわかりにくくなる(例えば、絵本だと「表現種別:静止画、機器種別:機器不要、キャリア種別:冊子」)。図書館システム側で何かしらの工夫が必要だろうということだった。つまり、目録画面で「絵本」を選ぶと、自動的に各種別にセットするといった工夫が求められる。

体現形と個別資料と異なり、実態(実体ではなく)や従来の目録業務を応用して理解できる一方、著作と表現形を識別の対象ととらえる考え方は新しい。属性をエレメントで表す点は体現形と一緒である。著作については統一タイトルの標目というアナロジーでなんとなく理解できる。優先タイトルや著作の形式、日付などは統制形アクセス・ポイントに含まれ、著作の識別に用いられる。

表現形の属性やアクセス・ポイントというのがイメージしにくいが、表現種別(テキスト、静止画、楽譜、地図…等々)や日付や言語が統制形アクセス・ポイントとして、これをキーとして表現形の典拠コントロールに用いられる。一方で、表現形の識別子や出典などはアクセス・ポイントには含まれないが、表現形の典拠コントロールには用いられる。

著作・表現形・体現形・個別資料が第一の実体とすると、個人・家族・団体は、第一の実体を作る、行為者としての主体を表す第二の実体である。これらの属性も同様にエレメントを用いて表される。個人・家族・団体の優先名称は個人に対する典拠形アクセス・ポイントの基礎となる。ちなみにフロアからの質疑でこの「家族」に対してアーカイブの文脈では、familyの訳語としてふさわしくないという指摘もあった。それなら「ファミリー」ならいいのかとも思うが、一方で訳語がはまりきらなかった「イテレーション」(更新資料におけるある時点での状態)について、別の参加者から原語そのままなのはわかりにくいという指摘もあった。

話を個人・家族・団体に戻すと、団体の下部組織、附属機関の名称のみを優先名称とする点は、NCR1987と大きく異なる。また、共著について、各作成者を表す典拠形アクセス・ポイントとし、主要な作成者を選ぶのは別法としているが、RDAではこちらの方が本則として採用されている。このように各所でローカライズもされている。

最後のキーワードとして、関連。著作・表現形・体現形・個別資料をまとめて「資料」*2と呼ぶ。資料同士、あるいは資料と個人・家族・団体との関連は、主として識別子と典拠形アクセス・ポイントで表すことができる。

この資料についての関連もエレメントが設けられている。著作←表現形←体現形、著作←体現形の3つがコアエレメントである。記録の範囲は、派生、参照、全体・部分、付属・付加、連続、等価の関係を表現する。基本的には識別子と典拠形アクセス・ポイントで記録するが、継続誌や合本などは複合記述、構造記述、非構造記述でも表すことができる。例えば

  1. 継続後(著作):◯◯ジャーナル
  2. 『◆◆◆』(2006年刊)の改題・合本・加筆・再編集である。

上記1が構造記述、2が非構造記述に相当する。

構造記述での「継続後(著作)」は決まった語彙が存在する。それを関連指示子と呼ばれ、リスト化されている。関連指示子は階層化されている。また、適当な語彙がない場合、目録作成機関の判断でリスト外から語彙を採用しても良い。

資料と個人・家族・団体との関連でも関連指示子の細かいリストが用意されている。ただし、映画などはどこまでかけばいいのか、運用の実態が見えていないというのもまた然りである。

規則の段階なので運用までイメージしにくいのは最もであるが、実際には運用していくために、実際の運用を想定すると様々な課題も多い。表現形の典拠コントロールについて、範囲や詳細度が(表現種別、言語、その他?)分からない、たとえば翻訳者別に全てを典拠コントロールする必要はあるのか?という課題が残されたままである。

目録委員からの発表に続いて、和中氏から、規則への期待・要件、それにもとづく修正案が提示された。かいつまんでまとめると、書誌データに社会性をもたせること(MLAの外側)、論理的でない部分は分かりにくくなっているということだった。Creator訳語(作成者ではなく創作者)、「片仮名形」「漢字かなまじり形」「漢字形」ではなく、優先言語で表現する、ヨミのエレメント化およびオプション化、優先名称の言語(日本語か原綴か)は運用で決めたらいいのでは、姓名の区切りカンマの廃止(名姓のときのみ使用)、FRBR-LRMへの対応、NDL Web Authoritiesの共同作成などが提案された。個人的にはこの日唯一、NIIの名前を聞いたのがここだったのが印象に残った。

感想3点。1.規則である以上、定義、範囲、意味内容などの精緻さが求められるんだなぁとあらためて。2.オンライン資料の手薄さが指摘されたが個人的にはNCR2018では扱いきれる範囲ではないのかも…という気もした。ただ、だからオンライン資料のメタデータは考えないという訳ではなく、Dublin CoreとかDOIとかKBARTとか?と一緒の土俵に上る必要はあるのだとは思う。3.主要MARC3つは多いのかもしれない。。でも専門性が高い機関ではMARCでは物足りないのかもしれない。

*1:和古書・漢籍、初期印刷資料は個別資料を記述対象として、体現形の記述を作成

*2:この「資料」という訳語に対する違和感も指摘された。

CRIS (Current Research Information System)

気になったキーワードを調べる短記事シリーズ。

CRIS (Current Research Information System)について、なんとなく「研究者情報データベースでかつ、色々とできるもの」というぼんやりとした理解しかしていなかったので、あらためて文献を読み直してみた。

英語版のWikipediaによると

A current research information system (CRIS) is a database or other information system to store and manage data about research conducted at an institution


Current research information system - Wikipedia

現役の各研究者の業績、その他の情報を収集・管理するためツール、と定義してある。
カレントアウェアネス・ポータルで確認できたなかで初登場は2013年。

Elsevier社がニュースレターで研究データ管理特集 | カレントアウェアネス・ポータル

機関リポジトリとの相互運用性の文脈で語られることが多いなという印象。相互運用には程遠かったけど、機関リポジトリの担当だった頃(2010-2011)に自学の研究者DBにリポジトリへのリンクを貼っていたなぁというぼんやりとした思い出。
その後も、オープンアクセスリポジトリ連合(COAR)とeuroCRISCRISの提携、と機関リポジトリは両輪のような展開を遂げ、2017.2.11現在のカレントで確認できた最新記事(2016.4のもの)も

E1791 - 欧州におけるCRISと機関リポジトリの連携の現状 | カレントアウェアネス・ポータル


ところで「Current Research Information System」とGoogleで検索した時に、最初にランクしているのがWikipediaの記事ではあるが、何個か下にFree UKSG webinarもヒットする。

www.slideshare.net

ここを読むと「Wikipediaでは物足りない!」と。スライドを私が理解できた範囲ではキーワードは「Integration」なのかと感じた。スライド中に何度もこの単語は登場する。研究情報は研究者自身の履歴書であり、業績であり同時にその研究分野や大学そのものの履歴書かつ業績でもある。そしてこのさまざまな研究情報を統合したり、かつ機関リポジトリやORCIDなどの他のシステムと連携することで、CRISがユーザの価値を高めていく。ここでの価値とは、研究者のマッチングや業績評価のための分析として有用であるという意味である。

CRISの必要性について、euroCRISのAboutに詳細に記されている。

Why does one need a CRIS? | euroCRIS

いくつかの文献によると、CRISは1960年代に研究管理のために登場*1*2とあった。

1980年代にはプロトタイプシステムでCRISの相互運用が始まり、それが後にCERIF (Common European Research Information Format)へと発展した。CERIFが何かのかというとうまく説明できないが、どうやらCRISの相互運用性を技術的に担保するモデル、のようだ。2002年、CERIFの開発・管理のためにeuroCRISが登場し、この年から毎年、Conferences on Current Research Information Systemが開催されている。

euroCRISのように非営利組織によるCRISもあればElsevierのPureのような製品も存在する。

www.elsevier.com

Pureの導入大学を見ていると「Research information system (RIS)」という表記を見かけることがあり、Currentの有無はどこで別れるのだろう?と不思議だった。そして今も解決していない…

Wageningen UR replaces Metis with Pure - WUR

*1:Jeffery, K. G., A. Asserson, and D. Luzi. "State of the Art and Roadmap for Current Research Information Systems and Repositories. euroCRIS White Paper." (2010). http://www.irpps.cnr.it/it/system/files/PositionPaperRoadMap20100610.doc

*2:Scholze, Frank, and Jan Maier. "Establishing a research information system as part of an integrated approach to information management: best practice at the Karlsruhe Institute of Technology (KIT)." Liber Quarterly 21.2 (2012). http://doi.org/10.18352/lq.8019

学術コミュニケーションと大学図書館の予想される未来(第18回図書館総合展)

日時:2016年11月09日 (水)
場所:パシフィコ横浜
登壇者:
Neil Jacobs(JISC)
深貝保則 (横浜国立大学教授)
コーディネーター :
佐藤義則 東北学院大学教授
土屋 俊 大学改革支援・学位授与機構教授

www.libraryfair.jp

そのうちに資料などがアップされるであろうから、簡単にメモしておく。

7年ぶり2度目の図書館総合展。別の仕事が入っており、途中下車をしてきた。滞在時間4時間だったので、資料が欲しかった業者さんのブースと、自分のところのポスターを見て、フォーラムに参加してあっという間だった。

到着して早々に久しぶりな方にお会い出来たり、メールを通じてさんざんお世話になった人に偶然にもご挨拶できたり、たまたま隣に座った方が同じ某事業に参加する人だったり。

フォーラムを聞いて感じたことを3つ。

  1. offsettingってはじめて知った
  2. プラットフォーム合戦がOAの世界にも起こっている(より強力なプラットフォームを持ったところが勝ち)のか?
  3. 「信頼(trust)」ということ

順を追ってメモを書き出しておく。
最初に佐藤先生からRichard Poynderに代わって、彼のクリフォード・リンチとの対談記事について紹介された。

poynder.blogspot.jp

各見出しはこのようになっている。

  • Disappointment
  • Conundrum
  • Where next?
  • Resistance
  • Third-time lucky
  • The interview with Clifford Lynch


「Disappointment(失望)」からはじまって、どういうことだろう?と思っていたが、失望というのはOMI-PMHもIR(機関リポジトリ)も、当初のその目的を達成することができなかったということらしい。それはコンテンツのarticleの割合が増えないことなどが挙げられる。IRの目的や意義について様々な人が言及している。たとえばリンチが2003年時点ですでに、通常の出版で扱わないもの(研究データなど)に言及した一方で、IRを新たな学重情報流通の中核を担うものとして期待する声もあった。しかしながら、IRは出版のオルタナティブになりえなかった。さらに巨大なゴールドOAの登場、AtyponをWileyが、SSRNをElsevierが買収、Elsevierとフロリダ大学がIRについてパートナーシップを結ぶことに成功、という新たな局面も迎えている。

出版社にとってグリーンOAやIRって儲かるもの(というと語弊があるが)なんだ!?というのが最初の感想、すこし時間がたってプラットフォームは大事だから、どう主導権を握るのかというのは鍵になるのだろうか?というのが今の感想。

ぼんやりと、先日テレビでみた番組を思い出していた。ここで登場する企業は特殊すぎるけど。

日本の場合は言語の問題や紀要などが、違う要因として組み込まれるのかなぁと。そもそも日本語コンテンツの相対的な重要度も変化していくだろうし。

個人的には全文クロールとメタデータについて興味を惹かれた。OAI-PMHがメタデータのみをハーベストしていたのは、容量もしくは技術的な問題だったのだろうか?メタデータと全文に重要度などの差をつけると面白そうだなぁと思った。

つづいて、Neil Jacobs氏の講演。通訳、お疲れ様でした。個人的な話だが「あの時の話がここに繋がった」わかりやすく聞けました。
イギリスのOA(セルフアーカイブ含む)を推し進める最大の要因は、助成団体のポリシー、これにつきると思う。主要な団体としてRCUKとHEFCEがあり、それぞれが助成する基準としてOAを謳っている。RCUKはGOld推し、HEFCEはGreen推しという違いはあれどOAポリシーが研究者のOAを促進している。助成団体のみならず各機関や大学もOAポリシーをもっていることが多く、JISCはそれぞれのポリシーやOAを進める上でのワークフローに齟齬がでないようなサービスを提供している。

www.jisc.ac.uk

この度のフォーラムではじめてoffsettingを知った。これはつまり、購読+APCをセットで支払うというもの。たとえば、Springer Compactがこれに該当する。

Offsetting models: update on the Springer Compact deal | Jisc scholarly communications

これでコストが減る理由がピンときていないのだけど、ハイブリッド誌において、購読とAPCをバラバラ払う(しかもAPCは著者からそれぞれ支払う)よりも電子リソース周りのコストが把握しやすくなる⇒それによる合理化?という理解をしている。
JISCとしてはこのoffsettingを過渡期として推進することで、コスト削減を目指しているよう。offsettingにおける原則のなかで「バウチャーではなくキャッシュで」という点が挙げられており、講演後になぜですか?とNeilさんにお聞きすると「バウチャーは期限があるから」という回答をいただいた。その時は「あーなるほど」と思っていたが、期限がなければOKな話なのかな?という新たな疑問も。通貨(キャッシュ)以外にコストを計算する要因は少ないようがいいからなのかな。(バウチャー管理はそれはそれで大変そう)

後半は研究データについて。FAIRというフレームワークにのっとり、英国におけるポリシーが策定されている。

www.jisc.ac.uk

さらに

ec.europa.eu

ポリシーにつづいて、研究データおよびオープンサイエンスに関する実装(implementation)について紹介された。
ポリシーがその底辺を支えるものとして、計画から引用までを網羅する図が示された。

Jisc RDM shared service pilot

お話のなかで何度が「trust」という単語が出てきた(たぶん)。信頼できるリポジトリ、信頼できるデータを担保するために、それらのコンテンツがどういう背景で作成され、収集され、公開されたのかを示す必要があるという。そのためのポリシーであり、フレームワークであり、スキーマであり…等々。信頼性というのは科学の営みそのものであり(という理解)、それを担保するためにここまでの枠組みを用意する必要があるのだなぁ…と。