読者です 読者をやめる 読者になる 読者になる

klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

COUNTER Code of Practice Release 5 Draft

調べてみました 図書館

かえってきた気になったことを調べる短記事シリーズ。

2017年1月付でCOUNTER Code of Practice Release 5(以下、Release5)のドラフト版が公開された。

docs.google.com

COUNTER実務指針第5版草案公開 フィードバック受け付け中 | カレントアウェアネス・ポータル


Release4からの変更点や主な特徴をまとめたイントロダクションを中心に見ていく。

www.projectcounter.org

特徴的に現れるのはレポートである。Release4までは36種あったレポートは11種までに簡略化された。
その代わりに、Data_Type、Access_Type、Is_Archive、Metric_Type、Section_Type…等々といった「type」によって、状況に応じた定義がされるようになった。

Data_Typeは、対象の種別を定義する。これによりレポートの大枠が決まる。

  • Book
  • Database
  • Dataset
  • Journal
  • Multimedia
  • Platform
  • RepositoryItem

たとえば、Platformの場合、レポートは「Platform Report 1」か「Expanded Platform Report」のいずれかである。

Access_Typeは、対象へのアクセス方法を定義する。これにより、例えば講読誌とオープンアクセス誌を区別することができる

  • Controlled
  • OA_Delayed
  • OA_Gold_APC
  • OA_Gold_Non_APC
  • Other_Free_to_Read

Is_Archiveはその名のとおり、バックファイルかカレントかを定義する。

Metric_Typeは、Release4では25種あったが、Release5では12種に簡略化された。どう訳したら良いのか分からないのだけど、itemに対しては「investigations」「requests」「no_license」「limit_exceeded」で、DatabaseとPlatformに対しては「searches」で定義されている。たとえば、「unique_item_requests」は、同一セッションにおいて、記事をPDFやHTMLで閲覧するためにリクエストされた回数をカウントする。「unique_item_investigations」は、あるセッションのなかで、フルテキストを閲覧するためにクリックされた回数をカウントする。

Release5では、章・節レベルをSection_Typeで定義する。

  • Article
  • Book
  • Chapter
  • Section

その他のtypeとの組み合わせで、Release4で主に資料種別で定義されたレポートが、簡略化されつつも、様々な利用状況(電子ブックの1章の利用統計のカウント、等)に応じたレポートが可能となった。

これまでタイトルレベルのみであったが、Release5によってJournalやBookに収録されるArticleレベルの利用統計も取れるようになったことは大きいのかなぁと思う。

英訳と理解があやふや(特にMetric_Type)なので、気がついたら随時、修正します。

「日本目録規則(NCR)2018年版」(仮称)関西検討集会

図書館 行ってきました

日時:2017年3月5日 12:30-16:30
会場:大阪市立中央図書館 5階大会議室
内容:

  1. NCR2018年版の概要(渡邉隆広 目録委員長)
  2. 条文案各章の概要
    1. 体現形・個別資料の属性(野美山千重子委員 トーハン図書館事業部)
    2. 著作・体現形の属性とアクセスポイント(木下直委員 東京大学
    3. 個人・家族・団体の属性(河野江津子委員 慶應義塾大学
    4. 関連の記録(村上遥委員 東京外国語大学
    5. データ事例(田代篤史委員 国立国会図書館
  3. 「新NCRへの期待と要望」和中幹雄氏(情報組織化研究グループ)
  4. 質疑・討議


NCR2018年版(仮称)


改めてタイトルを見ると、字面が重々しいですね。
というのも「目録」というワードが残ったのが意外なような、そうでもないような、NCR2018(仮称)。
記録担当の方々がきっちり記録されていたので、そのうちちゃんとしたものが公開されそうですが、個人の日記として頭を整理するために書き残しておく。

日本図書館協会目録委員会と国立国会図書館収集書誌部での検討の成果として、2017年2月に発表されたNCR2018(仮称)について、ウェブサイトを通じた情報公開・パブリックコメントの募集も行われているが、集会というかたちで直接に説明や質疑ができる機会をということでお邪魔してきた。まずは、渡邉委員長から概要と今後のスケジュールが説明された。

2017.5 東京集会
2017.7まで パブリックコメント募集
2018.3 PDF(完成版)を公開⇒冊子体でも刊行

となっている。これから1年かけて完成へと向かう。パリ原則とISBDにもとづいたNCR1987年版から30年、FRBR(1997)から20年、RDA(2010)から7年。Web環境に適するために、NCR2018年版はRDAに倣ったものへと大幅な改訂がされる。これらの特徴は大きく13点挙げられる。

  1. FRBR等の概念モデル
  2. 典拠コントロール位置づけ
    1. 著作を個人を独立した実体⇔従来は標目参照のみ
  3. 全著作の典拠コントロール
  4. 内容的側面(著作・表現型)と物理的側面(体現形・個別資料)の整理
  5. 関連の記録
  6. 書誌階層構造
    1. NCR87を維持(ただし書誌単位は廃止)
  7. エレメントの設定
    1. 全てエレメント⇔従来はエリアの中にエレメント
  8. 語彙のリスト
  9. 意味的側面(エレメントの記録の範囲と方法)のみを扱い、構文的側面(記録方法、記述文法)は扱わない
  10. 機会可読性の向上
  11. アクセス・ポイントの言語・文字種と読み、排列
    1. 日本語は漢字仮名まじり形、排列の規定は設けない
  12. RDAとの互換性
  13. NCR1987との継続性


抽象度の高めなワードが飛び交うため、用語集へ期待や翻訳の精緻さが求められる場面が多いように感じた。配布資料には用語集と索引があったので、完成版にむけた用語集にも期待したい。

規則の構成はFRBRの実体の沿ったものとなっている。なお、RDAでも未刊である箇所はNCR2018でも保留となっており、目次がすべて揃う訳ではないそう。

キーワードは、実体、属性、アクセス・ポイント、関連。これを噛み砕きつつ、集会の概要を記録していく。

実体というのはFRBRの概念の一つであるが、書誌情報において重要と思われる概念を指す。具体的には、著作・表現形・体現形・個別資料、個人・団体・家族、概念・物・出来事・場所である。これらの実体間がどのような関係になっているのかを示すのが関連。


https://upload.wikimedia.org/wikipedia/commons/8/80/FRBR-Group-1-entities-and-basic-relations.svg

この有名な図にある楕円が実態、矢印が関連である。

目録を利用するユーザ(この場合は図書館員や利用者のみならず、もっと広い意味でのユーザである)にとって、もっとも重要な実体が、体現形である*1。これは従来の目録をとる対象とほぼ同義。この体現形の中身に相当するのが属性である。属性を表すものがエレメントと呼ばれる。

体現形の属性を表すエレメントには、タイトルや責任表示、出版表示などがある。これらのエレメントはすべて同等というわけではなく、コアエレメント(必須)が定められていたり、エレメント・サブタイプ(例:本タイトルに対する並列タイトル)サブエレメント(例:出版表示における出版地や出版者)といった階層を有したりする。

RDAにそっているとは言え、日本語独自の問題(ヨミや併記された語句など)に対する処理などもあわせて紹介された。体現形の属性で特徴的な点として、タイトルと責任表示が別のエレメントとして扱われている点があげられる。しかしながら、本タイトルと責任表示が何度も繰り返されるような資料に対して、エレメント同士の関係を何かしら記述する文法がなければ(記述文法は規則の外であるが)ならないので、規則と同時に文法も同時並行していく必要がある。また、NCR1987との比較で言及されたのは、版表示と版次について。前者が「版に関する事項」、後者が「NCR1987の版表示」に該当する(ややこしい…)

もうひとつ、体現形の属性において特徴的なのは、資料種別ではなくエレメントごとにまとまっている点である。図書か雑誌かその他かによってエレメントが変わらない。これはキャリア種別を重要視しないという訳ではなく、むしろキャリアを表す粒度を細かくした結果である。キャリアは機器種別とキャリア種別との組み合わせによって表現される。従来、別レベルのものを一緒にしていたため、CD-ROMの地図資料が地図だとは分からないという不具合があった。NCR2018では、例えばCD-ROMの地図資料だと

(表現種別:静止画)、機器種別:コンピュータ、キャリア種別:コンピュータ・ディスク

となる。機器種別とキャリア種別は原則、1対1対応であるが、例外もあり。おそらくこのままユーザに提示してもなんのことかわかりにくくなる(例えば、絵本だと「表現種別:静止画、機器種別:機器不要、キャリア種別:冊子」)。図書館システム側で何かしらの工夫が必要だろうということだった。つまり、目録画面で「絵本」を選ぶと、自動的に各種別にセットするといった工夫が求められる。

体現形と個別資料と異なり、実態(実体ではなく)や従来の目録業務を応用して理解できる一方、著作と表現形を識別の対象ととらえる考え方は新しい。属性をエレメントで表す点は体現形と一緒である。著作については統一タイトルの標目というアナロジーでなんとなく理解できる。優先タイトルや著作の形式、日付などは統制形アクセス・ポイントに含まれ、著作の識別に用いられる。

表現形の属性やアクセス・ポイントというのがイメージしにくいが、表現種別(テキスト、静止画、楽譜、地図…等々)や日付や言語が統制形アクセス・ポイントとして、これをキーとして表現形の典拠コントロールに用いられる。一方で、表現形の識別子や出典などはアクセス・ポイントには含まれないが、表現形の典拠コントロールには用いられる。

著作・表現形・体現形・個別資料が第一の実体とすると、個人・家族・団体は、第一の実体を作る、行為者としての主体を表す第二の実体である。これらの属性も同様にエレメントを用いて表される。個人・家族・団体の優先名称は個人に対する典拠形アクセス・ポイントの基礎となる。ちなみにフロアからの質疑でこの「家族」に対してアーカイブの文脈では、familyの訳語としてふさわしくないという指摘もあった。それなら「ファミリー」ならいいのかとも思うが、一方で訳語がはまりきらなかった「イテレーション」(更新資料におけるある時点での状態)について、別の参加者から原語そのままなのはわかりにくいという指摘もあった。

話を個人・家族・団体に戻すと、団体の下部組織、附属機関の名称のみを優先名称とする点は、NCR1987と大きく異なる。また、共著について、各作成者を表す典拠形アクセス・ポイントとし、主要な作成者を選ぶのは別法としているが、RDAではこちらの方が本則として採用されている。このように各所でローカライズもされている。

最後のキーワードとして、関連。著作・表現形・体現形・個別資料をまとめて「資料」*2と呼ぶ。資料同士、あるいは資料と個人・家族・団体との関連は、主として識別子と典拠形アクセス・ポイントで表すことができる。

この資料についての関連もエレメントが設けられている。著作←表現形←体現形、著作←体現形の3つがコアエレメントである。記録の範囲は、派生、参照、全体・部分、付属・付加、連続、等価の関係を表現する。基本的には識別子と典拠形アクセス・ポイントで記録するが、継続誌や合本などは複合記述、構造記述、非構造記述でも表すことができる。例えば

  1. 継続後(著作):◯◯ジャーナル
  2. 『◆◆◆』(2006年刊)の改題・合本・加筆・再編集である。

上記1が構造記述、2が非構造記述に相当する。

構造記述での「継続後(著作)」は決まった語彙が存在する。それを関連指示子と呼ばれ、リスト化されている。関連指示子は階層化されている。また、適当な語彙がない場合、目録作成機関の判断でリスト外から語彙を採用しても良い。

資料と個人・家族・団体との関連でも関連指示子の細かいリストが用意されている。ただし、映画などはどこまでかけばいいのか、運用の実態が見えていないというのもまた然りである。

規則の段階なので運用までイメージしにくいのは最もであるが、実際には運用していくために、実際の運用を想定すると様々な課題も多い。表現形の典拠コントロールについて、範囲や詳細度が(表現種別、言語、その他?)分からない、たとえば翻訳者別に全てを典拠コントロールする必要はあるのか?という課題が残されたままである。

目録委員からの発表に続いて、和中氏から、規則への期待・要件、それにもとづく修正案が提示された。かいつまんでまとめると、書誌データに社会性をもたせること(MLAの外側)、論理的でない部分は分かりにくくなっているということだった。Creator訳語(作成者ではなく創作者)、「片仮名形」「漢字かなまじり形」「漢字形」ではなく、優先言語で表現する、ヨミのエレメント化およびオプション化、優先名称の言語(日本語か原綴か)は運用で決めたらいいのでは、姓名の区切りカンマの廃止(名姓のときのみ使用)、FRBR-LRMへの対応、NDL Web Authoritiesの共同作成などが提案された。個人的にはこの日唯一、NIIの名前を聞いたのがここだったのが印象に残った。

感想3点。1.規則である以上、定義、範囲、意味内容などの精緻さが求められるんだなぁとあらためて。2.オンライン資料の手薄さが指摘されたが個人的にはNCR2018では扱いきれる範囲ではないのかも…という気もした。ただ、だからオンライン資料のメタデータは考えないという訳ではなく、Dublin CoreとかDOIとかKBARTとか?と一緒の土俵に上る必要はあるのだとは思う。3.主要MARC3つは多いのかもしれない。。でも専門性が高い機関ではMARCでは物足りないのかもしれない。

*1:和古書・漢籍、初期印刷資料は個別資料を記述対象として、体現形の記述を作成

*2:この「資料」という訳語に対する違和感も指摘された。

CRIS (Current Research Information System)

英語 調べてみました

気になったキーワードを調べる短記事シリーズ。

CRIS (Current Research Information System)について、なんとなく「研究者情報データベースでかつ、色々とできるもの」というぼんやりとした理解しかしていなかったので、あらためて文献を読み直してみた。

英語版のWikipediaによると

A current research information system (CRIS) is a database or other information system to store and manage data about research conducted at an institution


Current research information system - Wikipedia

現役の各研究者の業績、その他の情報を収集・管理するためツール、と定義してある。
カレントアウェアネス・ポータルで確認できたなかで初登場は2013年。

Elsevier社がニュースレターで研究データ管理特集 | カレントアウェアネス・ポータル

機関リポジトリとの相互運用性の文脈で語られることが多いなという印象。相互運用には程遠かったけど、機関リポジトリの担当だった頃(2010-2011)に自学の研究者DBにリポジトリへのリンクを貼っていたなぁというぼんやりとした思い出。
その後も、オープンアクセスリポジトリ連合(COAR)とeuroCRISCRISの提携、と機関リポジトリは両輪のような展開を遂げ、2017.2.11現在のカレントで確認できた最新記事(2016.4のもの)も

E1791 - 欧州におけるCRISと機関リポジトリの連携の現状 | カレントアウェアネス・ポータル


ところで「Current Research Information System」とGoogleで検索した時に、最初にランクしているのがWikipediaの記事ではあるが、何個か下にFree UKSG webinarもヒットする。

www.slideshare.net

ここを読むと「Wikipediaでは物足りない!」と。スライドを私が理解できた範囲ではキーワードは「Integration」なのかと感じた。スライド中に何度もこの単語は登場する。研究情報は研究者自身の履歴書であり、業績であり同時にその研究分野や大学そのものの履歴書かつ業績でもある。そしてこのさまざまな研究情報を統合したり、かつ機関リポジトリやORCIDなどの他のシステムと連携することで、CRISがユーザの価値を高めていく。ここでの価値とは、研究者のマッチングや業績評価のための分析として有用であるという意味である。

CRISの必要性について、euroCRISのAboutに詳細に記されている。

Why does one need a CRIS? | euroCRIS

いくつかの文献によると、CRISは1960年代に研究管理のために登場*1*2とあった。

1980年代にはプロトタイプシステムでCRISの相互運用が始まり、それが後にCERIF (Common European Research Information Format)へと発展した。CERIFが何かのかというとうまく説明できないが、どうやらCRISの相互運用性を技術的に担保するモデル、のようだ。2002年、CERIFの開発・管理のためにeuroCRISが登場し、この年から毎年、Conferences on Current Research Information Systemが開催されている。

euroCRISのように非営利組織によるCRISもあればElsevierのPureのような製品も存在する。

www.elsevier.com

Pureの導入大学を見ていると「Research information system (RIS)」という表記を見かけることがあり、Currentの有無はどこで別れるのだろう?と不思議だった。そして今も解決していない…

Wageningen UR replaces Metis with Pure - WUR

*1:Jeffery, K. G., A. Asserson, and D. Luzi. "State of the Art and Roadmap for Current Research Information Systems and Repositories. euroCRIS White Paper." (2010). http://www.irpps.cnr.it/it/system/files/PositionPaperRoadMap20100610.doc

*2:Scholze, Frank, and Jan Maier. "Establishing a research information system as part of an integrated approach to information management: best practice at the Karlsruhe Institute of Technology (KIT)." Liber Quarterly 21.2 (2012). http://doi.org/10.18352/lq.8019

学術コミュニケーションと大学図書館の予想される未来(第18回図書館総合展)

日時:2016年11月09日 (水)
場所:パシフィコ横浜
登壇者:
Neil Jacobs(JISC)
深貝保則 (横浜国立大学教授)
コーディネーター :
佐藤義則 東北学院大学教授
土屋 俊 大学改革支援・学位授与機構教授

www.libraryfair.jp

そのうちに資料などがアップされるであろうから、簡単にメモしておく。

7年ぶり2度目の図書館総合展。別の仕事が入っており、途中下車をしてきた。滞在時間4時間だったので、資料が欲しかった業者さんのブースと、自分のところのポスターを見て、フォーラムに参加してあっという間だった。

到着して早々に久しぶりな方にお会い出来たり、メールを通じてさんざんお世話になった人に偶然にもご挨拶できたり、たまたま隣に座った方が同じ某事業に参加する人だったり。

フォーラムを聞いて感じたことを3つ。

  1. offsettingってはじめて知った
  2. プラットフォーム合戦がOAの世界にも起こっている(より強力なプラットフォームを持ったところが勝ち)のか?
  3. 「信頼(trust)」ということ

順を追ってメモを書き出しておく。
最初に佐藤先生からRichard Poynderに代わって、彼のクリフォード・リンチとの対談記事について紹介された。

poynder.blogspot.jp

各見出しはこのようになっている。

  • Disappointment
  • Conundrum
  • Where next?
  • Resistance
  • Third-time lucky
  • The interview with Clifford Lynch


「Disappointment(失望)」からはじまって、どういうことだろう?と思っていたが、失望というのはOMI-PMHもIR(機関リポジトリ)も、当初のその目的を達成することができなかったということらしい。それはコンテンツのarticleの割合が増えないことなどが挙げられる。IRの目的や意義について様々な人が言及している。たとえばリンチが2003年時点ですでに、通常の出版で扱わないもの(研究データなど)に言及した一方で、IRを新たな学重情報流通の中核を担うものとして期待する声もあった。しかしながら、IRは出版のオルタナティブになりえなかった。さらに巨大なゴールドOAの登場、AtyponをWileyが、SSRNをElsevierが買収、Elsevierとフロリダ大学がIRについてパートナーシップを結ぶことに成功、という新たな局面も迎えている。

出版社にとってグリーンOAやIRって儲かるもの(というと語弊があるが)なんだ!?というのが最初の感想、すこし時間がたってプラットフォームは大事だから、どう主導権を握るのかというのは鍵になるのだろうか?というのが今の感想。

ぼんやりと、先日テレビでみた番組を思い出していた。ここで登場する企業は特殊すぎるけど。

日本の場合は言語の問題や紀要などが、違う要因として組み込まれるのかなぁと。そもそも日本語コンテンツの相対的な重要度も変化していくだろうし。

個人的には全文クロールとメタデータについて興味を惹かれた。OAI-PMHがメタデータのみをハーベストしていたのは、容量もしくは技術的な問題だったのだろうか?メタデータと全文に重要度などの差をつけると面白そうだなぁと思った。

つづいて、Neil Jacobs氏の講演。通訳、お疲れ様でした。個人的な話だが「あの時の話がここに繋がった」わかりやすく聞けました。
イギリスのOA(セルフアーカイブ含む)を推し進める最大の要因は、助成団体のポリシー、これにつきると思う。主要な団体としてRCUKとHEFCEがあり、それぞれが助成する基準としてOAを謳っている。RCUKはGOld推し、HEFCEはGreen推しという違いはあれどOAポリシーが研究者のOAを促進している。助成団体のみならず各機関や大学もOAポリシーをもっていることが多く、JISCはそれぞれのポリシーやOAを進める上でのワークフローに齟齬がでないようなサービスを提供している。

www.jisc.ac.uk

この度のフォーラムではじめてoffsettingを知った。これはつまり、購読+APCをセットで支払うというもの。たとえば、Springer Compactがこれに該当する。

Offsetting models: update on the Springer Compact deal | Jisc scholarly communications

これでコストが減る理由がピンときていないのだけど、ハイブリッド誌において、購読とAPCをバラバラ払う(しかもAPCは著者からそれぞれ支払う)よりも電子リソース周りのコストが把握しやすくなる⇒それによる合理化?という理解をしている。
JISCとしてはこのoffsettingを過渡期として推進することで、コスト削減を目指しているよう。offsettingにおける原則のなかで「バウチャーではなくキャッシュで」という点が挙げられており、講演後になぜですか?とNeilさんにお聞きすると「バウチャーは期限があるから」という回答をいただいた。その時は「あーなるほど」と思っていたが、期限がなければOKな話なのかな?という新たな疑問も。通貨(キャッシュ)以外にコストを計算する要因は少ないようがいいからなのかな。(バウチャー管理はそれはそれで大変そう)

後半は研究データについて。FAIRというフレームワークにのっとり、英国におけるポリシーが策定されている。

www.jisc.ac.uk

さらに

ec.europa.eu

ポリシーにつづいて、研究データおよびオープンサイエンスに関する実装(implementation)について紹介された。
ポリシーがその底辺を支えるものとして、計画から引用までを網羅する図が示された。

Jisc RDM shared service pilot

お話のなかで何度が「trust」という単語が出てきた(たぶん)。信頼できるリポジトリ、信頼できるデータを担保するために、それらのコンテンツがどういう背景で作成され、収集され、公開されたのかを示す必要があるという。そのためのポリシーであり、フレームワークであり、スキーマであり…等々。信頼性というのは科学の営みそのものであり(という理解)、それを担保するためにここまでの枠組みを用意する必要があるのだなぁ…と。

Serials Price Projections for 2017

文献紹介 英語

ここ最近は、腑抜け状態になっているのでリハビリ代わりにこれを書いている。電子ジャーナルのコストの話から「これを読んだらいいよ」とおすすめされたものをようやく読んだ。

Subscription Services | 2017 Serial Price Projections | EBSCO

EBSCO Information Servicesが発表しているJournal価格の世界的動向についての報告。4ページ弱という短い文章なので、紹介も何もないのですが…

まずは、2017年は5-6%ほど価格が上昇するとのこと。これは契約担当だったらお馴染みかもしれないが…
つづいて、市場動向について、アメリカドルとアメリカ経済の支配力の拡大に伴い、アメリカとそれ以外において格差が生まれていると言う。オーストラリアドル、ポンド、カナダドル、ユーロ、ニュージーランドドル南アフリカ、米国ドルについて、対USドル、ポンド、ユーロ別の価格上昇率が一覧されているが、特にポンドの上昇率が目立っている。それにはイギリスのEU脱退が影響しているという指摘も。

図書館系の文献、特に英語の文献を読むときは、ついつい、細部が気になって入り込んでいくように文献を探していく傾向にあるのだけど、これを手にとって「そうだ。政治経済と言う大枠を忘れていた」ということを思い出した。政治経済というより、我々が位置している枠組みの把握というのか。

おもしろいと思った箇所として、卵とバスケットの比喩を紹介する。
出版社の倒産と統合、財政不安と予算削減、その結果として図書館は「安全なバスケット(出版社)に大部分の卵(ジャーナル)を入れよう」という傾向が強まっているという指摘だった。安全なバスケットというのは財務上の安定ということ。この文献を紹介してもらったライブラリアンが働く大学では、4つ契約していた電子ブックのアグリゲータを精査(コンテンツ、利用統計、価格…など)した結果、1つに絞ることで経費削減に成功したそうだ。この傾向は、出版社だけでなく書店も同様に(私の知る限り、お取引する書店はどんどん少なくなっている)より強くなるのかのもしれない。

GOAジャーナルを刊行していないためか、OAジャーナルについて1段落ほど簡単に指摘がされている。GOAジャーナルは出版モデルのオルタナティブとして新しいビジネスモデルを牽引する一方、学術情報コスト削減にはあまり寄与していないということ。

e-resource usage analysis and statistics

気になったキーワードを調べる短記事シリーズ。
表題はキーワードではなくテーマです。

利用統計のためのアグリゲーション・ポータルにはどんなものがあるのかをまとめてみた。
新たなものが分かり次第、随時、追加するつもり。

参考にしたもの

Report on JUSP, KB+ and Intota Assessment – JISC HIKE Project
JISC HIKE Projectが、2015年6月に発表した、JUSP・KB+(の統計機能)・Intota Assessmentをレビューしたもの

E-resource usage statistics - ulms-analytics - CSU Library Spaces
2016年6月の記事。Colorado State Universityのライブラリアンたちの情報ウィキ(なのかな?)

Alma

Intota™ Assessment

  • http://www.proquest.com/products-services/intota-assessment.html 
  • ProQuest社
  • レビューによると「CPU(Cost per Use)」という項目が評価されている
  • しかしながら、ベンダーの壁という点でナレッジベースに若干の弱点あり(ProQuest製品以外が弱い)
  • 先行する360 CounterをEMSに組み込むかたち?
  • 冊子・電子・ILL、OA等も含む

LibAnalytics

JUSP

KB+

  • https://www.kbplus.ac.uk/kbplus
  • JISC Collections
  • JR1、JR1-JR1a、JR1GOA、JR1aが取得可能
  • レビューいわく、ここにJUSPの機能をまとめろという
    • AlmaやIntota™ Assessmentを考えるとそれもそうだ

WorldShare Management Services

IRUS-UK

  • http://irus.mimas.ac.uk/
  • JISC
  • 機関リポジトリの利用統計
  • これまでと毛色が異なるが、論文ごとにアクセス数が取れるということだろうか?
    • 近いところにいるJUSPはたしかタイトルレベルまでしかとれなかった…はず(うろ覚え)

Standardized Usage Statistics Harvesting Initiative (SUSHI)

調べてみました

気になるキーワードを調べる短記事シリーズ。もうちょっと続く。

Standardized Usage Statistics Harvesting Initiative (SUSHI)とは、米国情報標準化機構(NISO)のイニシアティブのひとつであり、COUNTER準拠の利用統計データを自動的にローカル・システムに取得できるプロトコル*1で、電子情報の利用統計データを自動的に収集するモデルを定義する。(ANSI/NISO Z39.93-2014)

Standardized Usage Statistics Harvesting Initiative (SUSHI) - National Information Standards Organization

最新版は、version 1.7(2014)で、昨年の1月にも改定されている。

NISO、SUSHIプロトコルを改訂 | カレントアウェアネス・ポータル


ちなみに『薬学図書館』を公開している、J-STAGEは数少ないCOUNTER準拠の日本語コンテンツである。

www.jstage.jst.go.jp

COUNTERは利用統計そのもの標準で、SUSHIはそれをネットワークを通じてローカルにダウンロードするときのプロトコル。COUNTER準拠の利用統計の取得が念頭に置かれているが、COUNTER準拠でないデータも対象範囲である。

このプロトコルは、出版社が標準フォーマット(COUNTER XML)で利用統計を提供するよう求める*2


ところで、先月に行われた電子書籍の利用統計についてのフォーラムの報告書「JUSP ebook discussion forum report」によると、最後に「XML does not match the SUSHI schema」という記述があった。これはどういうことなのだろう?XMLとSUSHI schemaが一致していない???

SUSHIのサイトに行って「About SUSHI Schemas」を読むと

SUSHI/COUNTER Schemas - National Information Standards Organization

SUSHIには3つのスキーマがあり、SUSHI Core Schema、COUNTER-SUSHI Schema、COUNTER reports schemaが存在する。まず、COUNTER reports schema はXML形式のCOUNTERレポートを作成する。

The two schemas with "sushi" in their name are basically retrieval envelopes for the XML-formatted COUNTER reports. The COUNTER XML schemas can be used separately from SUSHI by anyone who wants the reports in XML formats.

SUSHI Core Schemaは、互換性のあるXML形式の利用統計レポートを取得するよう一般化される(is generalized)。

The core SUSHI schema is generalized to retrieve any compatible XML formatted usage statistics reports.

COUNTER-SUSHI schemaは、core SUSHI schemaとともに、検索しに行く利用統計レポートがCOUNTERレポートであった場合に利用される。最新のCOUNTER準拠のXML形式の利用統計レポートのスキーマに一致するようにアップデートされる。COUNTERの実務指針のバージョンごとに、別々のスキーマが必要になる。

This schema is used with the core SUSHI schema if the usage reports to be retrieved are COUNTER reports. This schema is updated to match the most current version of the COUNTER XML reports schema and thus may have a higher version number than the core SUSHI schema. Each release of the COUNTER Code of Practice will require separate schemas.

XMLとSUSHI schemaが一致しない、というのは別々のスキーマ(separate schemas)が必要、ということなのだろうか…?つまりCOUNTERのバージョンによって、求められるCOUNTER-SUSHI schemaとcore SUSHI schemaが異なるということなのだろうか…?

翻訳の問題と、SUSHIに対する理解度の問題で、少しまだぼんやりとしている。

*1:伊藤 裕之「SUSHI (Standardized Usage Statistics Harvesting Initiative)」薬学図書館, 52(3) http://doi.org/10.11291/jpla1956.52.270

*2:William Hoffman「規格は利用統計の解読に役立つ」Standards: Standards help decode usage statistics http://www.openaccessjapan.com/resources/literature/-Standards%20help%20decode.pdf