klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

Standardized Usage Statistics Harvesting Initiative (SUSHI)

気になるキーワードを調べる短記事シリーズ。もうちょっと続く。

Standardized Usage Statistics Harvesting Initiative (SUSHI)とは、米国情報標準化機構(NISO)のイニシアティブのひとつであり、COUNTER準拠の利用統計データを自動的にローカル・システムに取得できるプロトコル*1で、電子情報の利用統計データを自動的に収集するモデルを定義する。(ANSI/NISO Z39.93-2014)

Standardized Usage Statistics Harvesting Initiative (SUSHI) - National Information Standards Organization

最新版は、version 1.7(2014)で、昨年の1月にも改定されている。

NISO、SUSHIプロトコルを改訂 | カレントアウェアネス・ポータル


ちなみに『薬学図書館』を公開している、J-STAGEは数少ないCOUNTER準拠の日本語コンテンツである。

www.jstage.jst.go.jp

COUNTERは利用統計そのもの標準で、SUSHIはそれをネットワークを通じてローカルにダウンロードするときのプロトコル。COUNTER準拠の利用統計の取得が念頭に置かれているが、COUNTER準拠でないデータも対象範囲である。

このプロトコルは、出版社が標準フォーマット(COUNTER XML)で利用統計を提供するよう求める*2


ところで、先月に行われた電子書籍の利用統計についてのフォーラムの報告書「JUSP ebook discussion forum report」によると、最後に「XML does not match the SUSHI schema」という記述があった。これはどういうことなのだろう?XMLとSUSHI schemaが一致していない???

SUSHIのサイトに行って「About SUSHI Schemas」を読むと

SUSHI/COUNTER Schemas - National Information Standards Organization

SUSHIには3つのスキーマがあり、SUSHI Core Schema、COUNTER-SUSHI Schema、COUNTER reports schemaが存在する。まず、COUNTER reports schema はXML形式のCOUNTERレポートを作成する。

The two schemas with "sushi" in their name are basically retrieval envelopes for the XML-formatted COUNTER reports. The COUNTER XML schemas can be used separately from SUSHI by anyone who wants the reports in XML formats.

SUSHI Core Schemaは、互換性のあるXML形式の利用統計レポートを取得するよう一般化される(is generalized)。

The core SUSHI schema is generalized to retrieve any compatible XML formatted usage statistics reports.

COUNTER-SUSHI schemaは、core SUSHI schemaとともに、検索しに行く利用統計レポートがCOUNTERレポートであった場合に利用される。最新のCOUNTER準拠のXML形式の利用統計レポートのスキーマに一致するようにアップデートされる。COUNTERの実務指針のバージョンごとに、別々のスキーマが必要になる。

This schema is used with the core SUSHI schema if the usage reports to be retrieved are COUNTER reports. This schema is updated to match the most current version of the COUNTER XML reports schema and thus may have a higher version number than the core SUSHI schema. Each release of the COUNTER Code of Practice will require separate schemas.

XMLとSUSHI schemaが一致しない、というのは別々のスキーマ(separate schemas)が必要、ということなのだろうか…?つまりCOUNTERのバージョンによって、求められるCOUNTER-SUSHI schemaとcore SUSHI schemaが異なるということなのだろうか…?

翻訳の問題と、SUSHIに対する理解度の問題で、少しまだぼんやりとしている。

*1:伊藤 裕之「SUSHI (Standardized Usage Statistics Harvesting Initiative)」薬学図書館, 52(3) http://doi.org/10.11291/jpla1956.52.270

*2:William Hoffman「規格は利用統計の解読に役立つ」Standards: Standards help decode usage statistics http://www.openaccessjapan.com/resources/literature/-Standards%20help%20decode.pdf

Electronic resource management

気になるキーワードを調べる短記事シリーズ。

個人的な記憶だが、Electronic resource managementという単語を最初に聞いたのは、NIIによるERMSの実証実験だったような気がする。

www.nii.ac.jp

その後、勤め先でERMSを触る機会もなく、また全国にどんどん広がっているという話もあまり耳にせず(いくつかの大学では導入されているものの)、気になるような忘れかけていた。

昨日の記事の参考文献でもある「Electronic Resource Management Handbook」をざざっと見ていると、Electronic resource managementとはどんなものを含んでいるのか、がなんとなく見える(ような見えないような…)

www.uksg.org


そんな中で最近、第14回これからの学術情報システム構築検討委員会の議事録と配布資料を読んだ。

www.nii.ac.jp

配布資料には、何箇所か「ERM」についての言及がある。それによると、コンソーシアム版のERMの導入を検証するようである。単独で導入している機関はあるが単独導入できない機関でも、電子リソースの管理業務の合理化を図ることが狙いらしい。ただし、全国みんなで同じコンソ版を使う方向にするのではなく、(今現在)無いところでも使い物になるのか、というのが検証の要点。

コンソーシアムで購入していないパッケージのことをどこまで検討に入れるのか(管理する対象を広くすると仕様書が大変そう)等々、気になることも多く、今後の動向を追っていきたいと思う。

気になった話題その2。それでは商用ERMとコンソーシアム版はどう違うのか、まだぼやっとした理解しかないのだけど、コンソーシアムで電子リソースを購読しているのでそれらを管理(し、評価する)ツールは必要になるのだろう。そのためコンソーシアム(というかナショナルな)ERMが登場する。い一例として、英国のOpen Universityの事例報告を読んだ。

www.eventbrite.co.uk

スライド資料は以下より。

Events and Training :: Jisc Usage Statistics Portal

Open University*1は22スライド目から。Open Universityは2014年から、JUSPのデータをUStat(ExLibrisの統計ツール)に投入して分析をしているらしい。つまり、JUSP(ナショナルな統計管理サービス)のデータを、商用統計管理ツールで管理しているという。コンソーシアム版と商用版は使い分けがされているのだなということが垣間見えた。また、同大学では2015年からAlmaを実装を開始したそうだ。Almaとは冊子・電子などの媒体を問わず、図書館が扱う情報資料を単一のプラットフォームで管理する「次世代図書館サービスフレームワーク」らしい。*2*3*4


www.exlibrisgroup.com


現段階で分かる範囲をまとめてみた。

メーカー Ex Libris→ProQuest ProQuest EBSCO OCLC
ナレッジベース SFX KnowledgeBase Knowledge Works EBSCO Integrated Knowledge Base WorldCat Knowledge Base
Discovery Service Primo Summon EBSCO Discovery Service WorldCat Discovery Services
ERM Verde*5、Alma*6 360 Resource Manager ERM Essentials WorldShare License Manager

表のもとになったのは、2012年の図書館総合展の伊藤民雄さんの発表資料。

2012.libraryfair.jp

この表をアップデートさせるつもりだったが、買収があったり、Almaをどこに位置づけるべきか悩んだり、Electronic resource managementという概念もアップデートされているのかもしれない。このあたりをもう少し、整理したい。

*1:話はそれるがこの大学は面白そうだと思う。放送大学のモデルになった大学のようで、訪問してみたいと思いつつ、立地面から難しいそうだなぁと。難しかった。

*2:「Almaの近況」ユサコニュース 第248号 http://www.usaco.co.jp/itemview/template44_3_8562.html

*3:図書館システムベンダとユーザ会の共存―IGeLU大会<報告>カレントアウェアネス http://current.ndl.go.jp/e1489

*4:伊藤裕之「次世代型図書館業務管理システム「Alma」」薬学図書館 57(4) 

*5:2016.8.16追加。コメントよりVerdeの開発は終了しているそうなので二重線を入れた。

*6:Almaは図書館システム、ERMS、リゾルバを組み合わせたものなので正確にはここではない

SCONUL returnについてのメモ

いくつか気になるキーワードを調べる短め記事シリーズ。
前回がCOUNTERを概観したので、今回はSCONULreturn。

Society of College, National and University Libraries (SCONUL)は、英国・アイルランドの国立大学および国立高等教育機関図書館協会。

SCONUL | Society of College, National and University Libraries

そのSCONULに各大学(機関)が年に一回、報告しているのがSCONUL return。SCONULへの報告として、2004-5年から(2003-4年について遡って)電子情報資源の利用統計についての質問が追加された。*1

邦訳があったので(ありがたい)それを参照する。ちなみに原文へのリンクは切れている。

邦訳:SCONUL 加盟館の電子情報資源(e-Resources):統計が私たちに教えるもの

www.openaccessjapan.com

これによると、論文フルテキスト要求(Full-text Article Requests)と、電子ブックのアクセス数( E-book Accesses)という 「電子尺度」が追加された。これは、2003-5年にかけて行われた、「電子尺度プロジェクト(e-measures project)」の調査結果にもとづいている。電子尺度プロジェクトとは、

2003年から 2005 年にかけて HEFCE-funded Libraries: Outcomes and Measuresproject.の一部として中央イングランド大学のエビデンス・ベースが25の大学図書館と共に行なったプロジェクト。図書館の意思決定と利用者支援に援助し、電子情報サービス用の最新の一連の統計指標と尺度を開発し、SCOUNL と共同で電子情報サービス用の標準的なパフォーマンス指標として、高等教育図書館セクターでテストし、修正し、展開することを目的としていた。
http://www.ebase.uce.ac.uk/emeasures/emeasures

HEFCE(Higher Education Funding Council)とは、英国の高等教育機関への基盤的な経費を配分機関である。英国にはこのような助成機関がいくつか存在する。主たるものがRCUK(Research Counsils UK)とHEFCE。ほとんどが競争的配分であり、前年度の評価に基づいて各部局ごとに交付されるのが基本らしい。

電子尺度プロジェクト(e-measures project)とはCOUNTERとも関係する。COUNTERは2002年に設立されている。COUNTERの存在が彼らのプロジェクトを促進させるようであり、またCOUNTERに一致するようにも進められた*2

報告書でも指摘されているが、出版社やアグリゲータによって入手できる数値が異なっている、そもそもデータが入手できないという問題点も指摘されていた。
現在、SCONULreturnへはどのような統計データを報告しているかというと、JUSP上で専用のメニューとして用意されている。

jusp.mimas.ac.uk

報告用に学年暦であらかじめ期間がセットされ、COUNTER JR1に準拠したフルテキスト要求数がダウンロード可能。CSVでダウンロード可、JUSPにない出版社分はJR1形式で追加することで、SCONUL return用に簡単に編集できる、らしい。アグリゲータ系(ingentaconnect (Publishing Technology), SwetsWise and Ebsco EJS)は別メニュー。

*1:Conyers, Angela. e-Resources in SCONUL member libraries: what the statistics tell us. SCONUL Focus, No.36, Winter 2005, p.65-67.

*2:Conyers, Angela. "Usage statistics and online behaviour." Electronic Resource Management Handbook (2006) http://dx.doi.org/10.1629/9552448-0-3.2.1

Free UKSG webinar - COUNTER for Librarians

UKSG(United Kingdom Serials Group)が行っているwebinarを受講したので記録を兼ねて。

www.uksg.org


www.slideshare.net

テーマはCOUNTER(Counting Online Usage of NeTworked Electronic Resources)について。ざっくりした理解では電子リソースの利用統計の国際標準である。2003年から始まり、現在の最新版はCOUNTER4

www.projectcounter.org


COUNTERについて日本語で読める文献をいくつか。

CA1512 - 動向レビュー:電子ジャーナルの出版・契約・利用統計 / 加藤信哉 | カレントアウェアネス・ポータル
ci.nii.ac.jp
ci.nii.ac.jp


出力できるレポートは、標準13種類、オプション10種類。
おおまかにJournal, Databases, Books and Reference Works, Multimedia, Reports for a Library Consortiumの4つの利用統計レポートがあり、さらにその中で細かく分かれている。例えばJournalの場合...

Report Description Status Status
Journal Report 1 Number of Successful Full-Text Article Requests by Month and Journal Standard
Journal Report 1 GOA Number of Successful Gold Open Access Full-Text Article Requests by Month and Journal Standard
Journal Report 1a Number of Successful Full-Text Article Requests from an Archive by Month and Journal Optional
Journal Report 2 Access Denied to Full-Text Articles by Month, Journal and Category Standard
Journal Report 3 Number of Successful Item Requests by Month, Journal and Page-type Optional
Journal Report 3 Mobile Number of Successful Item Requests by Month, Journal and Page-type for usage on a mobile device Optional
Journal Report 4 Total Searches Run By Month and Collection Optional
Journal Report 5 Number of Successful Full-Text Article Requests by Yearof-Publication (YOP) and Journal Standard


最初にUKSGサイトで受講の登録をして、その時間帯(日本時間で何時かも分かるようになっている。この時は22-23時だった)になったら、スライドと音声による解説が始まる。チャット(らしきもの?)で質問も受けれるようだった。

ライブラリアン向けのCOUNTER入門ということで、最初にCOUNTERの概略が説明され、次にその重要性として

  • 異なる出版社間での比較が可能
  • 専門的な高度な知識を必要としないレポート
  • 操作性の高く分析しやすいデータ

電子リソースのライフサイクルに置いて、重要な位置をしめる「Evaluation」にCOUNTERは、電子リソースの購読・中止・更新の検討材料となる。それはユーザ(学生?)の満足度の向上へとつながる。

ただし、COUNTERレポート自体は、購読有無は加味せずに表示される。利用が0なのか非購読なのか、利用があったものについてもOAオプションによるものなのか購読によるものなのかは、レポートそのものからは読み取ることができない。

利用を継続して観察すること、利用数から単価を算出すること、アクセス拒否数などを総合的に判断することで、よりより評価が達成できる。

COUNTERという標準はあるものの複数の出版社から利用統計を集計することは煩雑になる。そこで…というながれで登場したのが、JUSP(Journal Usage Statistics Portal)。電子リソースの利用統計のポータルサイトサービスである。

JUSP :: Journal Usage Statistics Portal (Cloud)

JUSPについてはささっと触れられていた。

利用統計は電子リソースを評価するただひとつの方法としながらも、ニッチな需要、教育・研究方法の変化、ディスカバリーの重要さ((電子ブックは時に埋もれてしまっているという指摘もあった))、広い視点も考慮する点も指摘された。因果関係と定性データとともに利用統計を扱いましょうという締めで終わった。

Cited References Explorer(CRExplorer)を触ってみた

Web of Scienceからダウンロードしたデータを分析するソフトウェアCRExplorer公開 | カレントアウェアネス・ポータル

昨年のことになるが、Web of Scienceの分析・可視化ツールが公開された。Web of Scienceのデータ自体は自分で取得しなくてはいけないが、細かな技術知識無しに始められる手軽さがある。

まず、Cited References Explorerのサイトに行き

CRExplorer - Cited References Explorer

1もしくは2の方法で、Cited References Explorerを立ち上げる。

使い方はこちらを見ながら
[1601.01199] Introducing CitedReferencesExplorer (CRExplorer): A program for Reference Publication Year Spectroscopy with Cited References Standardization

Web of Scienceから取得するデータを抽出する

今回は仮に、ということで2種類のデータをダウンロードした。

1.NEJMのLETTER

検索項目: 出版物名: (new england journal of medicine)
絞り込み: ドキュメントタイプ: ( LETTER )
タイムスパン: 2015-2015.
合計709件(2016.4.3)

2.NEJMのREVIEW

検索項目: 出版物名: (new england journal of medicine)
絞り込み: ドキュメントタイプ: ( REVIEW )
タイムスパン: 2015-2015.
合計299件(2016.4.3)

マークリストに追加した後にダウンロードした。
WoSの検索結果画面表示が最大50件なので、1000件を越えるとしんどいなぁという感じがする。

f:id:klarer-himmel13:20160403001654j:plain

また、一度にダウンロードできる件数が最大500件なので、何回かに分けなくてはならない。やはり、一度にダウンロードするのは1000件未満が良いのか。(CRExplorer自体はデフォルトの最大インポートは10万件なので、他によい方法があるのかもしれない…)

ファイル形式は「他のファイルフォーマットで保存」>「テキスト」
出力項目は全項目。

f:id:klarer-himmel13:20160403003057j:plain

Cited References Explorerにデータを読みこませる

709件が引用した1985件がグラフ化する。
f:id:klarer-himmel13:20160403004554p:plain


被引用文献に出版年フィルターをかけたり、項目ごとにソートをかけることができる。
f:id:klarer-himmel13:20160403004926p:plain

任意のデータや、出版年を取り除くことも可能。
f:id:klarer-himmel13:20160403005423p:plain

左側のグラフは画像保存、右側のデータもcsvで保存可能。

LETTER(1991年以降)

f:id:klarer-himmel13:20160403173409p:plain

REVIEW(1991年以降)

f:id:klarer-himmel13:20160403173522p:plain

単純にグラフを生成するだけでも、REVIEWの方が幅広い年を引用している(だからこそのREVIEWなのだけど)ことが見て取れる。
また、709件で1985件の引用論文に対して、REVIEWは299件で2886件の引用論文と、1論文あたりの引用文献数もREVIEWの方が多い。

その他、Merge Cited References of the Same ClusterやCluster equivalent Cited Referencesによって、データ内の同一データを発見したり、マージすることができる。同一データの判定はレーベンシュタイン距離による、らしい。

CRExplorerに読み込むとClusterIDというものが付与される。これを使うことで表記のゆれを集約できる(赤い四角)…のか?
f:id:klarer-himmel13:20160403211347p:plain

このClusterIDは、Standardization>Cluster equivalent Cited Referencesを使うことで、レーベンシュタイン距離(上記の青い丸)、Volume、Page、DOIごとに変更することもできる。

また、任意の複数文献を選択して、Same・Different・Extractを指示し、ClusterIDを変更・修正することもできる。Differentを指示すると異なるsub-ClusterIDが割り当てられる。Extractを支持すると同一だったsub-ClusterIDから切り離される。Sameは同じsub-ClusterIDが割り当てられる。
例えばID=111を選択し(ClusterID=109/109であり、同一ClusterIDは3件)、Extractをクリックすると
f:id:klarer-himmel13:20160403212849p:plain

sub-ClusterIDが、109→111に変わり、ClusterID=109/111となる。
f:id:klarer-himmel13:20160403213041p:plain

自分が触ってみて理解できたところまでしか書けていないが、もう少しできるようになると面白いかもしれない。

『情報の評価とコレクション形成』(わかる!図書館情報学シリーズ第二巻)

長いタイトルになってしまったが、最近よんだ1冊。


ここ数年のうっすらした自分のテーマのひとつに、評価があった。図書館に関係すると、コレクションの評価になるのかもしれないけれど、もう少し広い視点から論じたものはないかなぁと思って読んだのが『情報の評価とコレクション形成』。9名の著者によるオムニバス講義のようになっている。

第1部 情報の評価
第1章 利用者の視点にもとづく情報と情報源の評価 齋藤泰則(明治大学
第2章 学術情報の評価 小野寺夏生(筑波大学名誉教授)
第3章 ウェブ情報源の評価 佐藤翔(同志社大学
第4章 蔵書の評価と資料選択 大場博幸(文教大学

前半のテーマが情報の評価である。1章ではまず、「情報要求を充足し評価されるとはどういう状態なのか?」という問いに対して、適合性、迅速性、利便性といった評価基準を細かく整理しなおすところから始まる。OCLCの図書館の情報源とウェブの情報源の比較調査などを引用しながら、利用者の視点からの評価基準について展開する。次に適合性について、問題解決において情報源を適合性で評価する際に、利用者の認識に応じて変化するということが指摘される。それを受けて、レファレンス(インタビュー)を取り上げ、利用者の不確定性を縮小する点を数量化した。ある情報要求Aとそれに対する情報B、Bに一定の評価をつけられる…ということだけではなく、インタビューにおいてAが変化することで、適合性もまた変化するということが示された。

www.oclc.org

2章では、情報を学術情報に絞り込み、評価の目的を(1)よりより研究成果を出すための支援(2)重要な情報の選別(3)研究管理(4)学術情報流の高度化・効率化の4つに分類した。学術情報の計量データを用いた評価の代表例として、論文数、被引用数/論文閲覧数、オルトメトリックスを取り上げそれぞれの特徴や課題などを整理した。

3章は内容ではなく媒体で切り分るというアプローチがされている。ウェブ情報源を信憑性(信頼性+専門性)、安定性、評判、依拠可能性の観点から評価基準を整理し、具体例としてウィキペディア、Q&Aサイト、SNSを取り上げた。つづく4章も媒体からのアプローチであり、蔵書評価と選書という物理体がテーマになる。まず、既存の評価基準であるチェックリスト法、蔵書新鮮度、入館者数と貸出数の概要と課題が紹介され、後半は資料選択について、主に公共図書館を具体例に理念について議論が展開される。

第2部 コレクション形成
第1章 コレクションとは 安井一徳(国立国会図書館
第2章 日本の図書館のコレクションの現状 大谷康晴(日本女子大学
第3章 学校図書館のコレクション形成 河西由美子(鶴見大学
第4章 大学図書館のコレクション 佐藤義則東北学院大学
第5章 文書資料と文書館・アーカイブズ 古賀崇(天理大学

後半はコレクション形成がテーマになっている。まず、1章で図書館コレクションの概論が展開される。電子環境下においてもコレクションは自明ではなくなるにせよ、コレクションが持つ役割が変わらないという指摘がされる。「コレクション「である」という静態的な認識から、コレクション「にする」という動態的で構成的なアプローチ(p.106)」がコレクションに起こり、ディスカバリーPDAなどがそれを支えるという。

2章では、カーリルとWebcat Plusを使った日本の図書館の所蔵状況を調べた大規模実態調査の報告である。章の最後に、所蔵調査を定期的に行うことで廃棄状況がわかると箇所を読んで、面白いなぁと思った。受入基準よりも廃棄基準が難しいというのを最近、感じている。

3章は学校図書館、4章は大学図書館のコレクションについて。3章はあまり読み込めていないが、これを読んではじめて「学校図書館図書標準」のことを知った。


4章の大学図書館については、電子資源を扱うことがもっとも多いためか、電子的コレクションにかなりを割いてある。前半は伝統的なアトキンソンのによる大学図書館が果たすべき機能(報知、資料、歴史、教育、書誌)を整理し、これらの5項目自体は変わらないものの、電子的コレクションの導入により、それぞれの機能のあり方は変化しているという。電子ジャーナル、ライセンス契約、ダークアーカイブ、オープンアクセス、電子書籍などの先には、図書館を超えたコレクションの組織化(HathiTrust、GoogleBooks、Internet Archive,、NDL図書館送信サービス、分担保存)が誕生し始め、図書館単独ではなく、集合的に課題を解決する努力が求められている。ちなみに本筋ではないが、電子的コレクションの強みの一つはログが取れるという点だと思う。コレクションが館内だけでなく、外部への仲介機能を含めたものへと変化するのであれば、統計やログデータのあり方や活用方法も変化するのだろうか?

最後は文書資料について。図書館で文書資料を扱う割合は小さいにせよ、それは貴重資料や特殊コレクションとして所蔵されていることは少なくない。文書資料が持つ様々な特徴、種別、整理における原則(出所ごとにまとめておく等)について端的に紹介されている。

「カリキュラムのキーワードを利用した分野別選書基準について―亜細亜大学図書館の試み」(人文会News No.121より)

ci.nii.ac.jp

半年前のものだけど、最近、紹介していただいて読んだもの。本文は公開されている。

人文会ニュース 121号 | 人文会公式サイト

著者の大石さんは、1996年に選書委員会に関わるようになり、1999年に教員からされた「選ぶ際のキーワードを教えて下さい」というエピソードをきっかけに選書や選書基準を考えるようになったという。

この関心が大きく動くようになったのは、2004年に分野別選書基準の作成をはじめたことだった。『ALA蔵書の管理と構成のためのガイドブック』(1995/原書は1994)のレベル表を参考にレベルをさだめ、カリキュラムをNDCに分類、そこからキーワードを切り出して、基準を作成したそうだ。カリキュラムの改訂、教員の交代、学部の新設などにあわせ、キーワード・レベルの見直しを行っている。

選書作業は学部ごとに6名が担当し、週1回会議を行って進められている。本文では作業順序や図書ごとの作業が細やかに説明されてた。大学の学部構成や図書館が本館1つという特徴もあるので、全てを真似することはできないが、(おそらく非言語されていたであろう)事例が紹介されているのが新鮮で、あらためて選書を考える機会となった。

最後に触れられていた「選書+除籍=選書基準」というのはとても腑に落ちた。除籍するときの方がより難しいなぁと最近は、考えている。





別の大学の話。まったく選書とは関係ない調べものをしていたときに、愛知淑徳大学図書館さんのホームページが目に止まった。

愛知淑徳大学図書館 Aichi Shukutoku University Library

f:id:klarer-himmel13:20160123165105j:plain

愛知淑徳大学図書館は、カリキュラムにそったコレクション(情報資源)を揃えて、学習・研究をサポートします。」という一文が潔くてかっこいい