klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

Serials Price Projections for 2017

ここ最近は、腑抜け状態になっているのでリハビリ代わりにこれを書いている。電子ジャーナルのコストの話から「これを読んだらいいよ」とおすすめされたものをようやく読んだ。

Subscription Services | 2017 Serial Price Projections | EBSCO

EBSCO Information Servicesが発表しているJournal価格の世界的動向についての報告。4ページ弱という短い文章なので、紹介も何もないのですが…

まずは、2017年は5-6%ほど価格が上昇するとのこと。これは契約担当だったらお馴染みかもしれないが…
つづいて、市場動向について、アメリカドルとアメリカ経済の支配力の拡大に伴い、アメリカとそれ以外において格差が生まれていると言う。オーストラリアドル、ポンド、カナダドル、ユーロ、ニュージーランドドル南アフリカ、米国ドルについて、対USドル、ポンド、ユーロ別の価格上昇率が一覧されているが、特にポンドの上昇率が目立っている。それにはイギリスのEU脱退が影響しているという指摘も。

図書館系の文献、特に英語の文献を読むときは、ついつい、細部が気になって入り込んでいくように文献を探していく傾向にあるのだけど、これを手にとって「そうだ。政治経済と言う大枠を忘れていた」ということを思い出した。政治経済というより、我々が位置している枠組みの把握というのか。

おもしろいと思った箇所として、卵とバスケットの比喩を紹介する。
出版社の倒産と統合、財政不安と予算削減、その結果として図書館は「安全なバスケット(出版社)に大部分の卵(ジャーナル)を入れよう」という傾向が強まっているという指摘だった。安全なバスケットというのは財務上の安定ということ。この文献を紹介してもらったライブラリアンが働く大学では、4つ契約していた電子ブックのアグリゲータを精査(コンテンツ、利用統計、価格…など)した結果、1つに絞ることで経費削減に成功したそうだ。この傾向は、出版社だけでなく書店も同様に(私の知る限り、お取引する書店はどんどん少なくなっている)より強くなるのかのもしれない。

GOAジャーナルを刊行していないためか、OAジャーナルについて1段落ほど簡単に指摘がされている。GOAジャーナルは出版モデルのオルタナティブとして新しいビジネスモデルを牽引する一方、学術情報コスト削減にはあまり寄与していないということ。

e-resource usage analysis and statistics

気になったキーワードを調べる短記事シリーズ。
表題はキーワードではなくテーマです。

利用統計のためのアグリゲーション・ポータルにはどんなものがあるのかをまとめてみた。
新たなものが分かり次第、随時、追加するつもり。

参考にしたもの

Report on JUSP, KB+ and Intota Assessment – JISC HIKE Project
JISC HIKE Projectが、2015年6月に発表した、JUSP・KB+(の統計機能)・Intota Assessmentをレビューしたもの

E-resource usage statistics - ulms-analytics - CSU Library Spaces
2016年6月の記事。Colorado State Universityのライブラリアンたちの情報ウィキ(なのかな?)

Alma

Intota™ Assessment

  • http://www.proquest.com/products-services/intota-assessment.html 
  • ProQuest社
  • レビューによると「CPU(Cost per Use)」という項目が評価されている
  • しかしながら、ベンダーの壁という点でナレッジベースに若干の弱点あり(ProQuest製品以外が弱い)
  • 先行する360 CounterをEMSに組み込むかたち?
  • 冊子・電子・ILL、OA等も含む

LibAnalytics

JUSP

KB+

  • https://www.kbplus.ac.uk/kbplus
  • JISC Collections
  • JR1、JR1-JR1a、JR1GOA、JR1aが取得可能
  • レビューいわく、ここにJUSPの機能をまとめろという
    • AlmaやIntota™ Assessmentを考えるとそれもそうだ

WorldShare Management Services

IRUS-UK

  • http://irus.mimas.ac.uk/
  • JISC
  • 機関リポジトリの利用統計
  • これまでと毛色が異なるが、論文ごとにアクセス数が取れるということだろうか?
    • 近いところにいるJUSPはたしかタイトルレベルまでしかとれなかった…はず(うろ覚え)

Standardized Usage Statistics Harvesting Initiative (SUSHI)

気になるキーワードを調べる短記事シリーズ。もうちょっと続く。

Standardized Usage Statistics Harvesting Initiative (SUSHI)とは、米国情報標準化機構(NISO)のイニシアティブのひとつであり、COUNTER準拠の利用統計データを自動的にローカル・システムに取得できるプロトコル*1で、電子情報の利用統計データを自動的に収集するモデルを定義する。(ANSI/NISO Z39.93-2014)

Standardized Usage Statistics Harvesting Initiative (SUSHI) - National Information Standards Organization

最新版は、version 1.7(2014)で、昨年の1月にも改定されている。

NISO、SUSHIプロトコルを改訂 | カレントアウェアネス・ポータル


ちなみに『薬学図書館』を公開している、J-STAGEは数少ないCOUNTER準拠の日本語コンテンツである。

www.jstage.jst.go.jp

COUNTERは利用統計そのもの標準で、SUSHIはそれをネットワークを通じてローカルにダウンロードするときのプロトコル。COUNTER準拠の利用統計の取得が念頭に置かれているが、COUNTER準拠でないデータも対象範囲である。

このプロトコルは、出版社が標準フォーマット(COUNTER XML)で利用統計を提供するよう求める*2


ところで、先月に行われた電子書籍の利用統計についてのフォーラムの報告書「JUSP ebook discussion forum report」によると、最後に「XML does not match the SUSHI schema」という記述があった。これはどういうことなのだろう?XMLとSUSHI schemaが一致していない???

SUSHIのサイトに行って「About SUSHI Schemas」を読むと

SUSHI/COUNTER Schemas - National Information Standards Organization

SUSHIには3つのスキーマがあり、SUSHI Core Schema、COUNTER-SUSHI Schema、COUNTER reports schemaが存在する。まず、COUNTER reports schema はXML形式のCOUNTERレポートを作成する。

The two schemas with "sushi" in their name are basically retrieval envelopes for the XML-formatted COUNTER reports. The COUNTER XML schemas can be used separately from SUSHI by anyone who wants the reports in XML formats.

SUSHI Core Schemaは、互換性のあるXML形式の利用統計レポートを取得するよう一般化される(is generalized)。

The core SUSHI schema is generalized to retrieve any compatible XML formatted usage statistics reports.

COUNTER-SUSHI schemaは、core SUSHI schemaとともに、検索しに行く利用統計レポートがCOUNTERレポートであった場合に利用される。最新のCOUNTER準拠のXML形式の利用統計レポートのスキーマに一致するようにアップデートされる。COUNTERの実務指針のバージョンごとに、別々のスキーマが必要になる。

This schema is used with the core SUSHI schema if the usage reports to be retrieved are COUNTER reports. This schema is updated to match the most current version of the COUNTER XML reports schema and thus may have a higher version number than the core SUSHI schema. Each release of the COUNTER Code of Practice will require separate schemas.

XMLとSUSHI schemaが一致しない、というのは別々のスキーマ(separate schemas)が必要、ということなのだろうか…?つまりCOUNTERのバージョンによって、求められるCOUNTER-SUSHI schemaとcore SUSHI schemaが異なるということなのだろうか…?

翻訳の問題と、SUSHIに対する理解度の問題で、少しまだぼんやりとしている。

*1:伊藤 裕之「SUSHI (Standardized Usage Statistics Harvesting Initiative)」薬学図書館, 52(3) http://doi.org/10.11291/jpla1956.52.270

*2:William Hoffman「規格は利用統計の解読に役立つ」Standards: Standards help decode usage statistics http://www.openaccessjapan.com/resources/literature/-Standards%20help%20decode.pdf

Electronic resource management

気になるキーワードを調べる短記事シリーズ。

個人的な記憶だが、Electronic resource managementという単語を最初に聞いたのは、NIIによるERMSの実証実験だったような気がする。

www.nii.ac.jp

その後、勤め先でERMSを触る機会もなく、また全国にどんどん広がっているという話もあまり耳にせず(いくつかの大学では導入されているものの)、気になるような忘れかけていた。

昨日の記事の参考文献でもある「Electronic Resource Management Handbook」をざざっと見ていると、Electronic resource managementとはどんなものを含んでいるのか、がなんとなく見える(ような見えないような…)

www.uksg.org


そんな中で最近、第14回これからの学術情報システム構築検討委員会の議事録と配布資料を読んだ。

www.nii.ac.jp

配布資料には、何箇所か「ERM」についての言及がある。それによると、コンソーシアム版のERMの導入を検証するようである。単独で導入している機関はあるが単独導入できない機関でも、電子リソースの管理業務の合理化を図ることが狙いらしい。ただし、全国みんなで同じコンソ版を使う方向にするのではなく、(今現在)無いところでも使い物になるのか、というのが検証の要点。

コンソーシアムで購入していないパッケージのことをどこまで検討に入れるのか(管理する対象を広くすると仕様書が大変そう)等々、気になることも多く、今後の動向を追っていきたいと思う。

気になった話題その2。それでは商用ERMとコンソーシアム版はどう違うのか、まだぼやっとした理解しかないのだけど、コンソーシアムで電子リソースを購読しているのでそれらを管理(し、評価する)ツールは必要になるのだろう。そのためコンソーシアム(というかナショナルな)ERMが登場する。い一例として、英国のOpen Universityの事例報告を読んだ。

www.eventbrite.co.uk

スライド資料は以下より。

Events and Training :: Jisc Usage Statistics Portal

Open University*1は22スライド目から。Open Universityは2014年から、JUSPのデータをUStat(ExLibrisの統計ツール)に投入して分析をしているらしい。つまり、JUSP(ナショナルな統計管理サービス)のデータを、商用統計管理ツールで管理しているという。コンソーシアム版と商用版は使い分けがされているのだなということが垣間見えた。また、同大学では2015年からAlmaを実装を開始したそうだ。Almaとは冊子・電子などの媒体を問わず、図書館が扱う情報資料を単一のプラットフォームで管理する「次世代図書館サービスフレームワーク」らしい。*2*3*4


www.exlibrisgroup.com


現段階で分かる範囲をまとめてみた。

メーカー Ex Libris→ProQuest ProQuest EBSCO OCLC
ナレッジベース SFX KnowledgeBase Knowledge Works EBSCO Integrated Knowledge Base WorldCat Knowledge Base
Discovery Service Primo Summon EBSCO Discovery Service WorldCat Discovery Services
ERM Verde*5、Alma*6 360 Resource Manager ERM Essentials WorldShare License Manager

表のもとになったのは、2012年の図書館総合展の伊藤民雄さんの発表資料。

2012.libraryfair.jp

この表をアップデートさせるつもりだったが、買収があったり、Almaをどこに位置づけるべきか悩んだり、Electronic resource managementという概念もアップデートされているのかもしれない。このあたりをもう少し、整理したい。

*1:話はそれるがこの大学は面白そうだと思う。放送大学のモデルになった大学のようで、訪問してみたいと思いつつ、立地面から難しいそうだなぁと。難しかった。

*2:「Almaの近況」ユサコニュース 第248号 http://www.usaco.co.jp/itemview/template44_3_8562.html

*3:図書館システムベンダとユーザ会の共存―IGeLU大会<報告>カレントアウェアネス http://current.ndl.go.jp/e1489

*4:伊藤裕之「次世代型図書館業務管理システム「Alma」」薬学図書館 57(4) 

*5:2016.8.16追加。コメントよりVerdeの開発は終了しているそうなので二重線を入れた。

*6:Almaは図書館システム、ERMS、リゾルバを組み合わせたものなので正確にはここではない

SCONUL returnについてのメモ

いくつか気になるキーワードを調べる短め記事シリーズ。
前回がCOUNTERを概観したので、今回はSCONULreturn。

Society of College, National and University Libraries (SCONUL)は、英国・アイルランドの国立大学および国立高等教育機関図書館協会。

SCONUL | Society of College, National and University Libraries

そのSCONULに各大学(機関)が年に一回、報告しているのがSCONUL return。SCONULへの報告として、2004-5年から(2003-4年について遡って)電子情報資源の利用統計についての質問が追加された。*1

邦訳があったので(ありがたい)それを参照する。ちなみに原文へのリンクは切れている。

邦訳:SCONUL 加盟館の電子情報資源(e-Resources):統計が私たちに教えるもの

www.openaccessjapan.com

これによると、論文フルテキスト要求(Full-text Article Requests)と、電子ブックのアクセス数( E-book Accesses)という 「電子尺度」が追加された。これは、2003-5年にかけて行われた、「電子尺度プロジェクト(e-measures project)」の調査結果にもとづいている。電子尺度プロジェクトとは、

2003年から 2005 年にかけて HEFCE-funded Libraries: Outcomes and Measuresproject.の一部として中央イングランド大学のエビデンス・ベースが25の大学図書館と共に行なったプロジェクト。図書館の意思決定と利用者支援に援助し、電子情報サービス用の最新の一連の統計指標と尺度を開発し、SCOUNL と共同で電子情報サービス用の標準的なパフォーマンス指標として、高等教育図書館セクターでテストし、修正し、展開することを目的としていた。
http://www.ebase.uce.ac.uk/emeasures/emeasures

HEFCE(Higher Education Funding Council)とは、英国の高等教育機関への基盤的な経費を配分機関である。英国にはこのような助成機関がいくつか存在する。主たるものがRCUK(Research Counsils UK)とHEFCE。ほとんどが競争的配分であり、前年度の評価に基づいて各部局ごとに交付されるのが基本らしい。

電子尺度プロジェクト(e-measures project)とはCOUNTERとも関係する。COUNTERは2002年に設立されている。COUNTERの存在が彼らのプロジェクトを促進させるようであり、またCOUNTERに一致するようにも進められた*2

報告書でも指摘されているが、出版社やアグリゲータによって入手できる数値が異なっている、そもそもデータが入手できないという問題点も指摘されていた。
現在、SCONULreturnへはどのような統計データを報告しているかというと、JUSP上で専用のメニューとして用意されている。

jusp.mimas.ac.uk

報告用に学年暦であらかじめ期間がセットされ、COUNTER JR1に準拠したフルテキスト要求数がダウンロード可能。CSVでダウンロード可、JUSPにない出版社分はJR1形式で追加することで、SCONUL return用に簡単に編集できる、らしい。アグリゲータ系(ingentaconnect (Publishing Technology), SwetsWise and Ebsco EJS)は別メニュー。

*1:Conyers, Angela. e-Resources in SCONUL member libraries: what the statistics tell us. SCONUL Focus, No.36, Winter 2005, p.65-67.

*2:Conyers, Angela. "Usage statistics and online behaviour." Electronic Resource Management Handbook (2006) http://dx.doi.org/10.1629/9552448-0-3.2.1

Free UKSG webinar - COUNTER for Librarians

UKSG(United Kingdom Serials Group)が行っているwebinarを受講したので記録を兼ねて。

www.uksg.org


www.slideshare.net

テーマはCOUNTER(Counting Online Usage of NeTworked Electronic Resources)について。ざっくりした理解では電子リソースの利用統計の国際標準である。2003年から始まり、現在の最新版はCOUNTER4

www.projectcounter.org


COUNTERについて日本語で読める文献をいくつか。

CA1512 - 動向レビュー:電子ジャーナルの出版・契約・利用統計 / 加藤信哉 | カレントアウェアネス・ポータル
ci.nii.ac.jp
ci.nii.ac.jp


出力できるレポートは、標準13種類、オプション10種類。
おおまかにJournal, Databases, Books and Reference Works, Multimedia, Reports for a Library Consortiumの4つの利用統計レポートがあり、さらにその中で細かく分かれている。例えばJournalの場合...

Report Description Status Status
Journal Report 1 Number of Successful Full-Text Article Requests by Month and Journal Standard
Journal Report 1 GOA Number of Successful Gold Open Access Full-Text Article Requests by Month and Journal Standard
Journal Report 1a Number of Successful Full-Text Article Requests from an Archive by Month and Journal Optional
Journal Report 2 Access Denied to Full-Text Articles by Month, Journal and Category Standard
Journal Report 3 Number of Successful Item Requests by Month, Journal and Page-type Optional
Journal Report 3 Mobile Number of Successful Item Requests by Month, Journal and Page-type for usage on a mobile device Optional
Journal Report 4 Total Searches Run By Month and Collection Optional
Journal Report 5 Number of Successful Full-Text Article Requests by Yearof-Publication (YOP) and Journal Standard


最初にUKSGサイトで受講の登録をして、その時間帯(日本時間で何時かも分かるようになっている。この時は22-23時だった)になったら、スライドと音声による解説が始まる。チャット(らしきもの?)で質問も受けれるようだった。

ライブラリアン向けのCOUNTER入門ということで、最初にCOUNTERの概略が説明され、次にその重要性として

  • 異なる出版社間での比較が可能
  • 専門的な高度な知識を必要としないレポート
  • 操作性の高く分析しやすいデータ

電子リソースのライフサイクルに置いて、重要な位置をしめる「Evaluation」にCOUNTERは、電子リソースの購読・中止・更新の検討材料となる。それはユーザ(学生?)の満足度の向上へとつながる。

ただし、COUNTERレポート自体は、購読有無は加味せずに表示される。利用が0なのか非購読なのか、利用があったものについてもOAオプションによるものなのか購読によるものなのかは、レポートそのものからは読み取ることができない。

利用を継続して観察すること、利用数から単価を算出すること、アクセス拒否数などを総合的に判断することで、よりより評価が達成できる。

COUNTERという標準はあるものの複数の出版社から利用統計を集計することは煩雑になる。そこで…というながれで登場したのが、JUSP(Journal Usage Statistics Portal)。電子リソースの利用統計のポータルサイトサービスである。

JUSP :: Journal Usage Statistics Portal (Cloud)

JUSPについてはささっと触れられていた。

利用統計は電子リソースを評価するただひとつの方法としながらも、ニッチな需要、教育・研究方法の変化、ディスカバリーの重要さ((電子ブックは時に埋もれてしまっているという指摘もあった))、広い視点も考慮する点も指摘された。因果関係と定性データとともに利用統計を扱いましょうという締めで終わった。

Cited References Explorer(CRExplorer)を触ってみた

Web of Scienceからダウンロードしたデータを分析するソフトウェアCRExplorer公開 | カレントアウェアネス・ポータル

昨年のことになるが、Web of Scienceの分析・可視化ツールが公開された。Web of Scienceのデータ自体は自分で取得しなくてはいけないが、細かな技術知識無しに始められる手軽さがある。

まず、Cited References Explorerのサイトに行き

CRExplorer - Cited References Explorer

1もしくは2の方法で、Cited References Explorerを立ち上げる。

使い方はこちらを見ながら
[1601.01199] Introducing CitedReferencesExplorer (CRExplorer): A program for Reference Publication Year Spectroscopy with Cited References Standardization

Web of Scienceから取得するデータを抽出する

今回は仮に、ということで2種類のデータをダウンロードした。

1.NEJMのLETTER

検索項目: 出版物名: (new england journal of medicine)
絞り込み: ドキュメントタイプ: ( LETTER )
タイムスパン: 2015-2015.
合計709件(2016.4.3)

2.NEJMのREVIEW

検索項目: 出版物名: (new england journal of medicine)
絞り込み: ドキュメントタイプ: ( REVIEW )
タイムスパン: 2015-2015.
合計299件(2016.4.3)

マークリストに追加した後にダウンロードした。
WoSの検索結果画面表示が最大50件なので、1000件を越えるとしんどいなぁという感じがする。

f:id:klarer-himmel13:20160403001654j:plain

また、一度にダウンロードできる件数が最大500件なので、何回かに分けなくてはならない。やはり、一度にダウンロードするのは1000件未満が良いのか。(CRExplorer自体はデフォルトの最大インポートは10万件なので、他によい方法があるのかもしれない…)

ファイル形式は「他のファイルフォーマットで保存」>「テキスト」
出力項目は全項目。

f:id:klarer-himmel13:20160403003057j:plain

Cited References Explorerにデータを読みこませる

709件が引用した1985件がグラフ化する。
f:id:klarer-himmel13:20160403004554p:plain


被引用文献に出版年フィルターをかけたり、項目ごとにソートをかけることができる。
f:id:klarer-himmel13:20160403004926p:plain

任意のデータや、出版年を取り除くことも可能。
f:id:klarer-himmel13:20160403005423p:plain

左側のグラフは画像保存、右側のデータもcsvで保存可能。

LETTER(1991年以降)

f:id:klarer-himmel13:20160403173409p:plain

REVIEW(1991年以降)

f:id:klarer-himmel13:20160403173522p:plain

単純にグラフを生成するだけでも、REVIEWの方が幅広い年を引用している(だからこそのREVIEWなのだけど)ことが見て取れる。
また、709件で1985件の引用論文に対して、REVIEWは299件で2886件の引用論文と、1論文あたりの引用文献数もREVIEWの方が多い。

その他、Merge Cited References of the Same ClusterやCluster equivalent Cited Referencesによって、データ内の同一データを発見したり、マージすることができる。同一データの判定はレーベンシュタイン距離による、らしい。

CRExplorerに読み込むとClusterIDというものが付与される。これを使うことで表記のゆれを集約できる(赤い四角)…のか?
f:id:klarer-himmel13:20160403211347p:plain

このClusterIDは、Standardization>Cluster equivalent Cited Referencesを使うことで、レーベンシュタイン距離(上記の青い丸)、Volume、Page、DOIごとに変更することもできる。

また、任意の複数文献を選択して、Same・Different・Extractを指示し、ClusterIDを変更・修正することもできる。Differentを指示すると異なるsub-ClusterIDが割り当てられる。Extractを支持すると同一だったsub-ClusterIDから切り離される。Sameは同じsub-ClusterIDが割り当てられる。
例えばID=111を選択し(ClusterID=109/109であり、同一ClusterIDは3件)、Extractをクリックすると
f:id:klarer-himmel13:20160403212849p:plain

sub-ClusterIDが、109→111に変わり、ClusterID=109/111となる。
f:id:klarer-himmel13:20160403213041p:plain

自分が触ってみて理解できたところまでしか書けていないが、もう少しできるようになると面白いかもしれない。