研究データのメトリックスについて(最近よんだもの)
過去に何度か取り上げた利用統計から派生して、研究データにおけるメトリックスについて読んだ文献について2本ほど取り上げる。
大雑把な雑感
研究データにおけるメトリックス周辺の最近の動向をざっと追ってみた。
- Data Usage Metrics WG(RDAの下部WG)とMaking Data Countが主な登場人物
- ただし両者の関連がよく分からなかった
- citationとusageから総合的に考える
- 技術・インフラにおいては一定の成果をあげている(と評価されている)
- 次なる課題は研究データにおけるメトリックスとは何か(何を評価するのか)という点を研究者や研究コミュニティをともに考える段階にある
Bringing Citations and Usage Metrics Together to Make Data Count
Data Usage Metrics WGから見た、研究データのメトリックス、 Data Level Metrics (DLMs)に関するレビュー。CitationとUsageの動向、それらを総合的に活用するサービスがコンパクトに概観できる。
- Scholix
- 論文と研究データ(datasets)のリンキングのためのフレームワーク
- http://www.scholix.org/
- Scholixフレームワークを利用して、Crossrefは研究データを「Reference」「Relations」の2通りの方法で登録
- 出版者は論文と研究データをリンキングできる
- 日本語で読める概説
- 識別子
- 出版者は論文にCrossref DOI
- データリポジトリは研究データにDatacite DOI
- Event Data
- CrossrefとDataCiteによるデータの利用(リンク、引用など)を記述するAPIサービス
- https://www.crossref.org/services/event-data/
- COUNTER Code of Practice for Research Data
- 研究データの利用評価指標の実務指針
- https://www.projectcounter.org/counter-code-practice-research-data-usage-metrics-release-1/
- Dataciteではランディングページにおいて統計表示の前処理として活用されている
- Scholexplorer
- https://scholexplorer.openaire.eu/
- Scholix initiative (RDA and WDS)によるアグリゲーションサービス
- 文献と研究データ、研究データ同士の引用、リンク関係を一覧
- 書誌データをOpenAIRE、研究データをDatacite、そして上述のEventDataを通じて集約
Open Data Metrics: Lighting the Fire
Make Data Count が研究コミュニティに向けて研究データのオープン化と(再)利用の促進を目的として書かれた入門書。現状、研究データや研究データのオープン化自体が評価対象ではなく、オープン化するインセンティブがないという課題から、研究データのメトリックスについて利用統計と引用について解説してある。先行事例として下記を紹介。
- Dryad
- 自然科学、生命科学を中心としたデータリポジトリ
- https://datadryad.org/stash
- COUNTER Code of Practice for Research Data実装済み
- DataONE
- 地球科学分野の研究データアグリゲータ
- https://www.dataone.org/
- COUNTER Code of Practice for Research Data実装済み
面白かった箇所。"What we mean by data usae and data citation?"において、Data usageとData citationが定義・解説されている。Data usageはviews と downloadsを数えるもので、それの標準がCOUNTERである。そうでなければ異なるリポジトリ間で比較できないだけでなく、アグリゲータ内、ミラーサイトと本体同士で数字が持つ意味が変わってきてしまう。Usageそれ自体はメトリックスではなく、どう発展させるかという課題がある。
Data citationは古くからそれぞれの分野で検討されてきているが、文献とデータセット、データとデータ間の単なるリンク関係よりも広げて考える必要がある。バージョンやデータの包含関係という特徴から、文献同士のcitationをそのまま援用は出来ないし、Data citationがメトリックスにとってどういう意味を持つかは検討する必要がある。
Igniting Change: Our Next Steps Towards Open Data Metrics
MDCの次なるステップが先日、発表された。チームにあらたにCrossrefとBibliometriciansであるDr. Stefanie Haustein (University of Ottawa, Co-Director ScholCommLab) と Dr. Isabella Peters (ZBW – Leibniz Information Centre for Economics) を迎え入れる。
http://www.scholcommlab.ca/research/data-citation/
次なる目標は下記の通り(翻訳は簡易なもの)
- Increased adoption of standardized data usage across repositories through enhanced processing and reporting services(標準化されたデータの利用統計が処理/レポート作成サービスの強化によって増えること)
- Increased implementations of proper data citation practices at publishers by working in conjunction with publisher advocacy groups and societies(適切なデータの引用の慣習が、出版社のアドボカシー・グループや学協会と連携することにより実装(実践?)されるようになること)
- Promotion of bibliometrics qualitative and quantitative studies around data usage and citation behaviors(データの利用統計と引用慣習に関する計量的・定性的研究の推進)