klarer-himmel13's diary

(旧)図書館の中では走らないでください!から

研究データのメトリックスについて(最近よんだもの)

過去に何度か取り上げた利用統計から派生して、研究データにおけるメトリックスについて読んだ文献について2本ほど取り上げる。

datascience.codata.org

doi.org

大雑把な雑感

研究データにおけるメトリックス周辺の最近の動向をざっと追ってみた。

  • Data Usage Metrics WG(RDAの下部WG)とMaking Data Countが主な登場人物
    • ただし両者の関連がよく分からなかった
  • citationとusageから総合的に考える
  • 技術・インフラにおいては一定の成果をあげている(と評価されている)
  • 次なる課題は研究データにおけるメトリックスとは何か(何を評価するのか)という点を研究者や研究コミュニティをともに考える段階にある

Bringing Citations and Usage Metrics Together to Make Data Count

Data Usage Metrics WGから見た、研究データのメトリックス、 Data Level Metrics (DLMs)に関するレビュー。CitationとUsageの動向、それらを総合的に活用するサービスがコンパクトに概観できる。

Open Data Metrics: Lighting the Fire

Make Data Count が研究コミュニティに向けて研究データのオープン化と(再)利用の促進を目的として書かれた入門書。現状、研究データや研究データのオープン化自体が評価対象ではなく、オープン化するインセンティブがないという課題から、研究データのメトリックスについて利用統計と引用について解説してある。先行事例として下記を紹介。

面白かった箇所。"What we mean by data usae and data citation?"において、Data usageとData citationが定義・解説されている。Data usageはviews と downloadsを数えるもので、それの標準がCOUNTERである。そうでなければ異なるリポジトリ間で比較できないだけでなく、アグリゲータ内、ミラーサイトと本体同士で数字が持つ意味が変わってきてしまう。Usageそれ自体はメトリックスではなく、どう発展させるかという課題がある。
Data citationは古くからそれぞれの分野で検討されてきているが、文献とデータセット、データとデータ間の単なるリンク関係よりも広げて考える必要がある。バージョンやデータの包含関係という特徴から、文献同士のcitationをそのまま援用は出来ないし、Data citationがメトリックスにとってどういう意味を持つかは検討する必要がある。

Igniting Change: Our Next Steps Towards Open Data Metrics

MDCの次なるステップが先日、発表された。チームにあらたにCrossrefとBibliometriciansであるDr. Stefanie Haustein (University of Ottawa, Co-Director ScholCommLab) と Dr. Isabella Peters (ZBW – Leibniz Information Centre for Economics) を迎え入れる。

makedatacount.org

http://www.scholcommlab.ca/research/data-citation/


次なる目標は下記の通り(翻訳は簡易なもの)

  1. Increased adoption of standardized data usage across repositories through enhanced processing and reporting services(標準化されたデータの利用統計が処理/レポート作成サービスの強化によって増えること)
  2. Increased implementations of proper data citation practices at publishers by working in conjunction with publisher advocacy groups and societies(適切なデータの引用の慣習が、出版社のアドボカシー・グループや学協会と連携することにより実装(実践?)されるようになること)
  3. Promotion of bibliometrics qualitative and quantitative studies around data usage and citation behaviors(データの利用統計と引用慣習に関する計量的・定性的研究の推進)