ますます盛んになる研究データの公開と共有。2012年11月にはData Citation Index(Thomson Reuters)も登場し,2013年5月現在,合計262万レコード(自然科学分野(80%),社会科学分野(18%),人文・芸術分野(2%))が収録されているとのことです。
さて,先行研究によって,データの共有を進展させる,または阻害するさまざまな要因が示されています。では,何に注力すれば(もしくは改善すれば),研究者がより多くの研究データを公開するようになるのでしょうか? これを推測統計によって示した論文の紹介記事を,カレントアウェアネス-Eに掲載していただきました。
E1452「研究者による研究データ共有の決定要因は何か<文献紹介>」カレントアウェアネス-E. 2013.7.11. No. 240.
データの公開と共有やデータキュレーションに関心がある方は,まずこの論文を読むことをおすすめします。54本の文献を丹念にレビューしています。
Sayogo, Djoko Sigit; Pardo, Theresa A. Exploring the determinants of scientific data sharing: understanding the motivation to publish research data. Government Information Quartery. 2013, Vol. 30, Supplement 1, p. S19-S31.
結論の一つとして,「研究データを再利用する際の適切な引用によってデータ公開が進む」と述べられています。しかし,引用は本当に効果的なのでしょうか?
研究データへのアクセス向上を目指すDataCiteは,データを論文や図書のように引用する理由として,次の3点をあげています。
- データを簡単に再利用したり確認できるようにする
- データを追跡可能にして影響を計測できるようにする
- データの作成者を明らかにして称賛する学術構造を作る
確かに,冒頭にあげたData Citation Indexなどが整備され,論文の引用頻度と同様に「データの引用頻度」が研究者の評価指標となれば,データ公開のインセンティブとなりそうです。
なお,記事でもご紹介した通り,この論文自体が先行研究のデータを「再利用」して分析し,新たな知見を加えています。もちろん,謝辞,引用文献リスト,そして本文で引用したデータについて触れています。
元論文は,Tenopirらによる”Data sharing by scientists: practices and perceptions“で,本ブログでも紹介したNatureの記事にも引用されています。
DataCiteについて
DataCiteは2009年に英国図書館をはじめ米国や欧州の図書館関連機関によって設立され,アジアでは中国,韓国,タイの組織が参加しています。その主な活動は,メンバー機関の研究者による公開データへのDOI付与,メタデータスキームの構築,メタデータ検索や統計データの公開などです。
こうした世界的な動向を視野に入れつつ,研究データ共有の実態や阻害要因を明らかにしていきたいと思います。