データライブラリアンとその育成:ラーニングコモンズとDigital Scholarship,オープンサイエンス

日本の大学図書館による研究データ管理や研究支援は,分野の専門知識を持つサブジェクトライブラリアンの育成が課題となっています。しかし,サブジェクトライブラリアンの本家である米国のDigital Scholarship Commons/Centerや研究支援,研究データ管理サービスにおいても,サブジェクトライブラリアンが全ての業務を行うのではなく,ポスドクや教員と連携してサービスを提供しています。日本の図書館も,こうした人的ネットワークを構築することによって,効率的に研究データ管理サービスが実現できるのではないでしょうか。

2015年度の学術情報基盤実態調査によれば,411大学(57%)にアクティブラーニングスペースが設置されています。公費をかけたラーニングコモンズを最大限に活用するために,研究データ管理や機関リポジトリのコンテンツ登録,3Dプリンタなどのデジタル機器と支援サービスを集約した「オープンサイエンスコモンズ(研究の場としての図書館)」構想を提案しました。

着想のきっかけは「日本にも,Digital Scholarship Commons/Centerはありますか?」というお尋ねでした。回答メールを書きながら,常々考えていた以下の課題に対応できるかも,と妄想をふくらませていった感じです。

  • 海外でもオープンサイエンス,オープンアクセスの意義を伝えるアドボカシー活動に苦慮している
  • 海外でも機関リポジトリにコンテンツ(データや論文)を集めるのに苦慮している
  • 日本の6割近くの大学にラーニングコモンズが設置されたので,施設が新しく注目が集まっているうちに図書館のブランディング戦略を進めてはどうか(図書館が最先端の研究リソースを持つ場になってほしい)(おしゃれなカフェよりも,MIT Media Labのような空間を目指したい)

以下は,2016年6月5日に開催された,日本図書館協会(JLA)図書館情報学教育部会 2016年度研究集会基調講演のスライドと抄録です。参加された先生方からは貴重なコメントを頂戴し,大変勉強になりました。改めてお礼申し上げます。


1. データと図書館

「ビッグデータ」はバズワードから一般用語として定着しつつあり,次の段階として多様なビッグデータを分析して活用する「データサイエンス」への関心が高まっています。2015年11月に総務省が日本版MOOCのgaccoで開講した「社会人のためのデータサイエンス入門」には2万人を超える受講者が集まり,滋賀大学は2017年に日本初のデータサイエンス学部を開講する予定です。もちろん海外でもデータサイエンティストの需要は高く,2016年8月にはイリノイ大学アーバナシャンペーン校がデータサイエンス修士課程のオンラインコースを開講します。修士号取得に必要な32単位の受講料は通学課程よりも安く―といっても19,200ドルですが―多くの学生が集まるのではないでしょうか。開始時の受講者は150名を想定しているそうです。

日本では,2013年のG8オープンデータ憲章を契機に産官学のデータの整備と公開が進んでいます。NIIの情報学研究データリポジトリでは,Yahoo!や楽天などの企業が研究者向けに提供するデータセットを公開していますし,2013年に開設されたdata.go.jpでは,行政機関の統計データなどを一覧できます。政府のオープンデータは世界的な潮流となっていて,Open Knowledge Foundationは,各国の政府データの公開度を示すGlobal Open Data Indexを毎年公表しています。そして本日のメイントピックである研究データも,バイオや地球環境,社会調査をはじめとした多くの分野で急速に公開が進んでいます。

こうしたオープンデータと図書館の関わりとして,公共図書館による市民のオープンデータ作成支援,国立国会図書館による書誌データやアーカイブのオープン化などが行われており,カーリルのように図書館の所蔵データを用いたサービスも登場しています。ここでは,研究データの公開と大学図書館についてご紹介します。

2. オープンサイエンスの潮流と大学図書館

研究データの公開や論文のオープンアクセスなど,インターネット上で科学的な知見を広く共有する取り組みの総称として「オープンサイエンス」という用語が定着しつつあります。2015年に欧州委員会が公開した「Science 2.0に関するパブリックコンサルテーション」の最終報告書では,「オープンサイエンス」という用語が調査対象者に最も好まれていたため,標題が「Science 2.0」であるにもかかわらず,本文では「オープンサイエンス」を採用しています。EUはオープンサイエンスの推進に積極的で,欧州オープンサイエンスクラウド(EOSC)の構築を進めています。EOSCは研究データの管理・分析・再利用のための無料の公開データストレージで,欧州の研究者170万人,科学技術専門家7,000万人を対象としているそうです。

なぜ,多額の費用をかけて研究データ共有を推進するのか。その目的として,(1)地球規模の課題を効率的に解決すること,(2)研究開発費の節減,(3)追試や検証を可能にして透明性を高めること,(4)異分野データの統合により新たな知見を生み出すこと,(5)市民科学の拡大などが挙げられます。また,データの長期保存も重要な論点です。2016年の研究開発費はトップ40か国で1兆8,867億ドルにのぼると予測されていますが,莫大な公的資金をかけて生み出された研究データであっても,適切に保存されなければやがて失われてしまいます。オーストラリアの国立データサービス(ANDS)のための試算によれば,公的な研究データの価値は19億から60億ドルにのぼり,リポジトリの価値は18億から55億ドルと見積もられています。オーストラリアは国を挙げてデータ公開に取り組んでいますが,現状ではその10%から20%しか整備・共有されていないそうです。

こうした背景から,各国政府によるデータ公開の義務化が相次いでいます。具体的には,助成機関に研究資金を申請する際に,データを公開するための「データ管理計画(Data Management Plan)」の提出を義務付ける例が増えています。また,学術雑誌が論文の根拠となるデータを公開するよう投稿規定で定める例も増えています。しかし,これまでデータ公開の経験がなかった研究者にとっては,データの整備やメタデータの付与,公開先リポジトリなどが問題となります。そこで,機関リポジトリの運営や利用者教育の経験を持ち,学術情報流通の動向に明るい大学図書館が研究データ管理サービスに乗り出しています。

公開された研究データの流通を促進し,研究者にインセンティブを付与するために,データにDOIのような識別子を付与して論文のように追跡や引用を可能にする仕組みの整備,メトリクスの開発が進んでいます。また,データの対象や処理手順などを簡潔に記載した「データ記述」を掲載するデータジャーナルの刊行も相次いでいます。

ここで日本の状況に目を向けると,2013年度から博士論文の公開が義務化されたことによって機関リポジトリの数が増加しています。OpenDOARの統計によれば米国,英国に次ぐ世界3位で,京都大学筑波大学など「オープンアクセス方針」を制定する研究機関も登場しています。今後の課題としてコンテンツの充実が挙げられるでしょう。研究データの公開は義務化されていませんが,2015年に公開された内閣府「国際的動向を踏まえたオープンサイエンスに関する検討会」の報告書や第5期科学技術基本計画などに重要課題として盛り込まれています。

3. 研究データ管理とデータライブラリアン

データライブラリアンは,リサーチライブラリアンやデータキュレーターといったさまざまな呼び名があり,その業務内容も多岐にわたりますが,ここでは多くの文献や事例報告に共通する職務として,「研究データ管理」と「研究者へのガイダンス」を挙げます。「研究データ管理」の具体的な内容は,(1)助成機関に提出する「データ管理計画」の作成支援,(2)データ整備,(3)メタデータの作成,(4)著作権や知的財産権の管理,(5)セキュリティやプライバシーの管理,(6)DOIや研究者番号といった識別子の付与,(7)保存などで,「研究者へのガイダンス」にはデータ管理のためのトレーニングと,オープンサイエンスの動向や重要性を伝えるアドボカシー活動が含まれます。

こうした業務の前段階,すなわち図書館が研究データを扱うための第一歩として,対象となる研究者が研究過程でどのようなデータを作成して公開・保存するのかを知る必要があります。日本でも取り組みが始まっていて,2015年の秋にデジタルリポジトリ連合(DRF)が「研究データから研究プロセスを知る」というワークショップを開催し,複数分野の研究者にインタビューをした結果を公開しています。

さて,研究の成果を論文として発表するように,研究データを公開することは,やがて通常の科学の過程になると指摘されています。実際,この夏に開催される全分野の研究者を対象とした「研究データサイエンスサマースクール」の入門編カリキュラムには,データを扱うための大規模データベースの構築や機械学習などに加えて,オープンサイエンスの理論や動向を解説する講義が含まれています。データの操作や公開を,あらゆる分野の研究者の基礎的なスキルにすることを目指しているそうです。

サーチャーの時代』が書かれた1980年代には,図書館員がオンラインデータベースの代行検索を行うことが一般的でした。しかし,現在の図書館員の仕事はガイダンスやパスファインダーなどによる紹介に留まり,利用者自身がPCやスマートフォンで自由に学術情報を検索しています。研究データについても,やがて研究者が容易に管理・公開するツールが登場し,利用者が自在に活用できる時代が来るでしょう。データライブラリアンの職務も,時代にあわせて検討する必要があると考えられます。

4. 海外の育成事例

データライブラリアンを育成するために,海外では大学・大学院生や現職の図書館員を対象とした教育が行われています。大学(院)のカリキュラムの他に,誰でも参加可能なMOOCやOCW(オープンコースウェア),Webinar(Webセミナー)が多数公開されています。

カリキュラムの内容をみると,データのストレージやシステム,メタデータ,ディスカバリー,保存など,これまで電子図書館やデジタルアーカイブのために開講されてきた内容と重なっています。しかし,研究データを扱うためには各分野の専門知識も必要です。サブジェクトライブラリアンの伝統がある米国においても,研究データを扱うための専門知識を備えた人材の育成は課題とされています。一つの解として,ピッツバーグ大学図書館情報学修士課程では「研究データ管理」と「研究データインフラストラクチャ」の2科目で,学生が研究の現場に赴くコマを設けています。学生の理解に役立つのはもちろんのこと,研究者からも「データの組織化について勉強になった」「助けになることが分かった」といったリアクションが寄せられているそうです。

データライブラリアンのキャリアパスの議論では,「研究者が図書館員になる」,逆に「図書館員が新たな学位を取得して分野の知識を身につける」という2通りの方法がしばしば提案されます。しかし,これらは研究者にとって魅力的な,また,現職の図書館員にとって効率的なキャリアパスとはいえないかもしれません。別のアプローチとして,研究データ管理を担う研究者が―それは若手研究者であることが多いのですが―リポジトリ管理などの業務で得た知見を学会や論文で発表して業績とする例があります。SSCIにも収録されているDigital Scholarship in the Humanities誌は,オックスフォード大学の図書館員らが中心となって立ち上げたそうです。データライブラリアンを魅力的なポジションにするためには,こうした戦略も必要でしょう。

5. 日本における実践

2015年に内閣府が公開した報告書『我が国におけるオープンサイエンス推進のあり方について〜サイエンスの新たな飛躍の時代の幕開け〜』では,“技術職員,URA,大学図書館職員等を中心としたデータ管理体制を整備できるように,データサイエンティストやデータキュレーターなどを研究新人材として位置づけられるよう,包括的な育成システムを検討し,推進することが必要である”とされています。研究データ管理体制の確立は,大学のグローバル化の観点からも迅速に対応する必要があると考えられます。

データライブラリアンの育成は,米国や欧州のみならず,アジア,アフリカ地域においても盛んです。本日紹介してきた多種多様な英語教材は,CC-BYなど緩やかなライセンスで公開されているため,特に英語圏で対応が速いと感じます。たとえば2015年2月の国際会議に「これから研究データ管理サービスを立ち上げるため」参加していた南洋理工大学のライブラリアンは,英語の教材を駆使して同年にサービスを開始しました。研究データ管理が図書館の標準的なサービスになる場合,日本でも同様のサービスを提供することが望ましいでしょう。そこで日本における実践に向けて,日本語教材の開発と「オープンサイエンスコモンズ」による研究データ管理体制を提案したいと思います。

2016年6月現在,翻訳版の日本語教材として,機関リポジトリ推進委員会によるNISOの『研究データ管理』や,東京大学社会科学研究所附属社会調査・データアーカイブ研究センターによるUK Data Archiveの『データの管理と共有』が公開されています。このように,図書館員や研究者に向けて教材を翻訳したり,日本の義務化状況や著作権にあわせた教材を作成したりすることが急務であると考えられます。

「オープンサイエンスコモンズ」は,ラーニングコモンズにデジタル機器を備え,さらに研究データ管理や機関リポジトリへの登録をワンストップで提供するサービスポイントとして構想しました。ラーニングコモンズが盛んな米国では,最近,デジタル研究に関連する機器を備え,支援を行うDigital Scholarship Commons/Centerが増えています。College and Research Libraries News誌の「2016年の学術におけるトップトレンド」では,研究データサービス(RDS)やRDSの人材育成と並んで「digital scholarship」が挙げられています。digital scholarshipはデジタルヒューマニティーズに関連の深い用語でしたが,STEM分野も加わり,さらにコモンズでデジタル機器に加えて研究データ管理やオープンサイエンスに関わる支援サービスを提供する大学もみられます。

日本でも,3Dプリンタなど最新の機器を備えた大学図書館の事例が散見されますが,「大学図書館はデジタル研究環境を提供している」というイメージの醸造には至っていないと思われます。そこで,たとえば「オープンサイエンスコモンズ」という名のもとに各種サービスを提供して,「研究のことは図書館へ」「デジタルといえば図書館・コモンズ」「’研究の’場としての図書館」といったイメージ戦略を取ることによって,研究者にオープンサイエンスへの理解を促すアドボカシー活動をスムーズに進められるのではないでしょうか。利用者は図書館・コモンズに行けば研究・学習に必要なサービスをワンストップで受けることができ,図書館員は効率的にリポジトリのコンテンツを集めることができると考えられます。

日本の大学図書館による研究支援はサブジェクトライブラリアンの育成が課題とされてきましたが,米国のコモンズや研究データ管理でも,ポスドクや教員,関連部署と連携してサービスを行っています。2015年度の『学術情報基盤実態調査』によれば,全国779大学のうち411大学に「アクティブラーニングスペース」が設置され,図書館員だけではなく教職員や学生スタッフによって運営されています。新しく設置され,注目を集めているラーニングコモンズを活用し,学内の専門家と連携することで,研究データ管理サービスを効果的に実現できるのではないでしょうか。

D’où venons-nous? Que sommes-nous? Où allons-nous?

 


追記(2016/10/11)

日本図書館協会図書館情報学教育部会『会報』115号(2016年7月)に,講演の様子と質疑や感想を掲載していただきました。ありがとうございました。


コメントを残す

メールアドレスが公開されることはありません。