情報組織化研究グループ月例研究会報告(2014.10)

「つながるデータ」へ向けた研究情報の提供:農業情報を事例として

林 賢紀(国際農林水産業研究センター)


日時:
2014年10月25日(土) 14:30〜17:00
会場:
弁天町ORC200生涯学習センター
発表者 :
林 賢紀氏(国際農林水産業研究センター)
テーマ :
「つながるデータ」へ向けた研究情報の提供:農業情報を事例として
出席者:
稲葉洋子、尾松謙一(奈良県立大学附属図書館)、川崎秀子、河手太士(静岡文化芸術大学図書館)、川畑卓也(奈良県立図書情報館)、九野せえぬ(プール学院大学)、古賀崇(天理大学)、阪上宏一(枚方市立中央図書館)、塩見橘子、長坂和茂(京都大学)、西川真樹子(京都大学)、堀池博巳、松井純子(大阪芸術大学)、村上健治(滋賀医科大学)、横谷弘美(大手前大学)、渡邊隆弘(帝塚山学院大学)、和中幹雄(大阪学院大学)、林<18名>

はじめに

 近年、図書館等が持つ種々のデータをLinked Open Data(LOD)化し、つながるデータとして活用する事例が見られるようになった。
 今回は、農業情報とLOD化のためのデータ入力手法や、他の情報資源とリンクした文献データベースAGRISによるリッチな情報提供、シソーラスであるAGROVOC、書誌データのLOD化のための勧告LODE-BD (Linked Open Data(LOD)-enabled bibliographical data)など、国連食糧農業機関(FAO)の取り組みについて、その概要を具体的に紹介していただいた。また、国内の書誌データ、研究データ等との連携の可能性について紹介していただいた。

1.FAOの役割

 全体として、AGRISデータベースの構築とサービスにおけるFAOの役割は、次の3つの柱からなる機能およびツールなどが提供されている。

(1) ルールの整備
  • メタデータ語彙(AGRIS Application Profile)
  • シソーラス(AGROVOC)
  • 書誌記述の勧告(LODE-BD)
(2) ツール提供
  • AgriMetamaker(小規模なメタデータ作成)
  • AgriDrupal(Webサイト構築)
  • AgriOcean DSpace(機関リポジトリ構築)
(3) ポータル構築
  • AIMS(Agricultural Information Management Standards)

2.AGRISデータベース構築と検索結果

 AGRISは、FAOが管理する農業関連の国際的な書誌情報データベースである。データベースの構築は1979年から開始され、現在65か国150以上の機関が参加。日本の国内文献は農林水産研究情報総合センターから年間約7,000件が提供されている。
 データは各国のインプットセンターで自国の文献を収集することが基本で、機関リポジトリ構築としている国もある。これをFAOがOAI-PMHなどで収集している。FAOでは収集したデータをデータベース化するとともに、自動的にLinked Open Data化も合わせて実行し、他の情報資源(地球規模生物多様性情報機構(GBIF)の遺伝情報、世界銀行の統計、DBpedia)にリンクし、つながるデータとしている。
 AGRISの検索結果の実例紹介では、あるキーワードから結果表示画面で横3段に区分された表示が行われ、左側から一般的な検索結果の「該当文献と抄録」を表示、真中にGoogleによる関連文献情報を表示、右側にLODのリンク先のGBIF上の遺伝資源情報が表示され、ディスカバリーサービス的な情報提示になっていて、より豊富な情報に接することが可能であると紹介された。
 メタデータ作成では語彙としてAGRIS Application Profileを作成し、標準的な語彙はDublin Coreを、AGRIS特有の語彙はAgMES(Agricultural Metadata Element Set)、位置情報の記述としてオーストラリア政府作成のAGLSを使用する。

3.農学分野のシソーラスAGROVOC

 AGROVOCは1980年代から運用され、2009年にLOD化された。現在、日本語を含む21言語、3.2万ワードが蓄積されている。1つの語でも、多数の言語表現が検索できるので、データベース検索時には大変便利であると紹介された。

4.書誌情報の入力ツール

 FAOから様々な入力ツールが提供されている。いずれもAGROVOCやAgMESを標準で利用できるようにカスタマイズ等されているのが特徴である。

5.書誌情報のLOD化とLODE-BD 勧告の概要

 LODE-BDは共有可能な書誌情報作成に適したLODによるコーディング(符号化)の支援がまとめられた勧告文書。文書は概要、General Recommendations、Decision Trees、References、Appendixesから構成されている。
 また、タイトルなどの各項目の記述方法はフローチャート(流れ図)で示された記述内容の決め方に沿って入力することが求められているが、比較的分かりやすそうに見えた。入力データは、文字列で入力することが求められる場合と、URIで入力すること(LOD化するためには重要な情報表現である)が求められる場合がある。

6.まとめ

 農業情報提供に関するFAOの取り組みの概要や書誌情報のデータ入力方法など、種々の枠組みについて紹介していただいた。今後の活用として、シソーラスAGROVOCを介した様々な情報資源とのリンクを通じて、LCSHやDBpediaなどのデータセットを介したさらなるデータ連携が可能ではないか。また、CMSのAgriDrupalはLODの学習や評価などに利用できるのではないか、といったことも紹介された。また、多数の質疑応答があった。

(記録文責:堀池博巳)

当日の資料
スライド資料(http://www.slideshare.net/TakanoriHayashi1/20141025-41330695