情報組織化研究グループ月例研究会報告(2015.6)

国立国会図書館におけるLinked Open Dataの取組

橋詰秋子(国立国会図書館)


日時:
2015年6月20日(土) 14:30〜17:00
会場:
大阪学院大学
発表者 :
橋詰秋子氏(国立国会図書館)
テーマ :
国立国会図書館におけるLinked Open Dataの取組
共催:
書誌コントロール研究会(科学研究費基盤研究(C) 課題番号25330391 研究代表者:和中幹雄)
出席者:
安東正玄(立命館大学)、尾松謙一(奈良県立大学附属図書館)、川崎秀子、河手太士(静岡文化芸術大学)、古賀崇(天理大学)、塩見橘子(立命館大学非常勤)、佐藤久美子(国立国会図書館)、篠田麻美(国立国会図書館)、高城雅恵、田窪直規(近畿大学)、田村俊明(紀伊國屋書店)、日吉宏美(神戸大学)、福山樹里、藤倉恵一(文教大学)、堀池博巳、松井純子(大阪芸術大学)、南波佐間望、横谷弘美(大手前大学)、渡邊隆弘(帝塚山学院大学)、和中幹雄(大阪学院大学)、橋詰<21名>

 国立国会図書館ではこれまでも、NDLサーチ、Web NDL Authorities、「ひなぎく」(東日本大震災アーカイブ)などの各システムでRDF形式のデータをAPIで提供してきたが、2014年度から全館的な観点でLOD(Linked Open Data)の提供・促進に取り組むことになった。今回の月例研究会では、その経緯・現状・課題やLOD作成の実際についてご発表いただくとともに、JLAとの共同研究である日本十進分類法のLD(Linked Data)化についてもご報告いただいた。

1. 図書館とLinked Open Data

 図書館におけるLinked Dataの取組 には、次の二つの側面がある1)。すなわち、a.公共機関のオープンデータとしての側面、b.セマンティックウェブ時代の書誌コントロールとしての側面、である。aは、オープンガバメントに代表される、公共機関が保有する情報のオープンデータ化である。bは、全国書誌や典拠データのLD化、あるいはBIBFRAMEの開発に見られるLDを基盤とする目録作成の新たな枠組みの構築である。NDLの取組にも両面があるが、今回発表するのは、aについてである。

2.国立国会図書館のLODの取組

 2014年度にまず現況調査を行い、NDLにおけるLODの課題と改善策を整理した。課題は、次の4項目に整理することができた。(1) 認知度の低さ、(2) データ利活用のしにくさ、(3) LODとしての内容の不十分さ、(4) 他データのLODでの提供への期待。
 これらの改善策として、NDLが提供するLODのデータソースや利用条件等を分かりやすく紹介するページを2014年9月に開設した2)。そこでは、以前からRDF形式でデータ提供を行っていたNDLサーチの書誌データ、Web NDL Authoritiesの典拠データ、「ひなぎく」の震災関連データについて、一括ダウンロード用のファイルを用意したり、RDF以外のデータ形式での提供を行っている。また、「非営利目的であれば申請なしでAPIによるデータの取得が可能」という利用条件を明記した。
 さらに、上で取り上げたデータ以外にも、各種コード類のLOD提供を目指すこととした。一つはISIL-LODの作成である(詳細は次の3.を参照)。またJLAとの共同研究ではあるが、NDC新訂8版と新訂9版の機械可読データファイル(MRDF8、MRDF9)のLD化の研究に着手している。
 それから、データ利活用の促進のためのイベントの実施または参加がある。例えば、今年2月21日の「インターナショナルオープンデータデイ」には、「国立国会図書館のウェブページを使い尽くそうアイデアソン」を開催し3)、好評を博した。

3.ISIL-LODの作成試行

 ISILとは「図書館及び関連組織のための国際標準識別子」のことで、もともとNDLが登録・管理業務を担っていた。国内の図書館の名称・所在地などの情報をISIL-IDとともに記載した既存台帳のデータ7500件をLOD化し、2015年4月から試行提供している。ISIL-LODの作成試行によりLOD化のノウハウを得るとともに、その課題を明らかにすることを目的とした。LOD化の手順は次のとおり。
 (1) 諸外国のISIL-LODの先行事例を調査、(2) データモデルの作成、(3) 外部データの追加、(4) データのクレンジング、(5) データのRDF/XMLへの変換と変換データの検証、(6) 公開方法の検討・調整、(7) 利用条件とライセンス表示の調整。
 (3)はOpenRefineを用いて緯度経度情報や統計センターの標準地域コード、NII総合目録データベースの図書館IDなどを追加したが、そのためには(4)データの修正・正規化が必要であった。(5)の変換もOpenRefineを用いて行った。(6)では、全館的なURI体系方針を策定した。(7)では、全館的な方針によるライセンス表示が困難なため、試行としてクリエイティブコモンズの「パブリックドメインマーク」を付与することとした。今回の試行により、データの信頼性・継続性をどう担保してシステムやURIを設計するかなど、いくつかの課題が指摘された。

4.NDC-LDに係るJLAとの共同研究

 まずDDC、LCC、UDC各々のLDについて先行事例調査を行ったところ、LD化の範囲やライセンスの設定が異なり、三者三様であることがわかった。他方、NDC-LDはどのような方針でどのような使い方を目指すのかが課題である。

5.まとめ:取組を通じて気づいたこと

 1.で述べたLD化の二つの側面とは、使用する者のニーズの違いと理解できる。つまり「オープンデータとしての側面」では、アプリ開発者などが一次データのオープンデータ化を期待するもので、精緻に構造化されたLDを必ずしも求めないが、「書誌コントロールとしての側面」では、図書館員がメタデータとしてのあり方を重視するため、精緻に構造化されたLDを期待する。  オープンデータ化の動きは、図書館の意義や効果をアピールするよい機会であり、また他機関と比較してLD化しやすい構造化されたデータを持つ図書館は有利ではないか、との考えを最後に述べた。

 質疑応答では、NDLの取組を国際的に拡大する方策、NDLの全館的なライセンス表示方針の考え方や、URIの設定方法など、多くの質問が出された。

(記録・文責:松井純子 大阪芸術大学)

1)橋詰秋子「なぜ図書館はLinked Dataに取り組むのか:欧米の事例から」『情報管理』58(2), 2015.5, p.127-134. https://www.jstage.jst.go.jp/article/johokanri/58/2/58_127/_pdf
2)「使う・つなげる:国立国会図書館におけるLinked Open Data(LOD)とは」http://www.ndl.go.jp/jp/aboutus/standards/lod.html
3)http://lab.ndl.go.jp/cms/?q=opendata2015