国立国会図書館ではこれまでも、NDLサーチ、Web NDL Authorities、「ひなぎく」(東日本大震災アーカイブ)などの各システムでRDF形式のデータをAPIで提供してきたが、2014年度から全館的な観点でLOD(Linked Open Data)の提供・促進に取り組むことになった。今回の月例研究会では、その経緯・現状・課題やLOD作成の実際についてご発表いただくとともに、JLAとの共同研究である日本十進分類法のLD(Linked Data)化についてもご報告いただいた。
図書館におけるLinked Dataの取組 には、次の二つの側面がある1)。すなわち、a.公共機関のオープンデータとしての側面、b.セマンティックウェブ時代の書誌コントロールとしての側面、である。aは、オープンガバメントに代表される、公共機関が保有する情報のオープンデータ化である。bは、全国書誌や典拠データのLD化、あるいはBIBFRAMEの開発に見られるLDを基盤とする目録作成の新たな枠組みの構築である。NDLの取組にも両面があるが、今回発表するのは、aについてである。
2014年度にまず現況調査を行い、NDLにおけるLODの課題と改善策を整理した。課題は、次の4項目に整理することができた。(1) 認知度の低さ、(2) データ利活用のしにくさ、(3) LODとしての内容の不十分さ、(4) 他データのLODでの提供への期待。
これらの改善策として、NDLが提供するLODのデータソースや利用条件等を分かりやすく紹介するページを2014年9月に開設した2)。そこでは、以前からRDF形式でデータ提供を行っていたNDLサーチの書誌データ、Web NDL Authoritiesの典拠データ、「ひなぎく」の震災関連データについて、一括ダウンロード用のファイルを用意したり、RDF以外のデータ形式での提供を行っている。また、「非営利目的であれば申請なしでAPIによるデータの取得が可能」という利用条件を明記した。
さらに、上で取り上げたデータ以外にも、各種コード類のLOD提供を目指すこととした。一つはISIL-LODの作成である(詳細は次の3.を参照)。またJLAとの共同研究ではあるが、NDC新訂8版と新訂9版の機械可読データファイル(MRDF8、MRDF9)のLD化の研究に着手している。
それから、データ利活用の促進のためのイベントの実施または参加がある。例えば、今年2月21日の「インターナショナルオープンデータデイ」には、「国立国会図書館のウェブページを使い尽くそうアイデアソン」を開催し3)、好評を博した。
ISILとは「図書館及び関連組織のための国際標準識別子」のことで、もともとNDLが登録・管理業務を担っていた。国内の図書館の名称・所在地などの情報をISIL-IDとともに記載した既存台帳のデータ7500件をLOD化し、2015年4月から試行提供している。ISIL-LODの作成試行によりLOD化のノウハウを得るとともに、その課題を明らかにすることを目的とした。LOD化の手順は次のとおり。
(1) 諸外国のISIL-LODの先行事例を調査、(2) データモデルの作成、(3) 外部データの追加、(4) データのクレンジング、(5) データのRDF/XMLへの変換と変換データの検証、(6) 公開方法の検討・調整、(7) 利用条件とライセンス表示の調整。
(3)はOpenRefineを用いて緯度経度情報や統計センターの標準地域コード、NII総合目録データベースの図書館IDなどを追加したが、そのためには(4)データの修正・正規化が必要であった。(5)の変換もOpenRefineを用いて行った。(6)では、全館的なURI体系方針を策定した。(7)では、全館的な方針によるライセンス表示が困難なため、試行としてクリエイティブコモンズの「パブリックドメインマーク」を付与することとした。今回の試行により、データの信頼性・継続性をどう担保してシステムやURIを設計するかなど、いくつかの課題が指摘された。
まずDDC、LCC、UDC各々のLDについて先行事例調査を行ったところ、LD化の範囲やライセンスの設定が異なり、三者三様であることがわかった。他方、NDC-LDはどのような方針でどのような使い方を目指すのかが課題である。
1.で述べたLD化の二つの側面とは、使用する者のニーズの違いと理解できる。つまり「オープンデータとしての側面」では、アプリ開発者などが一次データのオープンデータ化を期待するもので、精緻に構造化されたLDを必ずしも求めないが、「書誌コントロールとしての側面」では、図書館員がメタデータとしてのあり方を重視するため、精緻に構造化されたLDを期待する。 オープンデータ化の動きは、図書館の意義や効果をアピールするよい機会であり、また他機関と比較してLD化しやすい構造化されたデータを持つ図書館は有利ではないか、との考えを最後に述べた。
質疑応答では、NDLの取組を国際的に拡大する方策、NDLの全館的なライセンス表示方針の考え方や、URIの設定方法など、多くの質問が出された。
(記録・文責:松井純子 大阪芸術大学)