発表者は、ウェブデザイナーから出発して、現在は地域情報化の仕事に取り組んでおり、リンクト・オープン・データ(以下、LOD)・イニシアティブの副理事長、横浜LODプロジェクトプロデューサー等として様々な活動をされている。今回、以下の内容でご発表いただいた。
LODイニシアティブの目的は、LODがウェブと同様なインパクトを社会に与え、社会の多様化と成熟に貢献するという考えのもと、その社会インフラになりつつあるLODを普及させることである。主な事業はLOD並びにオープンデータに関する調査事業、講座やシンポジウムの開催、取り組みの支援と評価である。
LODの価値は、ウェブとしての価値とオープンデータとしての価値がある。
ウェブの価値とは、これまでデータは独自のルールで、壁に覆われた横のつながりがないサイロ(食糧倉庫)のように格納され、データそのものの価値が重視されていたが、その後、ウェブが発明されたことにより、データは共通の約束事でリンクすることができるようになった。この約束事とはウェブの標準化であり、W3Cがデファクト主義で策定している。LODのコンセプトはウェブ・オブ・データであり、リンクをつなげていくことによって価値が高まり、事後的にそのデータの位置づけがデータ間の関係で定まっていくこと、また、異分野のデータセットが相互につながることに価値があるといえる。
オープンデータとしての価値とは、誰でも利用でき、アクセスでき、再利用と再配布ができることである。そのためには、そのデータが機械可読であること、オープンライセンスであることが必要である。今後、オープンデータやそのインフラを整備することが、その国や都市の評価や競争力につながっていく。
LODを作成する際には、リンクトデータの4原則というルールがある。その原則とは「(1) ものごとをURIで名前付けする」、「(2) これらの名前を調べて見つける(参照解決する)ことができるように、http:スキームのURIを使う」、「(3) 名前付けしたURIがたどれたら、有用な情報を返す」、「(4) ほかのURIリンクを加えて、より多くのものごとを見出せるようにする」である。
この原則を技術的に考えると、リンクトデータには識別子と情報の構造化(データモデル、シンタックス、語彙)が必要となる。識別子はIRI(RFC3987)として定義されている。そして、情報の構造化においてデータモデルはグラフモデルでRDFにより表現される。また、表現するための構文規則として、JSON形式などのシンタックスがあり、シンタックスの中で属性に何を置くのかという語彙が重要となってくる。語彙例としては、図書館情報ではダブリンコアなどがある。日本政府は、データの相互交換可能性を担保するために共通語彙基盤プロジェクトを進めている。
このようなリンクトデータを生成するためには、2つの方法がある。既存のデータを機械的にグラフモデルに変換し利用する方法で、ツールとしてはOpen Refineなどがある。もう1つは、最初からリンクトデータを作成する方法で、作成に必要なスクリプト言語にライブラリが存在するので使用すると効率的である。
LODを使うには、IRIから取得する方法と、RDF専用のクエリ言語であるSPARQLで取得する方法がある。例えば、国立国会図書館のデータはIRIからでも、SPARQLからでもLODを取得できる。図書館系LODとしては、World Cat、米国議会図書館、フランス国立図書館、VIAFのデータが有名である。
社会における文化機関の役割の変化により、地の拠点として、また共創・協働の場、交流の場、学びの場として文化機関のオープン化が進んでいる。この文化機関がもつデータに関しても、デジタルアーカイブしたデータをオープンデータ化し、ICTを活用して文化機関の外へ知識を開いていく方向である。
文化機関であるGLAM(ギャラリー、ライブラリー、アーカイブ、ミュージアム)を拠点としたオープンコンテンツの創造、GLAMが保有するデータのオープンデータ化が日本でも各地で取り組まれており、事例としてYokohama ART LODとWikipedia TOWNなどがあり、そこでは情報資産としてLODが活用されている。
(記録文責:尾松謙一 奈良県立大学附属図書館)