TOP > 月例研究会 > 2022 > / Last update: 2022.9.23

情報組織化研究グループ月例研究会報告(2022.07)

「地域文化遺産情報の発見を支援するメタデータモデルとシステム機能要件」

三島大暉氏(宮内庁三の丸尚蔵館学芸室研究員)


日時:
2022年7月23日(土)14:30〜16:00
会場:
(Zoomミーティング)
発表者:
三島大暉氏(宮内庁三の丸尚蔵館学芸室研究員)
テーマ:
「地域文化遺産情報の発見を支援するメタデータモデルとシステム機能要件」
出席者:
阿児雄之(東京国立博物館)、安達匠(國學院大學図書館(たまプラーザ))、荒木のりこ(大阪大学附属図書館)、今野創祐(京都大学)、江上敏哲(国際日本文化研究センター)、坂下直子(神戸女子大学)、佐藤久美子(国立国会図書館)、塩見橘子、高久雅生(筑波大学)、田窪直規(近畿大学)、徳原靖浩(東京大学附属図書館U-PARL)、中道弘和(堺市立図書館)、福田一史(大阪国際工科専門職大学)、村上健治、村並秀昭、他6名、三島<22名>

1.はじめに

 発表者から自己紹介があり、自身のこれまでの業務や研究の内容が紹介され、本日の発表の概要、参考文献が示された。

2.研究背景等

 2019年4月、改正文化財保護法が施行された。日本社会が過疎化や少子高齢化等に向き合う中、日本各地に所在する文化遺産を保存継承することが課題となっている状況が背景にあり、各市区町村において文化財の保存と活用に関する「文化財保存活用地域計画」が作成できるようになるなど文化遺産の活用も重視されるようになった。しかし、そもそも地域に所在する文化遺産の情報は発見されにくい現状がある。
 市区町村の指定等を行った文化財の情報を横断して検索できない、「文化遺産オンライン」では国指定等の文化財の情報が中心である等、市区町村を横断して文化遺産を発見できる仕組みは十分ではない。一方、検索エンジンでは今日の膨大なWebの情報の中から市区町村が公開する信頼性の高い文化遺産の情報を発見することが困難である。「ジャパンサーチ」では県立図書館などと連携して、地域のコンテンツとして検索できるようになりつつあるが、地域に所在する文化遺産の情報の集約と連携に適したメタデータモデルやシステムの機能要件が明らかになっておらず地域文化遺産情報の発見可能性の向上は困難である。
 そこでここでは、地域文化遺産情報の発見可能性向上のため、地域文化遺産情報の集約と連携に適したメタデータモデルおよびシステムの機能要件を明らかにすることを研究の目的とした。用語の定義として、「地域文化遺産」とは、「地域で活用が期待される未指定の文化財を含むより広い意味での文化的な遺産」を指し、「地域文化遺産情報」とは、「地域文化遺産に関する情報全般」を指す。なお、文化財保護法や文化財保護条例等に基づく場合は「文化財」を使用する。
 研究手法は以下の通りである。まず、東京都内60市区町村がWebに公開する、文化財保護条例等によって指定等を行った文化財の一覧の情報(文化財リスト)に含まれるメタデータを対象に地域文化遺産情報のコア情報として集約する。
 次に、集約した文化財リストのメタデータと、データの発見可能性と活用可能性の向上が期待されるLinked Dataの仕組みを利用可能なメタデータモデルと機能要件を提案する。
 最後に、それらをもとに「地域文化遺産情報発見支援システム」を構築・評価し、有効性を検証する。
 ここでのLinked Dataであるが、ウェブ上の識別子URI、ウェブ通信プロトコルHTTP、3つ組のグラフ構造のRDF、RDFを扱うためのクエリ言語SPARQLを使用する。

3.関連事例と関連研究

 文化遺産情報を集約する試みとしては以下があった。
1989「全国文化財情報システム」構想
1995「文化財情報システム」
1996「共通索引システム」(試行版)
2004〜「文化遺産オンライン」
 しかし、「文化遺産オンライン」では、検索できる地方指定文化財の件数は限定的であった。
 Linked Dataを用いた関連研究としては、2010年以降の「LODAC Museum」がある。これは、Webに公開された博物館・美術館の収蔵品情報等を統合し、Linked Dataとして公開・共有するものであった。また2014年頃、地域史資料のLinked Data化の事例が見られる。これは、函館市が公開する地域史資料の情報を関連付けた利活用の試みであった。

4.文化財リストに関する分析

 ここでの文化財リストとは、市区町村がWebに公開する、文化財保護条例等によって指定等を行った文化財一覧の情報を意味する。
 特徴として、地域文化遺産の保護を中心的に担う市区町村が公開する情報という点で信頼性の高い地域文化遺産情報であること、また、ほとんどの市区町村が文化財リストを公開しており、地域文化遺産情報のコア情報として全国的にも用いることができると期待されることが挙げられる。
 分析対象は、文化財リストをWeb公開する東京都内60市区町村の文化財リストである。文化財リストに含まれるメタデータ項目を分析した結果、採用している市区町村数の多い上位5つのメタデータ項目「名称」「種別」「指定年月日」「所在地」「所有者」を主要5項目として、集約と連携の観点から分析することとした。
 集約と連携の観点からの主要5項目の分析結果は以下の通りである。

名称:当該名称を利用しないと市区町村が公開する地域文化遺産情報を発見できなくなる可能性があるため、そのまま利用することが望ましい。

種別、指定年月日、所在地、所有者:市区町村を横断して類似する文化財を検索可能とするため、別項目で共通の記述方法の情報を付けることが望ましい。

5.メタデータモデルと機能要件

 地域文化遺産情報の発見可能性向上のため、文化財リストを地域文化遺産情報のコア情報として集約し、データの発見可能性や活用可能性が期待されるLinked Dataにより他の情報源と連携可能なシステムとして、地域文化遺産情報発見支援システムを構想した。地域文化遺産情報発見支援システムが要求する機能要件は以下の通りである。

(1)横断検索機能:市区町村を横断して文化財リストのメタデータを検索
(2)関連検索機能:発見した文化財と関連する文化財の発見を支援
(3)書籍等発見支援機能:発見した文化財と関連する書誌情報の発見を支援
(4)Webページ発見支援機能:発見した文化財と関連するWeb情報の発見を支援

 文化財リストを集約するメタデータモデルとして、「メタデータ情報共有のためのガイドライン」、EDM、JPS利活用スキーマを参考とし、イベント中心モデルではなく、オブジェクト中心モデル(ダブリンコアベース)で作成した。
 文化財リストのメタデータ集約に関するメタデータ記述規則において、項目名は「オープンデータ推奨データセットデータ項目定義書(文化財一覧)」を参考に作成した。文化財分類および種類のURIとして利用可能なシソーラスがWeb上に存在しないことがネックとなったため、あわせて文化財分類および種類のシソーラス作成に向けたメタデータモデルおよびメタデータ記述規則を作成した。上位、下位、優先、代替、外部語彙を簡易的に表現可能で既にLinked Dataでの利用実績があるSKOSを利用した。

6.「地域文化遺産情報発見支援システム」の構築

 システムの全体構成として、入力された検索キーワードを用いてLinked Data化された文化財リストの情報をSPARQLで問合せ、市区町村を横断して地域文化遺産情報を発見するものとした。構築手順は以下の通りである。

(1)文化財リストのメタデータの変換と付与:メタデータ記述規則に沿って変換と共通のURIのメタデータを付与
(2)文化財分類および種類で利用されている語彙の調査
(3)RDF化とRDFストアへの登録:OpenRefineとApache Jena Fusekiを使用
(4)地域文化遺産情報の発見支援機能の構築(以降、詳述)

 文化財分類および種類のシソーラスと連携した発見支援機能、隣接市区町村の情報と連携した発見支援機能、関連する書誌情報の発見支援機能、関連するWeb情報の発見支援機能を構築した。

7.「地域文化遺産情報発見支援システム」の評価

 まず、既存システムとの比較による評価をおこなった。既存の文化遺産情報を集約するシステムでは発見されにくい、地域文化遺産情報を本システムではどの程度発見できるか検証した。「文化遺産オンライン」に多く登録されている小金井市の文化財を起点として発見される、市内と隣接市内の同分類の文化財件数を比較したところ、本システムでは、「文化遺産オンライン」と比較し、地域文化遺産情報として市内と隣接市内の同分類の文化財を漏れなく発見できることがわかった。
 次に、地域文化遺産の質問に対する回答内容の評価をおこなった。実際に地域文化遺産に関する質問に対して本システムを用いると地域文化遺産情報をどのような形で提供できるか検証した。「レファレンス協同データベース」に登録された東京都内の図書館が登録したレファレンス事例から地域文化遺産に関するものを抽出し、本システムで作成した回答と実際の回答を比較した。本システムでは、質問に関連する地域文化遺産情報を発見できれば、量的に多くの書籍を発見できるが、地域文化遺産と直接関連しないテーマの書籍は発見できないこと、また市区町村が公開する文化財リストや市区町村が刊行・公開する書籍等やWebページ(地域文化遺産に関する広報ページや指定等の際の市区町村会議録など)を参照することからレファレンス回答とは別の観点から信頼性の高い情報を提供できることがわかった。

8.論文におけるまとめ

 本研究で提案したメタデータモデルおよびシステム機能要件が、次のような地域文化遺産情報の発見に資する、地域文化遺産情報の集約と連携に適したものであることが明らかになった。

(1)市区町村を横断した、信頼性の高い地域文化遺産情報の発見
(2)発見した地域文化遺産情報と類似する、隣接市区町村を横断した地域文化遺産情報の発見
(3)発見した地域文化遺産情報と関連する、信頼性の高い書籍やWebページの発見

一方、以下の課題が挙げられる。

また、以下の実運用上の課題も存在する。

9.その後の展開

 「地域文化遺産情報発見支援システム」をウェブで公開するにあたり、稼働環境、RDFストア、構成ファイル、SPARQLクエリを変更した。
 残された課題として以下が挙げられる。

 また、「地域文化遺産情報発見支援システム」をウェブで公開するにあたり、公開対象をひとまずオープンデータとして公開されている文化財リストに限定する方向とした。この背景には、文化財リストが掲載されているサイト上の文書・画像などの無断使用・転載、二次利用を禁止する旨を決めた市区町村ウェブサイトの利用規約がある。
 文化財リストがより多くオープンデータとして公開されることを期待したいが、政府CIOポータル(現在はデジタル庁)のウェブサイトで推奨データセット「文化財一覧」が公開されている。推奨データセットとは、XLSX、CSVといったフォーマット等で、オープンデータの公開とその利活用を促進することを目的とし、政府として公開を推奨するデータと、そのデータの作成にあたり準拠すべきルールやフォーマット等を取りまとめたものである。「文化財一覧」はこの中でも、基本編(オープンデータに取り組み始める地方公共団体向け)に位置付けられている。
 文化財リストのオープンデータとしての公開状況は以下の通りである。東京都内では62市区町村のうち26が公開している(2022年3月2日時点発表者確認)。その中で推奨データセット対応済と思われる自治体数は24であった。別の調査事例で全国では1788自治体のうち262の自治体が文化財リストをオープンデータで公開しているという報告もある(2021 年3月1日〜 15 日に調査)。その中で推奨データセット対応(項目の列数が26以上)の自治体数は125であり、うち、推奨データセット項目完全一致は28自治体であった。
 文化財リストの更新に対応できる仕組みや体制の整備が必要である課題への対応として、DiffBrowser(ウェブページの更新状況チェックソフト)で定期的に確認した結果、東京都だけでも文化財リストが毎月どこかの市区町村で更新されていることを確認した。
 同じく文化財リストの更新に対応できる仕組みや体制の整備の課題への対応として、メタデータモデルとメタデータ記述規則を変更した。より具体的には、更新基準ページのURL、オープンデータ一覧のURL、文化財リストの収集日を追加した。また、文化財リストの利用規約等を明示する仕組みや体制の整備の課題への対応として、利用規約のURLを追加した。
 メタデータモデルの検討課題として、文化財リストの更新に対応できる仕組みや体制の整備の課題に関連して、文化財リストの更新をどのように表現するかが挙げられる。「dcterms:hasVersion(異版をもつ)」と「dcterms:isVersionOf(異版である)」のプロパティが考えられるが、PRISM Dublin Core Metadata Specificationを参考にすれば、「dcterms:hasVersion」である。文化財のURI新旧を「dcterms:hasVersion」で関連付けるか、文化財リストのURI新旧を「dcterms:hasVersion」で関連付けるかは迷うところであるが、後者の方が汎用性が高そうである。
 今後の取り組みの方向性として、オープンデータで公開される文化財リストへ文化財を紐づけ直し、「地域文化遺産情報発見支援システム」をウェブ上で一般公開する(一部機能は保留する)ことが挙げられる。
 また、文化財リストで使用される語彙と粒度が市区町村によって異なるため、類似する地域文化遺産情報の発見を困難としているため、Getty AATを利用しながら、文化財語彙のKOS(Knowledge Organization System)を構築することが考えられる。メタデータ提供者参加型のLOD KOSであるSemantics.grも参考にしながら、文化財語彙のKOSを用いて文化遺産情報の公開者自身が独自の見方や価値付けを残しつつ文化遺産情報の活用に適した形で公開できるようにしたい。

 以上の発表を受けて、当発表における「文化遺産」および「文化財」という用語の使い分けについて、集約するだけでなくそれ自体が情報を提供できるサービスを作る可能性について、レファレンス協同データベースとの比較方法について、日本美術シソーラスは参照したのか等の質疑があった。

 なお、今回の月例研究会については、Zoomの映像を録画し、開催後一週間に限り、出席を申し込んだものの欠席された方にも、映像を配信した。

参考文献:
三島大暉, 宇陀則彦. 文化財リストを用いた地域文化遺産情報の集約と連携. 情報知識学会誌, vol. 31, no. 1, 2021, p. 51-70. https://doi.org/10.2964/jsik_2021_017

(記録文責:今野創祐)