情報組織化研究グループ月例研究会報告(2012.1)
GUIを用いた関連語編集機能とメタデータへの関連語登録機能を実装したDigital Cultural Heritageの実践例
研谷紀夫(東京大学)
- 日時:
- 2012年1月28日(土) 14:30〜17:00
- 会場:
- 大阪市立市民交流センターなにわ
- 発表者 :
- 研谷紀夫氏(東京大学)
- テーマ :
- GUIを用いた関連語編集機能とメタデータへの関連語登録機能を実装したDigital Cultural Heritageの実践例
- 共催:
- 目録法研究会(科学研究費基盤研究(C) 課題番号22500223 研究代表者:渡邊隆弘)
- 出席者:
- 大西賢人(京都大学)、尾松謙一(奈良県立大学図書館)、川崎秀子(佛教大学)、川瀬綾子、河手太士(静岡文化芸術大学図書館)、古賀崇(京都大学)、五島敏芳(京都大学総合博物館)、佐藤毅彦(甲南女子大学)、塩見橘子、篠田麻美(国立国会図書館)、末田真樹子(神戸大学)、中村友美、西川洋平(株式会社タスク)、堀池博巳、松井純子(大阪芸術大学)、水野翔彦(国立国会図書館)、村井正子(日本アスペクトコア)、渡邊隆弘(帝塚山学院大学)、和中幹雄(大阪学院大学)、研谷<20名>
様々な文化資源を扱うデジタルアーカイブの構築における、関連語体系編集・管理ツールの開発について発表された。
1.はじめに:研究背景
- 2005年以降、デジタル技術と資料特性にあわせた分類・構成法の試行を研究してきた。デジタル環境では、複数の分類体系を併存させたり、一つの資料を複数の分類・構成で扱ったりすることができる。一方、資料の検索・利用の立場からは、各資料群の特性に応じた分類・構成を用いたいという要請がある。
- これを実現するための課題は、「対象世界に存在する事物・概念の体系化」「各資料の事物・概念体系との関連づけ」「各事物・概念同士の関係定義」「事物・概念体系の側から資料を見ること」「標準規格を用いた知識体系」「知識体系をGUIなどを用いて編集可能な体制」の6つに整理できる。
2.文化資源統合アーカイブの構築
- 坪井平五郎関係資料などを素材として、文化資源統合アーカイブの構築を行った。主には、歴史情報の取扱いが焦点であった。
- 分類体系の構築にあたっては、オントロジを意識した。オントロジには特定領域のドメインオントロジやWEBオントロジもあるが、より高い抽象度で事物・概念を整理する「上位オントロジ」を特に意識した。上位オントロジは世界に存在する様々な事物・概念・情報を対象として、その体系化をめざす。文化資源統合アーカイブにおける対象は資料の内容上に現れる事物等に限定されるが、その中で、主述の関係で概念や意味を定義すること、再利用可能な共有知識をめざすこと、一定の規則に基づいたルール・言語で記述すること、といった上位オントロジの要件をそのまま本研究の課題とした。
- 具体的には、Guarinoの上位オントロジを基礎とし、土地・社会組織・人物などの固有名詞も各概念の下に取り組む拡張を行った。また、歴史情報の記述に即した関係子を設定し、事物・概念間の関係性を記述できるようにした。
- このオントロジを活用して「事物つながり検索」などを実現したが、知識体系の標準規格での表現や、GUIベースでの情報知識編集は、課題として残された。
3.Digital Cultural Heritage(DCH)の構築
- その後新たなフェーズとして、社会情報研究資料センターにてDCHの構築を開始した。坪井正五郎関係資料、小野秀雄関係資料、プロパガンダ関係資料等を統合して提供するもので、2012年に公開予定である。
- 標準規格準拠という課題をクリアするため、「トピックマップ(Topic Maps)」を採用した。トピックマップは、「トピック」「関連」「出現」という構成要素で、関連領域における主題間の関連や情報リソースとの関連をモデル化してコンピュータ処理可能とする技術である。
- オントロジエディタは内外にいくつかあるが、DCHに適用するには、トピックマップへの対応や多様な関係性(人間関係など)の創出に限界がある。本研究では、こうした課題に即したアプリケーションの開発とDCHへの実装を試みた。
- GUIベースの知識情報編集アプリケーション(FLASHを用いている)を開発し、DCHに組み込んだ。DCHの編集システムは、資料特性に応じたスキーマを設定してメタデータ入力を行う機能を持つが、そこで入力されたトピックからGUIベースのトピック編集画面に飛び、様々な関係情報の管理等が行える。メタデータにはトピックが埋め込まれ、随時の参照が可能である。
4.まとめ
- 1.で述べた6つの課題は、2011年度までに概ね完了した。今後は公開と実証を進める。完成したツールを用いて、より大規模な知識体系の構築と実証が必要である。
- GUI等の部分については、タッチスクリーンインターフェースの普及など、デジタル機器環境の変化によって、新たな課題も生まれていると認識している。
発表後、ソフトウェアの公開方法、対象利用者のイメージ、扱う事物・概念の範囲等について、活発な質疑応答があった。
参考資料
- プレゼン用スライド(PDF 1.4M 都合により、当日使用分のうち若干の画像を削除しています)