整理技術研究グループ月例研究会報告
和漢古典学のオントロジモデルの構築
相田満(国文学研究資料館)
- 日時:
- 2006年6月24日(土) 14:30〜17:00
- 会場:
- 大阪ガーデンパレス
- 発表者 :
- 相田満氏(国文学研究資料館)
- テーマ :
- 和漢古典学のオントロジモデルの構築
- 共催 :
- 情報知識学会関西部会
- 出席者:
- 江上敏哲(京都大情報学研究科図書室)、蔭山久子、川崎秀子(佛教大)、河手太士(大阪樟蔭女子大図書館)、倉橋英逸、田窪直規(近畿大)、谷口美代子、田村俊明(大阪市立大学学術総合センター)、中川正己(松山大)、堀池博巳、松井純子(大阪芸術大学)、吉田暁史(大手前大)、相田 <13名>
発表者が中心となって構築が進められている、国文学研究資料館における和漢古典学のオントロジの構築についての発表が行われた。
1.オントロジ以前
- 国文学研究資料館で作成してきた『国文学年鑑』のような専門領域特定型データベースの問題点として、情報の遍在による肥大化現象や冊子体の長所(ブラウジング機能をもたらす配列の意匠など)がなくなってしまうことなどがある。これらの問題点の解決策としてオントロジに期待している。
- 検索用語彙体系の整備を行ったところ、データ採録の判断典拠が不明確になるなどの問題が生じた。この解決法として、辞書から類概念を取り出す方法を発表者は考案した。
- 可搬性のあるシステム・辞書の構築には、ユーザに対して検索システムと基本辞書を配布し、各ユーザが基本辞書に基づいて独自検索用辞書を構築し、これを回収して再配布する、という手順による運用が考えられる。しかし、コンセプトをもって基本辞書を構築しないと失敗する可能性が高い。
2.和漢古典学のオントロジモデルの構築
- 数多くある古典資料を、分類資源の集積・分析・利用によって、オントロジ資源として再生するとともに、「分類」という枠組みからのアプローチによる文学研究の新たな展開を図る。
- 和漢古典学の世界では、「類」概念の整理体系は基本的な学問体系であり、この「類」の観点からオントロジと古典文学研究を結びつける。オントロジの収集にあたっては「世界の認識と記述」を志向し、入門書・類書などから収集する。
- 古典的辞書は類概念による分類体系の宝庫であり、2000年以上の歴史を持つ良質な知識概念木(=オントロジ)群である。また、辞書の中で使われている語彙の4分の1以上のものが現代日本でも使用されている。そのような語彙は、自然景物・年中行事・人事関係に集中しており、古典概念と現代語の接合が可能ではないかと考える。
- 類書で用いられている見出し語を古典本文の全文検索語として使えるのではないかと考え、枕草子を例に分析したところ可能であることが判明した。これにより、古典本文語彙と古典「類書」オントロジとの接合が可能であることがわかった。
- 「類書」を用いたオントロジ構築における問題点としては、複雑な階層関係、入力不可能な文字の出現、文化性の問題などがある。
3.国書総目録の分類
- 国書総目録の分類の問題点として、書名から分類名が推測できるものについては分類名が省略されていること、分野によって分類の精粗にばらつきがあることなどがある。そのため、国書総目録を基礎とする国書基本データベースでは、書名からの分類名の補完などが必要となる。
- 国書総目録における分類は文学に傾倒しているが、文学分野の項目も十分なわけではなく、さらなる細分化が必要である。たとえば、準漢籍(日本でつくられた漢籍)については、国書総目録に採録されていないものも多いため、「仏教聖典」「漢籍・和刻本」「文書類」などは、実際の残存状況の膨大さに比べ、採録自体も不十分である。また、分類もおおざっぱで項目分けも十分ではない。
- 今後は、各専門分野で自由な知識セットを作成し、それらをオントロジで結びつけたほうがよいのではないか。
4.セマンティクス性を持つオントロジの構築
- GIS情報と地名とを結びつける地名のオントロジがあれば、地名に関する類概念ができるのではないかと考え、その試みの一端を紹介した。
(記録文責:河手太士)