整理技術研究グループ月例研究会報告
オントロジー構築入門:
よりよいオントロジー構築のための考え方と指針
古崎晃司(大阪大学産業科学研究所)
- 日時:
- 2006年11月18日(土) 14:30〜17:00
- 会場:
- 大阪市立浪速人権文化センター
- 発表者 :
- 古崎晃司氏(大阪大学産業科学研究所)
- テーマ :
- オントロジー構築入門:よりよいオントロジー構築のための考え方と指針
- 後援:
- 情報知識学会関西部会
- 出席者:
- 蔭山久子、川崎秀子(佛教大)、河手太士(大阪樟蔭女子大図書館)、倉橋英逸、鈴木淳史(静岡大院生)、田窪直規(近畿大)、田村俊明(大阪市立大学術情報総合センター)、堀池博巳、松井純子(大阪芸術大)、山口和広(凸版印刷)、吉田暁史(大手前大)、渡邊隆弘(帝塚山学院大)、古崎 <13名>
大阪大学産業科学研究所溝口研究室で取り組まれている研究をふまえて、オントロジーの基礎及び構築上の重要点について発表された。
1.オントロジー
- 今日のネットワーク情報社会では、システムの相互運用性(知識の共有・再利用性)の向上が求められる。これには、ファイルフォーマットや文字コードなどの形式的側面と、内容に関わる意味的側面があり、オントロジーは後者の解決に大きな役割を果たすべきものである。
- オントロジーは「人工システムを構築する際の構成要素として用いられる基本概念/語彙の体系(理論)」と定義される。具体的な知識ベースを構築する際の土台になる、対象世界の諸概念とそれらの関係性(通常は暗黙的理解にとどまっているもの)を整理し、機械可読な形で表現したものである。
2.オントロジーの利用法
- 情報、工学、生命科学など多くの分野でオントロジーが作成されているが、オントロジーの種類とその利用形態という2軸で実例を整理することができる。
- 意味的構成要素の観点から種類分けをすると、(0)統一された語彙集合や簡単なスキーマ、(1)概念間のis-a階層、(2)is-a以外の関係を含む構造、(3)意味制約の公理的記述を含む、(4)その他の強い公理も含む、という段階が考えられる。(0)は簡単な形式の規約レベルであり、本来はオントロジーの範疇に含められない。(1)は「軽量(語彙レベル)オントロジー」に相当するもので、階層化によって関連情報が把握できるようになる。ただこれでは、大まかな関係は把握できるが、各概念の意味の違いは暗黙的であり、それらを明示するには(2)以上の段階が求められる。
- 利用形態の観点からは、(0)辞書的、(1)共通語彙、(2)インデックス、(3)データスキーマ、(4)知識共有の媒体、(5)知識モデルの規約、(6)知識の体系化、とう諸段階が考えられる。既存事例を分析してみると、利用形態が高度になれば、オントロジーの種類(前記)もより進んだ段階のものが開発される傾向にあることがわかる(分析結果の詳細は,http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_apps/ にて公開)。
3.オントロジー構築入門
ここより以下は、発表者の研究室で開発されたオントロジーエディタ「法造」(
http://www.hozo.jpにて公開)に即して、説明された。
- オントロジーは、対象世界を説明するのに必要な諸概念と、概念間の関係から構成される。概念定義は、上位/下位概念(is-a関係)、部分概念(part-of関係)、属性(attribute-of関係、その他の制約(関係)を明示的に表現することで行われる(名称ラベルも付けるが、定義の本質ではない)。
- is-a関係による階層構造が基礎となる。オントロジーにおけるis-a階層は単なる語彙分類階層(taxonomy)ではなく、各概念の本質的属性を反映したものであることが望まれる。階層構築においては、クラス分類基準の同一性を保つこと、インスタンス集合のパーティション性を保つこと(多重階層を避ける)、などの注意が必要である。
- is-a階層だけでは、概念間の意味的な違いを明確化できない。part-of関係、attribute-of関係による意味定義を適切に行う必要がある。上位概念で行われた意味定義は下位概念に継承され、その一部は下位概念で特殊化されうる。継承と特殊化を適切に用いることで、概念間の意味の違いが明示される。さらに、その他の関係を設定して、意味定義の制約を表現することも可能である。
- オントロジーの利用に際しては、構築されたオントロジーに基づいてインスタンスを生成し、インスタンスモデルを記述できる。
4.ロール概念の考え方
- 「全体」(例えば「自転車」)に対して各「部分」(例えば「前輪」や「ペダル」)をpart-of関係として記述することは、全体というコンテキストにおいて部分を「ロール概念」として扱うことである。多様な「車輪」のうち(a)、自転車用の前輪という役割(b)を果たした「自転車前輪」(c)が、「自転車」の部分となる。このとき、(b)を「ロール概念」、(c)を「ロールホルダー」、(a)を「クラス制約」と呼ぶ。
- 「人間」「自転車」「車輪」等の、他の概念に依存せずに定義できる概念を「基本概念」と呼ぶ。これに対して「教師」や「前輪」は、それぞれ「人間」「車輪」(基本概念)が特定のコンテキストのもとで果たす役割をとらえたもので、「ロール概念」とみなすべきである。
- ロールホルダーは、基本概念(クラス制約)の意味定義と、ロール概念の意味定義を合わせて備えた性質を持つ。オントロジーにおける意味定義の継承は、is-a階層を通じた上位から下位への継承のほかに、クラス制約として参照される基本概念からの継承がある。
5.オントロジー構築のガイドライン:典型的な誤り例
- 一つの概念に複数の上位概念を設定する「多重継承」は行うべきでない。一見多重継承に見える関係は、is-aとpart-ofもしくはロール概念との混同による場合が多い。
- 基本概念とロール概念の峻別も初心者に難しいところだが、厳密に行う必要がある。
- 行為概念の意味定義が自然言語による記述になりがちであるが、当該行為に関係する概念を十分に分析して定義する必要がある。
参考:溝口理一郎編『オントロジー構築入門』オーム社, 2006.9. 195p
http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_building/ (今回の講演資料)
(記録文責:渡邊隆弘)