整理技術研究グループ勉強会記録(2006年度)
「セマンティックWebと資料組織法(続)」第3回
- 日時:
- 2006年4月28日(金) 19:00〜
- 会場:
- 日図研事務所104号室
- 発表者 :
- 渡邊隆弘氏(帝塚山学院大学)
- テキスト:
- 武田英明 "上位オントロジー", 人工知能学会誌 19(2), pp172-178,
2004
- 出席者:
-
はじめに
- 上位オントロジー=「最上位」のオントロジー(世界全体の範囲)
upper, upper-level, top-level, general, general-purpos, …
- 実用的要求に基づくが、哲学的前提・仮説なしには構築できない
- 溝口「原理的には、ありうる全ての対象を高い抽象レベルで説明するのに必要十分であることをめざしたカテゴリーの体系であり、少なくともそれが持つ役割は哲学者が作るオントロジーに匹敵する」
(あくまで「原理的には」)
- オントロジーの種類・・・タスク、ドメイン、上位…
- 構築の原則
- 少ない概念で広い対象世界を記述
- 定義概念が下位オントロジーで利用可能
- 一般性と形式性(抽象性)
どちらも重要で、相互排他的な基準はない
→上位オントロジーを精密に作るには両基準を分離して考える必要がある
- 形式オントロジー(formal ontology)
抽象的な側面を重視して構築、形式性を第一の原理とする
- メタオントロジー
各対象世界「オブジェクトオントロジー」の表現法・記述法を与える
★体系のルートを作る
- 常識オントロジー・・・一般性を重視
自然言語に基づくオントロジー・・・両者の中間的位置づけ
常識オントロジー
- 経験的な一般概念を収集して体系化
- 実際には、多くの自然言語における概念
- 多くの人が使っている概念の整合的体系化(論理的な厳密定義ではない)
★ボトムアップによる作成 or トップダウンによる作成?
- SUMO(Suggested Upper Merged Ongology)
- IEEEのワーキングによる議論
- 既存のオントロジーの結合による包括的・一貫的なオントロジー→概念定義よりも、自明な概念の整理
- EntityがPhysicalとAbstractに分かれる
- PhysicalはObjectとProscessに分かれる
- ★階層カテゴリをつけていくだけなのか?
- OpenCyc
- 常識ベースの上位概念、約6000概念
- 形式論による定義
- 集合間の包含関係 #$genls
- クラス・インスタンス関係 #$isa
- その他 一定の論理式
語彙に基づくオントロジー
- 自然言語の語彙の背景に概念・関係があると考える
最もまとまって手に入る概念の集合→ただし、言語に現れるものしか扱えない
★なぜ「lexicon」という語が使われているのか?
- 意味辞書やシソーラスもこの範疇に含める
対象知識を扱うか、言語知識を扱うか、の違いは留意が必要
- 言語処理アプリケーションのためのものが多い
扱う概念は幅広いが、抽象化は弱い
- Penman Upper Model / Generalized Upper Model
- 南カリフォルニア大学情報学研究所
- 自然言語文生成システムの一部→のちに多言語化
- 「概念(concept)」と「ロール(role)」の二体系、約250個の概念シソーラス
- 動詞的概念が比較的詳細
- 階層関係はそれほど厳密な分析ではない
- WordNet
- プリンストン大学
- 連想関係を中心とした大規模シソーラス(15万語以上)
→オントロジー開発の出発点として利用されることが多い
- 概念単位"synset"(同意関係にある語形の集合)・・・一応の用語と辞書的定義
- synsetを同意関係、上位下位関係、全体部分関係などで体系化
- 名詞synsetの最上位概念は9種類
- EDR電子化辞書(日本)
- 現在は情報通信研究機構から頒布
- 概念辞書41万語
- isaによる上下関係
- 概念間の関係子設定
形式オントロジー
- 哲学的な省察を形式的(=形式論に基づく)に記述するもの
★分析合成型の分類に近い
- Sowaのトップレベルオントロジー
- J.Sowaによる独自オントロジ
- 分析軸1:時空間による位置があるのか?・・・PysicalとAbstractに大別
- 分類軸2:他のものとの関係・・・Independent, Relative, Mediating←実際的理解はやや難しい
- 分類軸3:時空間にわたる同一性・・・ContinuantとOccurrent
- 12通りの可能性
一般的な事物:P×I×C
プロセス:P×I×O
- DOLCE(Descritive Ontology for Linguistic and Cognitive Engineering)
- 様々な上位オントロジーの参照モデルとして機能
3〜7層レベルの分類体系
体系自身は先験的
- Particularのオントロジー⇔Universal
- 多重的方法でParticularを記述
- 最上位はentity
Endurant=continuant「もの」・・・時間の中で属性が変わりうる、属性が変わっても同一とされる
Pardurant=occurent「プロセス」・・・時間の中で変化しない、属性が変わると同一とみなされない
Quality=知覚・測定できるもの(プロパティではない)・・・実体に帰属
値にあたるものがquale
Abstract=時空間qualityをもたず、qualityそのものでもないもの
- 基本原始関係は6種類
- カテゴリーと基本原始関係により、様々な関係が定義可能
メタオントロジー
- 個々の概念を記述する方法そのものに関するオントロジー・・・プロセスオントロジーとデバイスオントロジー
- SUO IFF Ontology
- SUMOによるメタオントロジー(IEEE)
- 明確に形式的な志向
- 属性の形式オントロジー
- Universalなオントロジー(「属性の属性」に関するオントロジー)
- メタ属性
R(rigidity:固定性)・・・状況に応じて変化しないかどうか
I(identity:同一性)・・・実体が同一であり続けるか
O(own identity:固有同一性)・・・同一性はその属性のものか
U(unity:個体性)・・・まとまりのあるものか
D(dependency:依存性)・・・他に対して依存関係があるか
例)Type +I+R+O
Role 〜R+D
- オントロジー構築の整合性チェック
上位オントロジー構築における課題と方向性
- 極めて多様、一概どれがよいとは言えない
常識オントロジー・・・理解しやすいが、不整合や欠落がある
形式オントロジー・・・体系的・網羅的だが、理解困難で制約が強い
- できるだけ広い範囲・応用で適用できるオントロジーを構築→双方を適度に合わせたもの
◎オントロジーについてのほかの参考書
溝口理一郎『オントロジー工学』 オーム社, 2005.1 275p.
斉藤孝『意味論からの情報システム:ユビキタス・オントロジ・セマンティックス』 中央大学出版部, 2006.4 294p.