整理技術研究グループ月例研究会報告
オントロジ記述言語とシソーラス:
比較から見えてくるもの
渡邊隆弘(神戸大学図書館)
- 日時:
- 2005年4月23日(土) 14:30〜17:00
- 会場:
- 大阪市立総合生涯学習センター第3会議室
- 発表者 :
- 渡邊隆弘氏(神戸大学図書館)
- テーマ :
- オントロジ記述言語とシソーラス−比較から見えてくるもの
- 出席者:
- 石田禎(ユニチカ)、伊藤寿(ダイキン工業)、伊藤真理(愛知淑徳大)、江上敏哲(京都大情報学研究科図書室)、蔭山久子(帝塚山大図書館)、河手太士(大阪樟蔭女子大図書館)、久保恭子(神戸松蔭女子学院大)、光斎重治、佐藤毅彦(甲南女子大)、田窪直規(近畿大)、田村俊明(大阪市立大学術情報総合センター)、土戸千晶(国立民族学博物館)、堀池博巳(京都大情報環境部)、松井純子(大阪芸術大)、村井正子(日本アスペクトコア)、村上幸二(奈良文化女子短大)、安威和世(梅花女子大図書館)、山崎直樹(大阪外国語大)、山下信、山野美贊子(帝塚山学院大非常勤)、吉田暁史(帝塚山学院大)、渡邊 <22名>
図書館情報学の扱う主題アクセスツールとセマンティックWebで開発が進む「オントロジ」との接点を探るという問題意識のもと、シソーラスの標準規格ISO2788とオントロジ記述言語OWLにおける概念管理や関係設定手法の比較を行った。
1.セマンティックWebとオントロジ
・もともと哲学用語(「存在論」)だった「オントロジ」は1980年代以降人工知能等の分野で注目され、「概念化の明示的な規約」などと定義される。「セマンティックWeb」では、共通的な構文枠組みによるメタデータ記述(RDFモデル&シンタックス)を前提に、プロパティや値の相互関係を伝達(「意味」の共有)するものと位置づけられている。
・セマンティックWebでは分散・非集権環境が前提とされるため、異なるオントロジ間の相互運用に資するオントロジ記述言語の標準化が進められた。2004年2月にW3C勧告となったOWL(Web Ontology Language)である。なお、クラス間の階層構造等比較的基本的なレベルの意味情報は、RDFスキーマ(RDF語彙記述言語)で扱われ、OWLではより精密な概念・語彙の管理を扱う(本発表では両者を合わせてOWLの語彙定義手法と扱った)。
・OWLの理論的基礎には知識表現の理論である「記述論理(Description Logic)」があり、これに基づいた計算の完全性と決定可能性を保証する。基本となる「OWL DL」と簡略版の「OWL Lite」、記述の自由度を拡大した反面計算の完全性等が必ずしも保証されない「OWL Full」の3サブ言語がある。
2.シソーラスにおける概念管理と関係構造
・ISO2788は単一言語シソーラス構築・開発のための国際規格で、1986に第2版が制定されている。
・索引語の選択と定義においては、用語の選択・複合語の取扱いなどに相当部分を割いている。用語はスコープノート(SN)により定義(限定)される。
・用語(概念)間の基本関係として、「等価関係」「階層関係」「連想関係」の3種がある。等価関係はUSE、UFで示される優先語と非優先語の関係であり、残る2つは優先語どうしの関係である。
・BT、NTで示される階層関係には、「類種関係」「階層的全体部分関係」「事例関係」の3カテゴリーがあるとされる。類種関係は「鳥/オウム」のようにall-and-some testで検証される概念間の関係である。全体と部分の関係は通常階層関係とは見なさないが、「身体の組織と器官」「地理的位置」「学問分野・研究領域」「階層的社会構造」の4カテゴリーのみ階層関係と見なす。事例関係は「山脈/ヒマラヤ山脈」のように概念と個々の事例(インスタンス)の関係である。
・相互にRTで示される連想関係は、等価関係・階層関係以外の関連する用語間の関係であり、明確な範囲の定義はない。ISO2788では「学問分野・研究領域とその対象・現象」「操作・過程と動作者・道具」「動作とその生産物」「行為とその受動者」「性質に関する概念」「起源に関する概念」「因果関係」「事物とその対抗物」「概念と測定単位」「共義的な句とその中の名詞」の10カテゴリーが示されるが、あくまで例示であり、一般的な全体部分関係をはじめとしてその他のカテゴリーも考えうる。
・階層関係、連想関係をより細かく管理するオプションとして、記号の細分(類種関係と階層的全体部分関係の区別)やノードラベル(カテゴリー別の見出し)等にも言及されている。
3.OWLにおける概念管理と関係構造
・基本的要素として、「クラス」「個体」「プロパティ」がある。クラス(class)はリソースをグループ化したものであり、「図書館」−「公立図書館」のように階層構造をとりうる。クラスの定義をOWLでは「クラス公理(class axiom)」と称する。
・個体(individual)とは「A市立図書館」のような個々の事物等であり、クラスのインスタンス(メンバー)となりうる。あるクラスに属する個体の集合を「クラス外延」と称する。OWL DLでは「型分離」の考え方があり、1つのリソースがクラスと個体を兼ねることはできない。個体に関する公理を、特に「事実(fact)」と称する。
・プロパティ(property)はクラスの属性やクラス間の関係に用いられるが、クラスとは独立して定義(「プロパティ公理」)されるところに特徴がある。プロパティ公理の基本は「定義域(domain)」(プロパティを「述語」と見た場合に「主語」となりうる範囲)と「値域(range)」(同じく「目的語」となりうる範囲)を定めることである。
3.1.クラス表現によるクラス公理
・サブクラスの表現(RDFスキーマで定義)
Class (ex:公共図書館partial subClassOf(ex.図書館))
*partialは「部分公理」(必要条件[必要十分条件でない]を定義)の意
・メンバー(個体)の完全列挙
Class(ex.:国立大学法人 complete oneOf(ex:北海道大学 ex:北海道教育大学… ex:琉球大学))
*completeは「完全公理」(必要純分条件を定義)の意
・プロパティ制約(値域制約、出現回数制約)
Class(ex.公立図書館 partial
restriction(ex:設立主体 allValuesFrom(ex:地方自治体)
restriction(ex:設立主体 cardinality(1)))
*「公立図書館」(クラス)の「設立主体」(プロパティ)は常に1つの「地方自治体」(クラス)であることを示す例
・クラスの論理組み合わせ(積・和・差)
Class(ex:電子鍵盤楽器 complete intersectionOf(ex:電子楽器 ex:鍵盤楽器)) *クラスの積
Class(ex:脊椎動物 complete unionOf(ex:魚類 ex:両生類 ex:爬虫類 ex:鳥類 ex:哺乳類)) *クラスの和
Class(ex:無脊椎動物 complete intersectionOf(ex:動物 complementOf(ex:脊椎動物)) *補集合の利用
・同等クラスの表現(クラス外延の同等性)
EquivalentClasses (ex:アメリカ合衆国大統領 ex:合衆国軍最高司令官))
・分離クラスの表現(互いに素であることを示す)
DisjointClasses(ex:哺乳類 ex:鳥類 ex:爬虫類)
3.2.個体に関する事実(公理)
・クラスとプロパティ値の明示
Individual(ex:A市立図書館
type(ex:公立図書館
value(ex:設立主体 ex:A市)
value(ex:所在地 "A市B町1-3-5")
…)
・個体間の関係(異同)
SameIndividual(ex:日本海 ex:東海)
DifferentIndividuals(ex:山田稔[1930- 仏文学] ex.山田稔[1930- 建築学])
3.3.プロパティに関する公理
・定義域と値域の指定(RDFスキーマで定義)
ObjectProperty(ex:設立主体
domain(ex:公立図書館) range(unionOf(ex:都道府県 ex:市町村)))
・プロパティ間の階層関係(RDFスキーマで定義)
ObjectProperty(ex:資本提携
subProperty(ex:提携) domain(ex:企業)range(ex:企業))
・プロパティ間の諸関係
ObjectProperty(ex:設立主体 equivalentProperty(ex:設立母体)) *プロパティの等価関係
ObjectProperty(ex:捕食 inverseOf(ex:被捕食) domain(ex:動物) range(ex:動物)) *反対関係
・プロパティの性質1:関数関係(定義域の固体が定めれば、値が一意に定まる)
ObjectProperty(ex:設立主体 Functional
domain(ex:公立図書館) range(ex:地方自治体))
・プロパティの性質2:逆関数関係(値が定めれば、定義域の固体が定まる)
ObjectProperty(ex:標準番号 InverseFunctional
domain(ex:逐次刊行物) range(ex:ISSN)
・プロパティの性質3:推移型プロパティ
TransitiveProperty(ex:下部組織
domain(ex:団体) range(ex:団体))
*AがBの下部組織、BがCの下部組織なら、Aは間違いなくCの下部組織
・プロパティの性質4:対称型プロパティ
SymmetricProperty (ex:姉妹都市提携
domain(ex:都市) range(ex:都市))
*AがBの姉妹都市なら、常にBはAの姉妹都市
4.比較による若干の考察
・対象とする概念の粒度という観点から見ると、シソーラスがドキュメント単位のアクセスを前提として文献の「主題」を扱うのに対して、知的エージェントによる推論のベースとなるオントロジではより細かいレベルの概念管理が求められている。
・シソーラスでは優先語の選択と用語定義が重要である。用語は基本的にはスコープノートで定義(範囲の明確化)され、間接的に階層関係等による明確化もある。オントロジでは必ずしも優先語を定めるという考え方はとらず、重なり合う概念が複数存在してもよい。OWLでは複数のクラス・個体・プロパティについて「同等性」を定義できるという考え方である。また、計算機が理解可能な定義を行うという観点から、スコープノートといった形式はとらず、基本的には他の要素との関連性において定義が行われる。
・OWLにおけるクラスと個体の区別という考え方は、シソーラスでいう普通名詞(概念)と固有名詞の区別(「事例関係」など)にあたる。ただし、文献主題を対象とするとき、どのレベルを個体と認識するのか(人名・地名等の固有名詞にのみ限定することが適切なのか)は検討を要すると考える。
・関係構造の設定に関しては、シソーラスでは類種関係を中心とする階層構造の管理が基本である。連想関係についてはきちんとした体系化ができているとはいえない。オントロジでも、階層構造(サブクラス)が基本的関係として装備されており、他の関係は設計者がプロパティとして追加していく(OWLはプロパティ設定文法を定めるのみ)こととなる。対象世界を分析した世界観で自由に設定ができること、プロパティがクラスから独立していること、プロパティにも階層構造を持たせられること、等により柔軟な表現力を持つと思われるが、より具体的な分析を試みないと踏み込んだ評価は難しい。
・シソーラスの連想関係を整理し、個々の関係の性質(推移性、対称性など)を分析してプロパティ表現する試みが必要ではないかと思われる。ISO2788等があげる諸関係(連想関係)についてプロパティの性質を考えてみると、まず対称性を持つものは意外に少ない(「概念とその反対概念」)といえる。このことは「RT」のみで相互に関係づけるという現行方式に無理があることを示している。一方、「学問分野」と「研究領域」のように反対関係のプロパティを設定可能なものは比較的多い。推移性については全体部分関係が中心になるが、全体部分関係にはいくつかのカテゴリーがあるという分析研究もある。また、関数関係・逆関数関係は個体を固定した場合の現象であるから固有名詞とその属性に関わるのが基本であるが、より広く個体(インスタンス)をとらえるなら「病気/病原体」なども関数的関係とみなせるかもしれない。
<参考>
神崎正英『セマンティック・ウエブのためのRDF/OWL入門』森北出版, 2005.1. 224p
W3C. Web Ontology Language (OWL) http://www.w3.org/2004/OWL/
(記録文責:渡邊隆弘)
研究会終了後、17時半〜20時半、「蔭山久子氏・山下信氏ご退職慰労会」を開催した。
大阪駅前第2ビル地下2階、「いわむら」にて。出席30名。→
慰労会写真