整理技術研究グループ勉強会記録(2005年度)
「セマンティックWebと資料組織法」第3回
- 日時:
- 2005年5月6日(金) 19:00〜
- 会場:
- 日本図書館研究会事務所
- 発表者 :
- 田窪直規氏(近畿大学)
- テキスト:
- 神埼正英著「セマンティック・ウェブのためのRDF/OWL入門」森北出版株式会社 2005.1 (ISBN:4-627-82931-0) 第2章 RDFの概念とモデル
- 出席者:
- 渡邊(神戸大学附属図書館)、戸上(帝塚山学院大学)、松井(大阪芸術大学)、田窪(近畿大学)、川崎(佛教大学)、河手(大阪樟蔭女子大学図書館)
〇はじめに
・セマンティック・ウェブ
2004年2月:基本的仕様がW3C勧告となる
SF的な夢から実現可能なビジョンへ・・・具体的な技術の積み重ね
・当書の内容
セマンティック・ウェブの基本的考え方
現在までにほぼ固まった技術仕様
今後進められる技術開発の一部の紹介
・当書の中心的内容
RDF:リソースの関係を計算機が処理できる形で「論理的」に記述
RDFスキーマ、OWL:情報を表現する語彙を定義
・当書の構成と読み方
1章:セマンティック・ウェブの背景と全体像
2〜4章:RDFのモデルと構文の解説
5章:RDFスキーマ
6章:OWL←大変な章なので1節の最後に読み方ガイド付き
7〜8章:応用編
7章:既存の語彙の利用、ツールを使ってのRDF文章の作成
8章:自ら語彙を定義する方法
9章:RDFの検索と推論(今後の技術課題)
APPENDIX:RDFによる推論に必要な論理モデル
注:RDFの論理的背景
サポート・サイト:http://www.kanzaki.com/book/rdf/
1章:セマンティック・ウェブ
1.1 ウェブの過去・現在・未来
1.1.1 WWWの誕生と意味ネットワーク
・1989年3月:ティム・バーナーズ=リー
ハイパーテキストによるリンク型情報システムの提案
←ノードとリンクによる情報記述の柔軟性、マシンの自動処理の可能性
1.1.2 ウェブのセマンティックス
・1994年:ウェブにセマンティックを与える必要性(型(タイプ)情報付リンク)
・1998年:ウェブ上のデータ交換のためのXMLがW3Cにより勧告
・1999年:リンク関係を表現するためのRDFの誕生
・リソースをURIで識別、その関係性をRDFで記述、XMLの基盤上で自動処理
1.2 セマンティック・ウェブの考え方
1.2.1 設計の基本5原則
URIで識別可能
部分的な情報(Partial Information)
発展性(Evolution)
最小のデザイン(Minimalist Design)
信頼のウェブ(Web of Trust)
1.2.2 セマンティック・ウェブへの階梯
・1998年のリーの"レイヤー・ケーキ"
・RDFとウェブ・オントロジ(2004.2 W3C勧告)
RDFの定義とXMLによる構文→RDFによるリソース記述語彙定義のスキーマ
オントロジによる詳細表現、語彙の橋渡し、「発展性」
・推論規則と論理フレームワーク
オントロジに基づく推論処理←述語論理や論理プログラミング
・証明と署名と信頼
証明により推論を信頼、改竄防止のために暗号化と電子署名
1.2.3 メタデータ
・利用者の積極的な参加が重要、自動付与オーサリング・ツールが必要
・「キラーアプリケーション」の必要性
2章:RDFの概念とモデル
・RDF:主語+述語+目的語の三組(トリプル)、グラフによる記述
2.1 RDFの目的と基本設計
・リソースをシンプルかつ柔軟なモデルで扱う
・論理的な裏付けのあるセマンティックスで表現
2.1.1 RDFとウェブのリソース
・リソースに関する情報を明瞭かつ論理的に表現するモデル∩言語体系
・リソース=識別可能なもの(URI)
・異なるアプリケーションが情報の基本的な意味を相互理解・利用
・ソフトがルール沿って自動的に処理←論理的表現
・セマンティック・ウェブ表現のための共通言語
2.1.2 RDFの基本的な考え方
1.シンプルで柔軟なデータ・モデル:最小デザイン原則に基づくシンプルで柔軟なトリプル
2.論理学的な裏付けのあるセマンティックス表現と証明可能な推論
:形式論理のモデル理論→推論(エージェント・システム)の基盤
3.URIに基づく拡張可能な語彙の利用:分散的に付与、確実にリソースを特定
4.XMLによる交換構文の採用
:既存ツールでの扱いやすいデータ作成、再利用と相互運用性の高度化
5.XMLスキーマ・データ型によるデータの精密な型付け:リテラル値の正確な扱い(数字、日付)
6.誰でも、どんなリソースについても記述可能:ウェブという分散型メディア+URIの利用
2.2 RDFトリプルとグラフ
・主語+述語+目的語のトリプル→マシン処理が容易、論理的関係表現が可能
・グラフ→トリプルの集合、自在に結合可能、分散情報を柔軟に扱える
2.2.1 マシンに理解しやすいデータ・モデル
・テーブル:データを明確に、コンピュータに処理しやすく表す方法
行がレコード、列が属性情報、行列の交点が値
2.2.2 RDFのトリプル
・文=主語+述語(プロバティ)+目的後(値)←トリプル
←述語論理の二項式:p(s,o) ≒ 関数:目的語y=述語f(主語x)
∴定義域(ドメイン)=主語がとる範囲
値域(レンジ)=目的語がとる範囲
・主語:楕円、目的語:楕円・方形(ノード) / 述語:矢印(アーク)
←ラベルつき有向グラフ
2.2.3 RDFのグラフ
・グラフ=トリプルの集合
・目的語←→主語
★図2.5 で"http://〜"のノードから「神崎正英」へ「作者」という矢印は引けるのか?
・グラフ←簡単なトリプルに分解可能
ノードを介する連結(併合)・・・大きく複雑なデータが表現可能
ノードが同じであれば併合可能・・・分散型情報の発信が可能
2.3 URIとリソース
2.3.1 プロパティをURIで表す
・URI参照による名前付け (例:http://purl.org/dc/elements/1.1/title)←名前空間
・それぞれのラベルをURI参照により関連付ける→互いのデータが容易に交換可能
←UNIMARC的効用
2.3.2 ノードの識別←URI参照
・同一URIをもつトリプル・・・同一のグラフに併合←目的語もOK、同一プロパティはNG
・目的語・・・URIによって参照されるリソース、文字列自身(リテラル)
←リテラル・ノードは主語になれない ∴グラフの終点
2.3.3 RDFのURI参照とリソース
・URI・・・1つのリソース識別子←HTMLの文書・部分とは異なる
・名前空間URI←語彙グループとしてまとめる意味以上なし←文章と関係がない
・RDFのURI参照と国際化(IRI)
URI参照・・・RFC2396定義文字とUnicodeの多くの文字
RDF URI参照・・・URLエンコード結果がRFD2396準拠ならOK
2.4 空白ノードとリテラル
・空白ノードの利用・・・構造的なデータ表現
・リテラル・・・目的語を直接文字列として記述
2.4.1 空白ノードと構造化グラフ
・空白ノード・・・URI参照で名前付け不要、ORしづらいリソースに利用
構造化して表現したい場合に利用
・図2.10:何らかのものXがあって、そのIDは「MK705」、そのHPは「http://www.kanzaki.com」
・図2.11:HPの作者Xがいて、その氏名は「神崎正英」、そのアドレスは「webmaster@kanzaki.com」
←作者のプロパティとして構造化
プロパティのうち作者関連の属性をグルーピング
2.4.2 RDFリテラルの定義
・リテラル・・・データそのものの直接表記
・目的語のみ可能←主語、述語は不可能
・プレーン・リテラル・・・文字列そのもの(+言語タグ)
XML構文:rdf:lang、N-triples記法:@
・型付リテラル・・・データ型を表現(文字列、整数、日付・・・・・)
XML構文:rdf:datatype、N-triples記法:^^
2.4.3 データ型とは
・データ型・・・字句空間、値空間、字句-値写像から構成
字句空間・・・データを表現する文字列←RDFリテラルとして表現
値空間・・・文字列が実際に意味する値の集合
字句-値写像・・・字句空間の文字列を値空間の値に対応付ける組み合わせ集合
・RDFの組み込みデータ型・・・rdf:XMLLiteral
・XMLスキーマ・データ型
テキスト23p.にリスト・アップしたものを使用←それ以外はRDFのデータ型モデルに非適合