TOP > 勉強会 > 2005年度 > / Last update: 2008.1.1

整理技術研究グループ勉強会記録(2005年度)

「セマンティックWebと資料組織法」第3回


日時:
2005年5月6日(金) 19:00〜
会場:
日本図書館研究会事務所
発表者 :
田窪直規氏(近畿大学)
テキスト:
神埼正英著「セマンティック・ウェブのためのRDF/OWL入門」森北出版株式会社 2005.1 (ISBN:4-627-82931-0) 第2章 RDFの概念とモデル
出席者:
渡邊(神戸大学附属図書館)、戸上(帝塚山学院大学)、松井(大阪芸術大学)、田窪(近畿大学)、川崎(佛教大学)、河手(大阪樟蔭女子大学図書館)

〇はじめに
・セマンティック・ウェブ
 2004年2月:基本的仕様がW3C勧告となる
 SF的な夢から実現可能なビジョンへ・・・具体的な技術の積み重ね
・当書の内容
 セマンティック・ウェブの基本的考え方
 現在までにほぼ固まった技術仕様
 今後進められる技術開発の一部の紹介
・当書の中心的内容
 RDF:リソースの関係を計算機が処理できる形で「論理的」に記述
 RDFスキーマ、OWL:情報を表現する語彙を定義
・当書の構成と読み方
 1章:セマンティック・ウェブの背景と全体像
 2〜4章:RDFのモデルと構文の解説
 5章:RDFスキーマ
 6章:OWL←大変な章なので1節の最後に読み方ガイド付き
 7〜8章:応用編
 7章:既存の語彙の利用、ツールを使ってのRDF文章の作成
 8章:自ら語彙を定義する方法
 9章:RDFの検索と推論(今後の技術課題)
 APPENDIX:RDFによる推論に必要な論理モデル
 注:RDFの論理的背景
 サポート・サイト:http://www.kanzaki.com/book/rdf/
1章:セマンティック・ウェブ
1.1 ウェブの過去・現在・未来
1.1.1 WWWの誕生と意味ネットワーク
・1989年3月:ティム・バーナーズ=リー
 ハイパーテキストによるリンク型情報システムの提案
 ←ノードとリンクによる情報記述の柔軟性、マシンの自動処理の可能性
1.1.2 ウェブのセマンティックス
・1994年:ウェブにセマンティックを与える必要性(型(タイプ)情報付リンク)
・1998年:ウェブ上のデータ交換のためのXMLがW3Cにより勧告
・1999年:リンク関係を表現するためのRDFの誕生
・リソースをURIで識別、その関係性をRDFで記述、XMLの基盤上で自動処理
1.2 セマンティック・ウェブの考え方
1.2.1 設計の基本5原則
 URIで識別可能
 部分的な情報(Partial Information)
 発展性(Evolution)
 最小のデザイン(Minimalist Design)
 信頼のウェブ(Web of Trust)
1.2.2 セマンティック・ウェブへの階梯
・1998年のリーの"レイヤー・ケーキ"
・RDFとウェブ・オントロジ(2004.2 W3C勧告)
 RDFの定義とXMLによる構文→RDFによるリソース記述語彙定義のスキーマ
 オントロジによる詳細表現、語彙の橋渡し、「発展性」
・推論規則と論理フレームワーク
 オントロジに基づく推論処理←述語論理や論理プログラミング
・証明と署名と信頼
 証明により推論を信頼、改竄防止のために暗号化と電子署名
1.2.3 メタデータ
・利用者の積極的な参加が重要、自動付与オーサリング・ツールが必要
・「キラーアプリケーション」の必要性

2章:RDFの概念とモデル
・RDF:主語+述語+目的語の三組(トリプル)、グラフによる記述
2.1 RDFの目的と基本設計
・リソースをシンプルかつ柔軟なモデルで扱う
・論理的な裏付けのあるセマンティックスで表現
2.1.1 RDFとウェブのリソース
・リソースに関する情報を明瞭かつ論理的に表現するモデル∩言語体系
・リソース=識別可能なもの(URI)
・異なるアプリケーションが情報の基本的な意味を相互理解・利用
・ソフトがルール沿って自動的に処理←論理的表現
・セマンティック・ウェブ表現のための共通言語
2.1.2 RDFの基本的な考え方
1.シンプルで柔軟なデータ・モデル:最小デザイン原則に基づくシンプルで柔軟なトリプル
2.論理学的な裏付けのあるセマンティックス表現と証明可能な推論
 :形式論理のモデル理論→推論(エージェント・システム)の基盤
3.URIに基づく拡張可能な語彙の利用:分散的に付与、確実にリソースを特定
4.XMLによる交換構文の採用
 :既存ツールでの扱いやすいデータ作成、再利用と相互運用性の高度化
5.XMLスキーマ・データ型によるデータの精密な型付け:リテラル値の正確な扱い(数字、日付)
6.誰でも、どんなリソースについても記述可能:ウェブという分散型メディア+URIの利用
2.2 RDFトリプルとグラフ
・主語+述語+目的語のトリプル→マシン処理が容易、論理的関係表現が可能
・グラフ→トリプルの集合、自在に結合可能、分散情報を柔軟に扱える
2.2.1 マシンに理解しやすいデータ・モデル
・テーブル:データを明確に、コンピュータに処理しやすく表す方法
 行がレコード、列が属性情報、行列の交点が値
2.2.2 RDFのトリプル
・文=主語+述語(プロバティ)+目的後(値)←トリプル
 ←述語論理の二項式:p(s,o) ≒ 関数:目的語y=述語f(主語x)
  ∴定義域(ドメイン)=主語がとる範囲
  値域(レンジ)=目的語がとる範囲
・主語:楕円、目的語:楕円・方形(ノード) / 述語:矢印(アーク)
 ←ラベルつき有向グラフ
2.2.3 RDFのグラフ
・グラフ=トリプルの集合
・目的語←→主語
 ★図2.5 で"http://〜"のノードから「神崎正英」へ「作者」という矢印は引けるのか?
・グラフ←簡単なトリプルに分解可能
 ノードを介する連結(併合)・・・大きく複雑なデータが表現可能
 ノードが同じであれば併合可能・・・分散型情報の発信が可能
2.3 URIとリソース
2.3.1 プロパティをURIで表す
・URI参照による名前付け (例:http://purl.org/dc/elements/1.1/title)←名前空間
・それぞれのラベルをURI参照により関連付ける→互いのデータが容易に交換可能
 ←UNIMARC的効用
2.3.2 ノードの識別←URI参照
・同一URIをもつトリプル・・・同一のグラフに併合←目的語もOK、同一プロパティはNG
・目的語・・・URIによって参照されるリソース、文字列自身(リテラル)
 ←リテラル・ノードは主語になれない ∴グラフの終点
2.3.3 RDFのURI参照とリソース
・URI・・・1つのリソース識別子←HTMLの文書・部分とは異なる
・名前空間URI←語彙グループとしてまとめる意味以上なし←文章と関係がない
・RDFのURI参照と国際化(IRI)
 URI参照・・・RFC2396定義文字とUnicodeの多くの文字
 RDF URI参照・・・URLエンコード結果がRFD2396準拠ならOK
2.4 空白ノードとリテラル
・空白ノードの利用・・・構造的なデータ表現
・リテラル・・・目的語を直接文字列として記述
2.4.1 空白ノードと構造化グラフ
・空白ノード・・・URI参照で名前付け不要、ORしづらいリソースに利用
 構造化して表現したい場合に利用
・図2.10:何らかのものXがあって、そのIDは「MK705」、そのHPは「http://www.kanzaki.com」
・図2.11:HPの作者Xがいて、その氏名は「神崎正英」、そのアドレスは「webmaster@kanzaki.com」
 ←作者のプロパティとして構造化
 プロパティのうち作者関連の属性をグルーピング
2.4.2 RDFリテラルの定義
・リテラル・・・データそのものの直接表記
・目的語のみ可能←主語、述語は不可能
・プレーン・リテラル・・・文字列そのもの(+言語タグ)
 XML構文:rdf:lang、N-triples記法:@
・型付リテラル・・・データ型を表現(文字列、整数、日付・・・・・)
 XML構文:rdf:datatype、N-triples記法:^^
2.4.3 データ型とは
・データ型・・・字句空間、値空間、字句-値写像から構成
 字句空間・・・データを表現する文字列←RDFリテラルとして表現
 値空間・・・文字列が実際に意味する値の集合
 字句-値写像・・・字句空間の文字列を値空間の値に対応付ける組み合わせ集合
・RDFの組み込みデータ型・・・rdf:XMLLiteral
・XMLスキーマ・データ型
 テキスト23p.にリスト・アップしたものを使用←それ以外はRDFのデータ型モデルに非適合