TOP > 勉強会 > 2005年度 > / Last update: 2008.1.1

整理技術研究グループ勉強会記録(2005年度)

「セマンティックWebと資料組織法」第2回


日時:
2005年4月14日(木) 19:00〜
会場:
日本図書館研究会事務所
発表者 :
蔭山久子氏
テキスト:
情報処理相互運用技術協会編 『セマンティックWeb入門』オーム社, 2004.11
 第6章「セマンティックWebの応用」6.1, 6.6, 6.8, 6.9
出席者:
吉田(帝塚山学院大学)、渡邊(神戸大学附属図書館)、蔭山、戸上(帝塚山学院大学)、松井(大阪芸術大学)、田窪(近畿大学)、川崎(佛教大学)、土戸(国立民族学博物館)、河手(大阪樟蔭女子大学図書館)

6.1 ブログとRSS
ブログ…Web+log
閲覧したWebに対してコメントを付したり、簡単な記事を発進したりできる個人ベースの情報発信メディア
ブログツールは他人の記事から自分の記事にリンク(逆リンク)をはってコメントできるトラックバック(Trackback)とRSS(RDF Site Summary)の機能を持つ
RSS  …サイトの概要をメタデータとして簡潔に記述するためのRDFまたはXMLフォーマット
1999.3 Netscape社 RSS0.9 RDFベース 見出し一覧を配信するためのもの
1999.7 RSS0.91 description、要約、格付け、著作権、更新日付などの要素を追加
    Rich Site Summary XMLベース、複雑化
?   RSS0.92 XMLベース
?   RSS0.93, 2.0 XMLベース Really Simple Syndication
2000.12 RSS1.0 RSS-DEVワーキンググループ、RDFベース
1. 基本的なサマリー提供機能をコアなRSSとして定義する
2. より高度な機能は(XML名前空間を利用した)モジュールとして追加できる
2002.8 RSS2.0 RSS0.91/0.92等にあれこれ付け足したもの
日本ではRSS1.0が多い
今後セマンティックWebの普及によりRDFによるほかのメタデータも増加。
それらとの組み合わせで必要な情報を絞り込んだり、リッチな複合サービスにして行こうというとき、拡張性でブログではRDFベースのRSS1.0を推奨。

6.6 メタデータとオントロジーを活用したWeb検索
1. Web検索の問題
 google…キーワード検索エンジン
 検索語のみではユーザの意図を反映させるのに不充分→質的限界
 Yahoo,Open Directory Project…分類階層
 人が内容を判断して分類を行う人手作業の限界→量的限界
 セマンティックWebの技術は、現在のWebの仕様を大幅に変更することなく、各文書へのメタデータ付与を段階的に行うことにより、最終的には索引や目次に相当する以上のものを提供できる可能性がある。
2. メタデータを活用したWeb検索システム(デモ用)
 セマンティックWebコンファレンス203で紹介したWeb検索システム
 入力としてRDF形式のメタデータとオントロジーを与え、ブラウザからのユーザ指示によって、入力として与えられているメタデータの絞込みや展開を行い、その結果をブラウザに出力する。
(1)RDFメタデータを解釈し、指定されて任意の要素を抽出するプログラム
(2)ブラウザからユーザが検索語の入力や指定を行い、出力結果を表示するプログラム
 (a) 第1フェーズ:メタデータの基本的な利用による検索(メタデータの絞込みと展開)
  例:目的とする文書へのアクセスが容易になる。
  前提として、サイト内に格納されている文章には、メタデータとして「文書タイトル」「文書作成者」「作成年月日」等の情報が付与されているものとする。
 (b) 第2フェーズ:メタデータの応用的な利用による検索(メタデータの組み合わせとオントロジー参照)
  例:「特定人物A」の役職を時系列で表示したい。
  前提として、既存文書中で「特定人物」が出現しているものに、メタデータとしての文書作成年月日とその時点での人物の役職情報が付与されているものとする。また時間の表記のゆれを吸収するための背景知識(オントロジー)が存在し、それを参照することで時の表現の相互変換が可能であること。
 (c) 第3フェーズ:メタデータの発展的な利用による検索(エージェントの活用)
  例:ある日の大臣発言に対する世間の評判を収集する
  前提として、RSSのようなメタデータ形式が規定され、各コンテンツがメタデータを有しているものとする。
  ★第3フェーズは第2フェーズのつみかさねのようには思えない。
3. メタデータ活用に対する今後の課題
 メタデータを活用するためには、まず検索対象となる文章にメタデータが付与されていなければならない。
 そのためコンテンツ製作者に、
 ・メタデータによるメリットの明確化
 ・メタデータを簡単に付与するしくみをPRする必要がある。
  実用化するには簡潔にして十分なタグセットの策定が必要である。
  ★「ダブリンコアは使い物にならないよ」といっているのではないか。
  ★ →各分野でつかえるタグセットをつくりその間のオントロジーをつくれさえすればよいことを示唆している

6.8 ナレッジマネジメントへの適用例
セマンティックWebをイントラネット(企業内、組織内)に適用することで実用的な応用例が作り易い
1. スイス生命SKiM
 目的:従業員のスキル管理
 各言語による言語の相違、分野(個人保険と企業保険)による用語の意味の相違を吸収する手段としてオントロジーが必要。
 スキル700概念、教育180概念、職能130概念によるオントロジーを構築。
 各人が自分のホームページで自己申告ベースでスキルを登録
2. 富士通研究所KnowWhoシステム
 各人がスキルを登録するのではなく、人のスキル・人脈情報をグループウェアのスケジュールや議事録から自動で統合・抽出し、KnowWho検索できる「ヒューマンナレッジ・ナビゲータ」を試作。
 抽出したメタデータをRDF化
 拡張の容易さとグラフによる表現が可能
3. 課題:トラストに向けて
 セマンティックWebはイントラネットやエクストラネットなどの閉じたコミュニティから新しい動きが起こってくるのではないか。
 インターネット規模に広げるには、セマンティックWebの最上位階層のトラスト(情報の信頼性を保証する枠組み)が重要。

6.9 セマンティックWebサービス
1. Webサービスとは
 Webサービス…[広義] Webアプリケーション(Google、Yahoo!など)
        [狭義] Webベースのアプリケーション(XML Webサービス)
 狭義のWebサービスを支える標準技術
 プロトコルSOAP(Simple Object Access Protocol)
 サービスを呼び出すためのプロトコル(通信規約)
 ・サービス記述言語WSDL(Web Services Description Language)
  XMLをベースとしたWebサービスを記述するための言語
  サービスのインターフェイスと呼び出し方法、サービスの提供場所などを定義
 ・サービスレジストリUDDI(Universal Description, Descovery, and Integration)
  インターネット上に存在するWebサービスの登録と検索のためのシステム(レジストリ)
  2004年6月現在稼動しているパブリックなUDDIは4つ
  SOAPとWSDLはW3Cで、UDDIはOASISで標準化が進められている。
2. Webサービスの発見
 UDDI White Page機能、Yellow Page 機能、Green Page 機能
3. Webサービスの動的な合成
 複数のWebサービスを正しい順序で並べる作業
 作成されたWebサービスのフローを記述する言語…BPEL4WS、WS-CDL
 そのフローの実行エンジン…BPEL
4. セマンティックWebサービスとは
 Webサービスには、サービスのセマンティックスを記述する方法が用意されていない。
 セマンティックWebサービス
 セマンティックス技術によるメタデータやオントロジーによってそれらを記述し、Webサービスを補完しようとする試み
 OWL-S…セマンティックWebサービスを支える標準技術
  サービスプロファイル、サービスモデル、サービスグランディングで構成
  サービス内容を意味的に定義し、機械的に理解して利用できるようにする。
5. セマンティックWebサービスの発見
 マッチメイキングエンジンの開発
6. セマンティックWebサービスの動的な合成
 KarmaSIM、mindswapプロジェクト
7. セマンティックWebサービスを取り巻く標準化動向
 OWL-S Service Collection→OWL Service CollectionとW3CやSWSIと連繋しながら仕様作成中
8. セマンティックWebサービスの今後
 Webサービスは今後e-Businessのインフラとなることが期待されている。
 課題:オントロジー構築やサービスへのメタデータ付与を誰が行うのか。
 セマンティックWebが人工知能との相違として掲げている知識の不完全さがどこまで許容されるか。
 Webの情報(データやサービス)のオートメーション化という大目標に向かって進んでいる。