整理技術研究グループ勉強会記録(2002年度)
「ネットワーク情報資源の組織化」第13回
- 日時:
- 2002年12月18日(水) 19:20〜
- 会場:
- 日本図書館研究会事務所
- 発表者 :
- 前川和子氏(堺女子短期大学)
- テキスト:
- DESIRE Project 関連論文
Review of metadata : a survey of current resource description formatsの内
・PART II: Executive Summary(印刷形態でp.1から)
・Part I: AN OVERVIEW OF RESOURCE DESCRIPTION ISSUES (p.11まで)
- 出席者:
- 吉田(帝塚山学院大)、蔭山(帝塚山大学図書館)、前川(堺女子短期大学)、安威(梅花女子大学図書館)、河手(大阪樟蔭女子大学図書館)、村井(京都精華大学図書館)、川崎(仏教大学図書館)、尾松(奈良県立図書館)、堀池(京大学術情報メディアセンター)
●今回はDESIREプロジェクトのリソース記述問題について勉強しました。
DESIREのレポートではプロジェクトメンバーがメタデータフォーマットについて調査し,特徴点が簡潔にまとめられている。
● SCOPE
・DESIREプロジェクトは主題(Subject)に基づいたInfomation Gatewayを一般的なメタデータフォーマットを使用して構築している。
・この調査結果ではメタデータフォーマットに特別のフォーマットを用いることも許されることの背景的事項について述べている。
・また,メタデータフォーマットにディレクトリー型の記述フォーマットについても述べている。
● メタデータフォーマットの特徴・区分
・種々のメタデータを3つのバンド(band)という類型に区分し,分析
----------------+------------------------------------------------------
| Band One Band Two Band
Three
----------------+------------------------------------------------------
Record | Simple formats Structured formats Rich
formats
----------------+------------------------------------------------------
characteristics | Proprietary Emerging standards International
standards
| Full text Field structure Elaborate
tagging
| indexing
----------------+------------------------------------------------------
Record formats | Lycos Dublin Core ICPSR
| Altavista IAFA templates
CIMI
| Yahoo etc RFC 1807
EAD
| SOIF
TEI
| LDIF
MARC
----------------+------------------------------------------------------
●グルーピングはフォーマット同士の相違または同定するのに有益
(1) バンド1は構造化されていないデータを含む。
情報資源は機械的に収集されている。
フィールドによる検索方法は提供されていない。
データは明示的な意味論をほとんど持っていない。
(2) バンド2は構造化されたデータを含む。
フィールドによる検索方法も提供されている。
また,専門家でない利用者でも作成できるように単純化されている。
個別の対象(メタデータが対象とする情報単位)にのみ記述する傾向にある。
結果,対象同士の多面的な関係が捕らえられない。
体系性なく分類されている。
(3) バンド3は充分な記述フォーマットを持っている。
場所や発見のために使用される。
メタデータのコレクションには研究や学問的な活動に関係しているため,専門的な知識が要求される。
提携して行われる。
記述フォーマットは異なるレベルでバラエティある関係性を捕らえるだけの充分な表現をしている。
●3つのバンドからの特徴として
・これらのドキュメンテーション・フォーマットを利用しているコミュニティは情報資源の公開を望んでいる。
・各レコードは他のシステムにも転用されるだろう。
●フォーマット問題
・バンド1で現在(レポート当時),広く使われている標準はない。
・バンド2はRFC822の属性-値の対の型に影響を受けていて,簡単な記録構造に基づく傾向にある。(RFC-822はARPANETにおける電子メールの枠組みにおいて送信されるテキストメッセージ用構文を特定しています。メッセージは封筒と中味を持っています。)
テンプレートのデータに「クラスター」と呼ばれるいくつかの重要なものが存在し続けた。
・ダブリンコアはシンプルな情報資源記述フォーマットであるが2つの発展方向があるかもしれない。
(1)エレメントの拡張性
(2)異なったレベルの十分な内容を持つものや,異なったコミュニティーの中にある情報資源記述のためのデザインされるだろう
「Warwick Framework」に相当する考え方。複数のメタデータ規則に基づくメタデータ記述を検討。
●ダブリンコアは横断的な相互運用性に利用される方向にあるかもしれない。
●プロトコル問題
・バンド2はwhois++,LDAPおよびDiensなどインターネット上での分散環境のディレクトリ(イエローページや住所録のような)のアプローチである。プロトコル(通信規約)はZ39.50がよく使われる。
・バンド3は情報資源収集にZ39.50 profileに興味が持たれている。
● インプリメンテーション(実装)
・資源発見サービスはまだ(当時)初期段階。多くのフォーマットはまだ開発中か広く実行されていない。
・バンド2(発見カテゴリー)はIAFA/whois++テンプレートはいくつかのプロジェクトが使用している。ダブリンコアは同様。
・バンド3(ドキュメンテーション・カテゴリー)はユーザコミュニティーが特に一致を目指している。
・大多数のZ39.30の適用はMARCに基づいた資源探索を含んでいるが他のプロフィールが導入されるとともに,これは徐々に変わるかも知れない。
●まとめ
・種々の異なるアプローチが存在し,それらの変更を認めていかなければならない(DESIREプロジェクトは)