TOP > 月例研究会 > 2002 > / Last update: 2008.1.1

整理技術研究グループ月例研究会報告

ネットワーク情報資源の組織化−勉強会報告(3)

吉田暁史氏(帝塚山学院大学)


日時:
2002年12月21日(土) 14:30〜17:00
会場:
大阪市立大学医学部医療研修センター
発表者 :
吉田暁史氏(帝塚山学院大学)
テーマ :
ネットワーク情報資源の組織化−勉強会報告(3)
出席者:
堀池博巳(京大メディアセンター)、田窪直規(近大)、山野美贊子(大阪府大総合情報センター)、蔭山久子(帝塚山大学図書館)、山岸修(佛教大学図書館)、浜田行弘(関西学院大学)、藤井絹一(産業技術短大)、村井正子(京都精華大学情報館)、吉田暁史

I.DESIRE Handbook
 http://www.desire.org/handbook/
1.情報資源の発見
(1)ゲートウェイマネージャーがなすべきこと
1)重複の回避
・他のゲートウェイとの重複回避:他のゲートウェイとの共同作業が必要であり、同時に複数のゲートウェイが検索できる相互検索機能が必要。またメタデータの共有も必要となる。
・ゲートウェイ内での重複作業の回避:異なる主題や、異なる対象をメンバーに対して与える。
2) 作業に適切な人材
 情報資源の発見の作業を行うためにどのような人材を雇うかは、お金と方針に基づくだろう。
・ボランティア
 コストは安いが、一貫性や信頼性が低い。必要とする高品質な情報資源を選択できる主題知識を持つボランティアを見つけるのは困難。
・主題専門家
 情報資源を発見するために最も適切で、評価もできるが、コストが高く、補充困難、目録作成にあまり積極的でない。
・図書館員/情報の専門家
 目録作成や情報検索には最適だが、補充が困難でコスト高価。
(2)スタッフための情報資源の発見戦略
1)ブラウジング
・既知の専門家のホームページを探すこと
・Webに公開された研究成果
・専門家が作成した研究に役立つリンク集
・専門団体のホームページ
 図書館のWebサイト、学術部門のWebサイト等、主題分野の最も重要なサイトを見つけてリンク集を見る、信頼できるサイトの"What's New"などを見る
2)メーリングリストやそのアーカイブ
・そのメーリングリストに参加してメッセージを読む
・主題に基づくメーリングリスト
3)配布リストやカレントアウェアネスサービス
 無料で購読できる電子メールサービスにより、最新情報や速報、発表を定期的に入手することができる。主題領域の主要な個人や団体が行っているそういったサービスを受ける価値はある。
4)検索ツール
 多くの検索ツールは膨大な件数を検索するので、これによる検索は時間を浪費する。しかし、場合によっては有効な戦略であることもある。異なる検索エンジンを使うことにより異なる種類の情報を有効に探索することもできる。
5)ニュースグループやフォーラム
6)非インターネット情報源
・会話による:主題領域やインターネットの熱心な利用者や専門家推薦のサイト
・印刷された出版物

II.Review of Metadata
 http://www.ukoln.ac.uk/metadata/desire/overview/
1.メタデータとは何か
・どのような例があるか。
(1)資源中の記述データ
 HTMLファイル中のメタタグ、TEIのヘッダ、PNGやTIFFファイルも構造化記述データを持つことがある。
(2)Eメール中のヘッダ。プログラム中にある名称などのデータ
(3)サブジェクトゲートウェイ
(4)記録文書中。起源、使用歴史、所有者、使用条件等
(5)統計データ集。使用のための諸注意、データ処理、分析のための方法などのデータを含む。
(6)地理情報システム中。使用方法、閲覧方式等
(7)データベース・マネージメントシステム中
・メタデータとしてどのような役割が必要とされるか。
(1)資源発見のため
(2)ビジネスや研究目的のためには、その起源、文書化の歴史、責任性、完全性と信頼性、他の資源との関係、等。
(3)供給事業者の場合は著作権処理関係。
(4)情報内容を抽出するためのツール、利用するための設備、教科書か学術単行書か。
(5)データの使用条件。
(6)プロトコルやフォーマットなどの技術的インターフェース
(7)子どもに見せられるかどうか
(8)将来の使用者
2.定義
3.資源とは
 もともとはサーバーやサイト、もしくはサーバー中のファイルが対象。最近では、中間レベルの粒度に関心:コレクション、ウェブページの集合体等。またファイル、データベース、データとサービスの複合といったあいまいなもの。
4.メタデータモデルの歴史
(1)図書
 図書では独自のメタデータとして、目録技術が古くから使われてきた。
(2)ドメインを超えた議論
 図書館ドメインでは、publicationレベルが出発点であっても、別のドメインではコレクションレベルが中心かもしれない(アーカイブ界)。一方ここではアイテムレベルも重要。このようにドメインによってそれぞれ重要な機能用件は変わってくる。FGDCでは、発見や位置情報、使用のための適切さ、セットとなったデータへのアクセス、データの遷移などが重要。各ドメイン特有の必要用件が求められる。
 しかしときには、ドメインを超えて検索する場合がある。図書、雑誌、アーカイブ、博物館資料、標本、画像コレクション、地図や地球空間データ、等々。そこで共通検索のためのshallow access手法(広く浅く検索)が必要となる。

5.ネットワーク情報資源検索のための3類型
   Band 1        Band 2                 Band 3
 フルテキスト    単純な構造化       より複雑な構造  より大きなフレームワークの
             フォーマット        ドメイン特有     一部分
 独自フォーマット  独自フォーマット
 Yahoo等       Dublin Core        FGDC        EAD
             IAEA Template      MARC        TEI headers
             RFC1807          GILS         CIMI

○第1レベル。発見よりは、位置に重点。アイテムレベルは除外。重複ファイルや資源間の関係などは認識しない。
○第2レベル。ダブリンコアなど。フォーマットは単純な構造。コンピュータ科学界から出現。検索と発見サービスの基礎。ダブリンコアは例外で、広範な合意によりメタデータ要素が設定された。手作業か、自動+手作業修正で作成。おおむね非専門家によって作成可能な単純フォーマット。ユーザが直接アクセスすることなしに、資源のおおよそを把握できる程度には十分な記述が行われる。ドメインとメディアタイプを超えて相互操作するときの中間フォーマットとしてふさわしい。
○第3レベル。MARCやTEIヘッダ。専門家が作成。通常マニュアルで、高度な品質結果のために目録規則類が必要。位置と発見双方のために必要なフル記述を備える。個々の文書のみならず、非常にしばしばコレクション全体に対する記述を行う。内容分析と対象物の集合に対するナビゲーション機能をも持つことがある。種々のレベルにおける関係性を把握できるほど表現力がある。直接このレベルで検索することもあれば、より単純な第2レベルに変換して、一般的な検索を行うこともあろう。ダブリンコアはまさしくこのための横断的なフォーマットとして位置づけれられよう、ただし現在まだそのような使われ方はしていないが。

◎月例研究会終了後忘年会を開催。於:楓林閣(アポロビル9階)
出席:堀池、田窪、蔭山、山岸、浜田、吉田、杉本、川崎