TOP > 勉強会 > 2002年度 > / Last update: 2008.1.1

整理技術研究グループ勉強会記録(2002年度)

「ネットワーク情報資源の組織化」第15回


日時:
2003年2月6日(木) 19:20〜
会場:
日本図書館研究会事務所
発表者 :
蔭山久子氏(帝塚山大学図書館)
テキスト:
長塚隆 インターネット上の情報資源の恒久的な保存と公開 『情報管理』,Vol.45, No.7, p.466-476,(2002年10月号)
出席者:
吉田(帝塚山学院大)、田窪(近畿大学),河手(大阪樟蔭女子大学図書館)、蔭山(帝塚山大学図書館)、安威(梅花女子大学図書館)、村井(京都精華大学情報館)、堀池(京大学術情報メディアセンター)

●今回はインターネット上の情報資源のアーカイブの世界の動向について勉強しました。
・インターネット上のデジタル情報,特にボーン・デジタル情報の比率の増大が著しい。ボーン・デジタルは紙媒体などに印刷されないインターネット上でのみ存在するもの。
・生まれては消えて行くインターネット情報資源の保存・公開プロジェクトの取り組み状況,情報資源の保存と公開における技術的・法的な課題や問題点の整理,今後の方向性について文献の概要紹介がありました。
●インターネット上の情報資源の収集状況
・OCLC Web Characterization Project Webサイト数 874万サイト(2001)
・Google 24.7億Webページ(2002.8)
・surface Web(表層) 検索サービスが捕捉でき,公開されて索引可能なもの(19TB,テラバイト)
・deep Web(深層)検索サービスでは捕捉できない。(7,500TB,テラバイト)(表層Webの約400倍が存在)
●各国の取り組み状況
・Minerva(LC,2000-)
・NEDLIB(欧州8ヶ国,1997-)
・Nordic Web Archive(北欧5ヶ国,2000-2002)
・PANDORA(豪,1996-)
・WARP(日,2002-)
・Wayback Machine(アレクサ・インターネット社,1996-)
●保存・公開における課題
(保存対象)
・(1)制約をつけずに広く収集することを考えるべきと(2)将来の利用を考えた選択的な収集が必須であるという2つがある。
・2つの意見は対立するのではなく,保存にあたっては多様な収集機関が存在することが重要である。
・技術的などの理由で収集できない資料もある。(JavaScript,FLASH,ダイナミックWebなど) データベース,パスワード認証など。
(法的な問題)
・納本制度により収集しているところはほとんどない。日本はパッケージ系のみ。
・著作権 収集した有料でのオンライン出版物の公開。
●今後の課題
(収集)
・だれが,何を収集するのか
・収集のための技術の開発
・納本制度などの法的整備
(保存)
・長期的に何を保存するのか
 収集したものすべてか選択基準に基づく保存か
・長期保存のための技術開発
 保存された情報を技術の進歩に対応させて保管
(公開)
・検索システムの向上
・著作権法などとの整合
 無形のデジタル情報を扱えるように
● ネットワーク情報資源のようなたえず変化するものの収集基準のようなものがテキストには記述されているのか
 --> 基準にはふれられていない。現状をスナップショット的に早く保存するということでないか
● 自国サイトの収集でドメイン名から自国のみを認識して収集するには最近は難しい。(.COMなどの名前が増えている。)
 --> IPアドレスからは無理なのか。
● リンクになった情報はどう扱うとなっているのか
 --> わからない。収集基準などはふれられていない。
● 放送関係はどうするのか
 --> ふれられていない。
● メタデータ関係のことはどう記述されているのか
 --> ふれられていない。
● テキストはわれわれの勉強テーマの内容分析が弱い。
 --> 紹介レベルだけで分析的な部分が少ない。