TOP > 月例研究会 > 2000 > / Last update: 2008.1.1

整理技術研究グループ月例研究会報告

『ディジタル図書館』輪読会を終えて

尾松謙一、村井正子、前川和子


日時:
2000年10月28日(土) 14:30〜17:00
会場:
難波市民学習センター
発表者 :
尾松謙一氏(奈良県立奈良図書館)、村井正子氏(システムズ・デザイン株式会社)、前川和子氏(堺女子短期大学)
テーマ :
『ディジタル図書館』輪読会を終えて
出席者:
堀池博巳(京大大型計算機センター)、蔭山久子(帝塚山大学学園前キャンパス図書館)、太田智子(甲南学園)、吉田憲一(天理大学)、中川正巳(松山大学)、前畑典弘、渡辺隆弘(神戸大学図書館)、光斎重治(愛知大学)、田窪直規(近畿大学)、浜田行弘(関西学院大学)、倉橋英逸(関西大学)、吉田暁史(帝塚山学院大学)、尾松謙一、村井正子、前川和子

 輪読会は、本書の第3章から第7章までを取り上げ、2000年5月から6月にかけて3回開いた。今回の発表者は輪読会における各章の担当者である。本書はディジタル図書館というタイトルではあるが、目録とメタデータ、メタデータのSGML,XMLによる表現等に大きなウェイトをおいており、われわれの勉強会にふさわしい図書と判断した。なお下記のまとめでは発表者の発表と質疑内容を特に区別することなく記載している。
・第3章「電子出版とディジタル図書館」(尾松氏)
 電子出版の動向とそれが図書館に及ぼす影響について書かれている。電子書籍コンソーシアムの活動は2000年1月に終了し、電子ブックコミッティは「Common NET EBフォーマット仕様案」を出した。これはVer.0.80として公開されている。電子出版における図書館の役割としては、図書館が主体的に電子資料(2次資料も含む)を作成することが重要ではないかと思われる。
・第4章「目録とメタデータ」(尾松氏)
 従来のカード目録あるいはMARCとSGML表現による目録とを比較している。1節において十進分類法(DDC)とあるが、DDCではなくDCの誤りであろう。またMARC(Machine Readable Catalog)とあるが、通常MARCはMachine Readable Catalogingの略である。1節p.49およびp.57には、LC/CIPは出版者が作成するかのような記述があるが、CIP情報は出版者ではなくLCが作成している。2節においては、MARCを「マシンにとっては扱いやすいが、人間には理解しにくい」、これに対しSGMLでは、「人間とマシンの双方が理解できる、したがって異なるマシン同士も理解できる」とある。しかし、MARCが人間にとって理解しがたいのは、現状のタグやサブフィールド識別子が、250や$Aなどと意味のないコードを与えているからに過ぎないのではないか。またSGMLにおいて要素名を識別しやすいのは、中味を通常分かりやすい名称で表すからではないか。このように考えると、MARCが人間に分かりにくく、SGMLが分かりやすいとは本質的にはいえないのではないか。さらに人間とマシンの双方が理解しやすいからといって、異なるマシン同士で理解できるとは限らないと思われる。なお2節p.50における『情報機器論』の日本目録規則による記述には誤りが多い。
 メタデータは「一般にデータ集合をその利用者に理解させ、共有させるための情報を明確化したもの」と定義されている。メタデータの諸形式の中でもよく普及したものとしてダブリンコアメタデータがある。これらは15要素に分けられる。そして内容に関するもの、知的所有権に関するもの、具現化に関するもの、の3種類に分類されるとされる(p.61)とされるが、この3種類は排他的に分類できるのだろうか。
・第5章「情報資源のメタデータ記述の枠組み」(村井氏)
 「情報資源のメタデータを、インターネットで利用できる形で記述する汎用的な枠組み」としてRDFがW3Cによって提案された。RDFはSGMLのサブセットであるXMLを用いて表現する。RDFでは実体を示すものと属性を表すものとに明確に区別する。p.67では実体を表すものとしてISBNが採用されているが、ISBNがない図書はどうするのか。記述全体(つまり諸属性によって規定されるものの総体)が実体という、いわば同語反復的なことも起こり得よう。
 RDFでは「集合」「順序」「択一」を表現する「コンテナ」が用意されており、興味深い。これによってMARCでは行うことが出来なかったより正確な記述が可能になる。p.78-79では、ペーパーバックとハードカバーとが同時に表現できる例が紹介されている。しかし、ペーパーバックとハードカバーとではISBNは異なるのではないか。またたとえこのような手法で択一を表現できたとしても、他の択一的要素と連動する場合は、それぞれの連動性を表現できるのだろうか。そしてこの例のように「ペーパーバックとハードカバーを同時に記述の対象とする」、というようなケースを発展させると、記述の対象をどのように特定するかという大きな難題が持ち上がる。p.80において、シリーズの表現があるが、シリーズ番号をシリーズ全体を代表する要素として扱っているのは理解しがたい。
 XMLにおける名前空間定義機能については本書にも言及があるが、XMLの特徴全体に関しては記載が少ないので、発表者により全体的な説明があった。XMLはSGMLのサブセットといわれるが、XMLにおいてはSGMLにはない機能があるとされる。もしそうなら厳密にはサブセットとはいえないのではないか。
・第6章「図書館の業務とディジタル図書館の業務」(前川氏)
 従来の図書館とディジタル図書館の業務を比較し、後者の特徴を検討している。
・第7章「ディジタル図書館のシステム構成」(前川氏)
 印刷物やディジタル出版物を収集し、所蔵登録し、メタデータを作成し、同時に本文をSGML化する。そしてインデクシングを施して、全文検索サービスを提供する、といったディジタル図書館構築のためのモデルケースが紹介されている。p.102では、収集ロボットがWeb文書を定期的にインターネットから収集する、とあるが、提供するしないにかかわらず、収集すること自体に著作権法上の問題があるのではないのだろうか。
【参考文献】田畑孝一著『ディジタル図書館』勉誠出版, 1999