情報組織化研究グループ月例研究会報告(2011.4)
Dublin Coreのこころ
杉本重雄(筑波大学)
- 日時:
- 2011年4月16日(土) 14:30〜17:00
- 会場:
- 大阪市立総合生涯学習センター
- 発表者 :
- 杉本重雄氏(筑波大学)
- テーマ :
- Dublin Coreのこころ
- 共催:
- 目録法研究会(科学研究費基盤研究(C) 課題番号22500223 研究代表者:渡邊隆弘)
- 出席者:
- 上田洋(ATR-Promotions)、上野芳重(大阪市立大学)、大塚栄一(樹村房)、尾松謙一(奈良県立大学)、川崎秀子(佛教大学)、川瀬綾子、河手太士(静岡文化芸術大学図書館)、川畑卓也(奈良県立図書情報館)、古賀崇(京都大学)、五島敏芳(京都大学総合博物館)、塩見橘子、篠田麻美(国立国会図書館)、末田真樹子(神戸大学)、杉本節子(相愛大学)、寸田五郎(宮崎大学)、高城雅恵(京都大学)、高橋晴子(大阪樟蔭女子大学)、田窪直規(近畿大学)、谷本千栄(神戸市外国語大学)、玉置さやか、中村健(大阪市立大学)、堀池博巳、増田聡文、村上健治(滋賀医科大学)、森石みどり(大阪大学)、山田美雪、山野美贊子、和中幹雄(大阪学院大学)、渡邊隆弘(帝塚山学院大学)、杉本<30名>
Dublin Core(以下、DC)はメタデータ標準として非常に有名であるが、その本質は十分に理解されていない標準でもある。90年代から開発の過程を見てきた研究者の視点から、DCの基本的な考え方を伝えたい。
1.メタデータとは
- 「データに関する(構造化された)データ」という一般的定義に対して対象物は「データ」とは限らないのではという疑問がありうるが、ネット空間においてはあらゆるものをネット上で識別できる(時には仮想的な)実体としてとらえなくてはならず、物理的な実体とコンピュータ上の実体を区別してとらえるのではなく、すべて「データ」ということばでとらえておく方が、無用な区別をする必要がなくなる。
- ネットワーク上での資源利用にメタデータは欠かせない。様々なメタデータがあり、それらを組み合わせて利用することが重要である。
- メタデータの基本構造は、記述対象の属性と属性値の対の集まりである。属性値がいくつかの属性・属性値の対にさらに分解されるような、構造を持つこともある。属性ごとに属性値の書き方が決まり、目的によって属性の集合が決まる。
- メタデータの基本モデルとして、記述対象とメタデータの「一対一原則」が重要である。複数の資源を対象とする場合、資源の集まりをひとつの記述対象とすることもある。
- インターネットはフラットな情報アクセス環境を与えてくれている。ネットワーク上での資源利用を考えると、資源の種類や提供目的に合わせた特化と、様々な資源を統合的に検索できるフラットな環境に合わせた一般化を、ともに満たす必要がある。
2.DCの概要
- 多種多様な資源を発見・記述するためのコアエレメントを規定したDCMES(DC Metadata Element Set)は、15エレメントからなるシンプルさ(1998年に合意されたSimple DC)で有名となり、その後ISOやJISの標準となった。
- DCはメタデータの属性(記述項目)定義を行うのみで、表現のためのデータモデルを定めておらず、RDF(Resource Description Framework)がその役割を果たしてきた。RDFはシンプルな「3つ組」を組合わせてメタデータを構造的に表現する。RDFによるメタデータ記述の中で用いる属性や属性値の種類(クラス)を定義するRDF Schemaの仕組みもある。
- Simple DCの15エレメントには、Creator・Publisher・Contributorの相互関係などが曖昧である、Relation・Sourceは明らかに上下関係にあるといった問題点が指摘されていた。
- 2000年、より詳細なメタデータを記述するためのQualifier(限定子)を取り入れたQualified DCが定められた。しかしその後、RDFに基づくより精密な語彙の再検討が進められQualifiedといった言葉は使われなくなった。現在定義されている語彙はDC Metadata Terms(dcterms)と呼ばれ、当初の15エレメントからなるDCMESと区別されている。
- 現行のdctermsでは、55の「メタデータ語彙」を定義している。これらの語彙はRDF を用いてそのタイプや相互関係が明確に表現され、レジストリに登録されている。
- dctermsでは上述のSimple DCの問題点を解決しているが、普及状況を勘案してレガシーな15項目(DCMES)も名前空間を分けて維持されている。
3.DCとアプリケーションプロファイル
- 標準的なメタデータ語彙であるDCMESやdctermsだけでなく、応用用のメタデータスキーマであるアプリケーションプロファイル(以下、AP)を視野に入れなくては、DCの世界は理解できない。
- APでは、当該用途に必要なメタデータ語彙(エレメントの集合)が、DCをはじめとする様々な語彙から選択して作られる。新規定義もできるが、可能な限り既存のものを用いることが推奨される。
- 加えてAPでは、個々のエレメントについて構造制約や記述形式等の規定を行う。すなわちDC等は記述項目(概念)の定義に専念し、構造定義は応用サイドのスキーマであるAPに委ねる。この分離が重要であり、役割分担によってメタデータの相互運用性が向上する。
- メタデータスキーマは、語彙を定める「意味定義層」、APによる「抽象構文層」、XML等による具体的記述形式を定める「具象構文層」と階層的に捉えられる。こうした整理のもとに比較すると相互運用性のレベルが見やすくなる。
4.おわりに
- DCはメタデータスキーマの概念モデルを作り上げてきた。APの概念がとりわけ重要である。
- そして、分野にまたがって使うことのできる記述項目(属性)の語彙を作り上げてきた。メタデータはことば(=概念)の定義が基本であり、共通の語彙によって流通性が高まり、Linked Open Data等にも資することになる。
参 考:
- 配布資料
- PPTスライド(PDF 930K)
1ページ1スライドのPDFですのでご注意ください(印刷時に適宜設定ください)。
- 参考資料
- 杉本重雄「Dublin Core の現在」『ディジタル図書館』36, 2009.3. p.32-45 http://hdl.handle.net/2241/103603