TOP > 勉強会 > 2000年度 > / Last update: 2008.1.1

整理技術研究グループ勉強会記録(2000年度)

「マークアップ言語とメタデータ」第16〜17回

補充(ダブリンコアの動向、RDF)


◎マークアップ言語とメタデータ勉強会第16回
日 時:2000年11月15日(水)19時〜20時半
会 場:日図研事務所
テーマ:Dublin Coreの動向
担 当:堀池博巳氏(京大大型計算機センター)
出 席:吉田(帝塚山学院大学)、蔭山(帝塚山大学図書館)、 堀池(京都大学大型計算機センター)、村井(システムズデザイン)、太田(甲南学園図書館)、尾松(奈良県立図書館)、前川(堺女子短期大学)、渡邊(神戸大学図書館)
・テキスト
1.杉本重雄「メタデータについて:Dublin Coreを中心として」
 『情報の科学と技術』49(1) 1999 p.3-10
2.杉本重雄「Dublin Coreについて−最近の動向、特にqualifierについて」
 『ディジタル図書館』no.18 2000 p.36-48
・参考資料
1.杉本重雄「Dublin Coreに関する最近の話題から−第7回Dublin Coreワークショップほか」 『ディジタル図書館』no.17 2000
2.『ディジタル図書館』no.17 2000
 http://www.dl.ulis.ac.jp/DLjournal/No_17/3-sugimoto/3-sugimoto.html
3.谷口祥一「情報検索とメタデータ」 『人文学と情報処理』no.28 2000 p.92-100
討議概要
●Dublin CoreとRDFの関係
・メタデータ項目の定義を行うのがDCで、記述方法の枠組みを示すのがRDF,構文を含めた具体記述はXMLで行う。
・どちらが先に考えられたのか?
・正確にはわからないが、第2回のDCワークショップで「複数のメタデータ規則に基づく記述のための基本概念」であるWarwick Frameworkが提案されている。これがRDFにつながっていくと思われる。したがってDCとRDFは並行的か、DCがやや先。
*Warwick Frameworkについては、以下に日本語訳の文書があります。
 http://www.y-adagio.com/public/repots/oedc/1997/clsa.htm
●Dumb-Down原則について
・「日付」の例があるが、「作成日付」「出版日付」といった種類がわからなくなっても日付には違いないから矛盾なしというのは、実用上問題ではないか
・これでDumb-Down原則を満たしているということは、どの段階の日付を書くべきかという定義を、DCのDate項目定義としては放棄していることではないか。
●qualifierについて
・2000.7に承認されたのは標準的なもの。各分野ごと・各機関ごとに追加することも許される。
・Formatのところにqualifierとして「Extent」があがっているが、データサイズはFormatの範疇とはいえないのではないか。
●構造を持った値の扱いについて
・「Creator」の下位に「名前」「所属」「アドレス」といった構造化された下位エレメントについても、当初はqualifierとして考えられていたが、最終的には認めないことになった。(Dumb-Down原則に抵触するため)
・所属などがCreatorの一部として検索されては不都合だというのはわかるが、一方で所属やアドレスの必要性もあきらか。今後どうせよということなのか。
・杉本論文によると、この決定には「RDFが提案した情報資源記述のためのモデルが下敷きになっている」とある。このあとの説明がなくわかりづらいが、所属やアドレスは著者に関する属性であってリソースに対する属性ではないので、リソースに対するメタデータ中に記述するのはおかしいということか? そうなると著者に関する情報を記述するメタデータを新たに設けることになり、典拠ファイルの概念に近づいていくのかもしれない。


◎マークアップ言語と勉強会第17回
日 時:2000年12月4日(月)19時〜20時半
会 場:日図研事務所
テーマ:RDFについて
担 当:吉田暁史氏(帝塚山学院大学)
出 席:吉田(帝塚山学院大学)、田窪(近畿大学)、堀池(京都大学大型計算機センター)、村井(システムズデザイン)、渡邊(神戸大学図書館)
・テキスト
門馬敦仁「XMLとメタデータ」『情報の科学と技術』49(1) 1999 p.16-22
・当日資料
発表者より、ネットワーク上で入手できる以下の資料が配布された。
○資源記述の枠組み(RDF)モデル及び構文規定
 http://www.y-adagio.com/public/standards/tr_rdf_ms/rdfmain.htm
 (W3C勧告仕様書の翻訳)
○RDF(平成9年度OEDC委員会報告書)
 http://www.y-adagio.com/public/reports/oedc/1997/cls4_5.htm
 (OEDC報告書の1章。RDFの概略)
 主に上記の「モデル及び構文規定」(以下、「構文仕様書」と略)を用いて説明された。
●RDFの位置づけ
・メタデータ記述の枠組みである。特定の語彙(項目定義)を持つのではなくシンタックスの枠組みを定め、様々なメタデータ規則に対応できる。
●仕様の概要
・W3CによるRDFの仕様は、「モデル及び構文(model and syntax)」と「スキーマ(schema)」に分かれている。
・表現方法の基盤は「モデル」にある。「構文」としてXMLを採用しているが、それが絶対ではなく、「モデル」は構文非依存であり、XML以外の記述方法をとる余地もある。
・「スキーマ」は記述作成に用いられるプロパティ群やその関係などを定義するもの?これには日本語できちんと解説したものが見当たらず、いまひとつよくわからない
●基本モデル(「構文仕様」2.1.)
・「資源(resource)」「特性(property)」「特性値(property値)」の組合せで基本モデルが作られる。(3つ一組で「文(statement)」と呼ぶ)モデルとしてはグラフ表現をとる
・「資源」はURIで一意に判別できることが前提
 図書などを考えた場合も、何らかの一意な標準書誌番号があればURIとみなしうる。
・ある資源の「著者が渡邊」という場合、「特性」は「著者」、「特性値」が「渡邊」。
 「特性値」はこのように特定の文字列(リテラル)というのが単純な例だが、別の「資源」である場合もある。例えば、「著者」の特性値として、「名前」「メールアドレス」などの特性を持った
 「人名」資源が指定される場合。(それがURIを持った別の資源であれば、典拠コントロールに近づく?)このように構造を持った値の表現ができる。
●基本構文(「構文仕様」2.2)
・XMLによる構文として「直列化構文」と「短縮構文」の2種類がある。
・名前空間を用いて複数規則を組み合わせることができる。
●コンテナ(「構文仕様」3)
・先に輪読した田畑「ディジタル図書館」にも紹介があったとおり
・「Bag」「Seq」「Alt」の3種類の集合記述がある。
●書誌情報を考えた時の表現性能
・たとえば「絵画画像データ」と「オリジナル絵画」や、「著作」と「図書」のような書誌的関係がRDFでは表現できるか。
・複数の「資源」(実体)間の関係をどう表現できるかということ
・RDF自体が「関係」情報の種類を管理したりすることはない。個々のメタデータ規則の範疇
・「特性値」として他の資源(実体)を指示することができ、それを何層にも重ねていくことも可能であるから、RDFで表現できるのではないか?