情報組織化研究グループ月例研究会報告（2012.4）

国立国会図書館ダブリンコアメタデータ記述（DC-NDL）解読講座

柴田洋子（国立国会図書館電子情報部）

日時：: 2012年4月14日（土） 14：30～17：00
会場：: 大阪市立弁天町市民学習センター
発表者：: 柴田洋子氏 （国立国会図書館電子情報部）
テーマ：: 国立国会図書館ダブリンコアメタデータ記述（DC-NDL）解読講座
共催:: 目録法研究会（科学研究費基盤研究（C) 課題番号22500223 研究代表者：渡邊隆弘）
出席者：: 池須安希（大阪音楽大学）、稲葉洋子、井村邦博（シーエムエス）、上田洋（ATR-Promotions）、上山卓也（京都大学付属図書館）、沖田克夫（桃山学院大学）、奥村亜紀（高槻市立図書館）、加藤信哉（名古屋大学附属図書館）、川崎秀子（佛教大学）、川瀬綾子、河手太士（静岡文化芸術大学図書館）、塩見橘子、篠田麻美（国立国会図書館）、杉本節子（相愛大学）、田窪直規（近畿大学）、中村恵信（神戸松蔭女子大学）、中村健（大阪市立大学）、中村佳子（京都府立資料館）、中村友美、西浦幸子（高槻市立中央図書館）、橋本郁子（高槻市立図書館）、平井梨絵（国立国会図書館）、堀池博巳、前川和子（大阪大谷大学）、松尾真弓（高槻市立図書館）、松林正己（中部大学）、水野翔彦（国立国会図書館関西館）、宮崎幹子（奈良国立博物館）、宮沢厚雄、村井正子（日本アスペクトコア）、村上健治（滋賀医科大学）、山田美雪、山野美贊子、横谷弘美（大手前大学）、渡邊隆弘（帝塚山学院大学）、渡辺斉志（国立国会図書館関西館）、和中幹雄（大阪学院大学）、柴田＜３８名＞

１．DC-NDLを知る

DC-NDLは、NDLにおける諸情報サービスで用いられるとともに、インターネット上の情報資源の組織化・利用のための国内標準をも志向したメタデータ標準である。
NDLにおけるメタデータ標準は、館内でのネットワーク情報資源組織化のために、DC基本15要素を採用して策定した「国立国会図書館メタデータ記述要素」（2001）に遡る。これはその後、より精緻化された「国立国会図書館ダブリンコアメタデータ記述要素」（DC-NDL2007年版）に発展し、この時点で国内標準化への意識も芽生えた。
2010年に至って、DCMI Metadata Terms等の最新動向を反映するとともにNDLの情報サービスの拡大（大規模デジタル化事業や国立国会図書館サーチなど）にも対応すべく、全面改訂を行って「国立国会図書館ダブリンコアメタデータ記述」（DC-NDL2010年6月版）を策定した。これを一部改訂したのが最新の2011年12月版である。
DC-NDLでは、DCMI Metadata TermsやFOAFなどに定義された既存の標準的語彙をできるだけ使い、必要なものだけをNDL Metadata Termsとして独自定義している。
その際、記述の要素（語彙の意味定義）を定める「セマンティクス」と、記述の方法（語彙の使用法）を定める「シンタックス」を分離している。2007年版まで「メタデータ記述要素」であった名称を2010年6月版から「メタデータ記述」としたことは両者の分離を反映している。分離によって相互運用性が高めることができる。
RDF（Resource Description Framework）に対応したセマンティックウェブ志向もDC-NDLの特徴の一つである。
改訂前の標準に準拠したシステムの要件を担保するため、過去の標準も引き続き公開している。

２．DC-NDLを読む

DC-NDL文書は、三部構成をとっている。「第一部 NDL Metadata Terms」はセマンティクスを示す部であり、独自定義された語彙のみを対象とする。「第二部 Application Profile」はシンタックスを示す部であり、用いられるすべての語彙について、その使用法や実例を示している。「第三部 RDFスキーマ」は、NDL Metadata Termsの各語彙をRDF形式で記述したファイルである。
メタデータスキーマの設計にあたっては、(1)要求分析・定義、(2)必要な語彙、(3)メタデータの構造、(4)各語彙の定義、(5)語彙の記述法、(6)エンコーディング方式、を順次確定する必要がある。
要求分析・定義においては、ネットワーク情報資源を主としながらも図書等の物理的資料をも記述対象とすること、リソースの発見・識別・アクセス・相互利用のためにNDL内外で用いることができること、を出発点とした。
必要な語彙の確定においては、利用できる既存の語彙がないかをまず最大限に検討し、そのうえで追加すべき独自語彙を検討した。独自語彙は、書誌情報に関する語彙（内容細目や「読み」など）、博士論文などのリソースの特性に関する語彙、所蔵情報など個体に関する語彙、等である。
メタデータの構造としては、管理情報・書誌情報。個体情報の三層構造を採用している。
NDL Metadata Termsの語彙定義は、意味説明、定義域・値域、プロパティ（必要な属性）、語彙符号化スキーム（適用する統制語彙）、構文符号化スキーム（適用する記述形式）などから成る。また、記述対象リソースの種類を表現する「NDLタイプ語彙」も定義している。
語彙の記述方法は、使用法、記述形式、入力レベル等をApplication Profileで定義している。

３．DC-NDLを使う

スキーマ設計の最終段階であるエンコーディング方式については、構造化され情報量の多いDC-NDL（RDF）と、利用頻度の高い要素のみをXML出力したDC-NDL（Simple）の2種のフォーマットを用意している。なお、個別システム内部のフォーマットは各システム独自でよく、上記フォーマットはメタデータの提供・交換のためのものである。
国立国会図書館サーチでは両フォーマットを実装している。リソースごとに画面上で実データを確認することができる（DC-NDL(RDF)のみ）とともに、OAI-PMHによる一括取得も可能である（両フォーマット）。

４．FAQから

2011年12月のDC-NDL改訂では、2010年6月版で定義していた既存語彙の使用方法の定義の見直しと新たな語彙追加を行った。前者には、2010年10月のDCMI Metadata Terms改訂への対応が含まれている。
日本語に特有の「読み」の扱いは、難しい問題である。DC-NDL（RDF）ではtitle等の各語彙に語彙「Transcription」を対応させて記述するが、これは構造化されたフォーマットゆえに可能なことである。構造化のないDC-NDL（Simple）でも対応関係が認識できるよう、Transcriptionとは別に語彙「Title Transcription」等も用意している。
構造化されたフォーマットは扱いが複雑になるが、内容細目における各著作と著者の対応関係など、元データが持つ意味構造を保持するためには必要である。

５．おわりに：DC-NDLはつながる

セマンティックウェブへのステップを念頭においてDC-NDLを評価すると、標準的な語彙の使用、値や語彙への識別子の付与、RDFによる表現等は達成されている。既存のLinked Dataとの関連付けは典拠データ等で開始したところである。コンテンツやメタデータの交換・共有が円滑となるように、より使いやすく、つながりやすいメタデータ標準を目指していきたい。

参考：: [国立国会図書館]メタデータ基準（DC-NDL関連文書を掲載）
http://www.ndl.go.jp/jp/library/data/meta.html
当日プレゼン資料: スライド（PDF 2.9M）