情報組織化研究グループ月例研究会報告(2023.4)
「これからの学術情報システムのメタデータ収集・作成方針 : 「流通」を前提としたメタデータの整備に向けて」
林 賢紀氏(国際農林水産業研究センター)
- 日時:
- 2023年4月15日(土)14:30〜16:00
- 会場:
- (Zoomミーティング)
- 発表者:
- 林 賢紀氏(国際農林水産業研究センター)
- テーマ:
- これからの学術情報システムのメタデータ収集・作成方針 : 「流通」を前提としたメタデータの整備に向けて
- 出席者:荒木のりこ(大阪大学附属図書館)、石橋進一、井上昌彦(関西学院大学図書館)、今野創祐(東京学芸大学)、江上敏哲(国際日本文化研究センター)、大野理恵(筑波大学生命環境系技術室)、加藤信哉(NPO法人知的資源イニシアティブ)、北岡タマ子(人間文化研究機構)、久保誠(国際基督教大学図書館)、酒井由紀子(帝京大学)、高野真理子(大学図書館支援機構)、田辺浩介(物質・材料研究機構)、谷口祥一(慶應義塾大学文学部)、下山朋幸(国立精神・神経医療研究センター図書館)、田窪直規(近畿大学)、永崎研宣(一般財団法人人文情報学研究所)、中野ひかる(関西学院千里国際中高図書館)、中道弘和(堺市立図書館)、橋詰秋子(実践女子大学)、宮川創(国語研)、村岡和彦、村上篤太郎(東京農業大学)、村上一恵(国立国会図書館)、村上健治(広島大学)、森原久美子(秀明大学図書館)、渡邊隆弘(帝塚山学院大学)、和中幹雄、他4名、林<32名>
1. はじめに、意義、構成と前提
発表者の自己紹介があった。発表者はこれからの学術情報システム構築検討委員会システムワークフロー検討作業部会委員として「これからの学術情報システムのメタデータ収集・作成方針について(2022)」の編集・執筆を主査とともに担当した。執筆は作業部会事務局の支援を得て多くのメンバーにより行った。本発表の内容は発表者の見解であり、これからの学術情報システム構築検討委員会および同システムワークフロー検討作業部会の公式な見解ではない。
検討の経過の概略が示され、この文書の概要が示された。この文書はメタデータを利活用するという立場から,本文書に大学や研究機関の学術情報資源の保存やメタデータ作成,システム構築の知見を集約することで,短期的な目標を示しつつ,これからの教育・研究DXを推進してゆく方向性を示すものである。以下を記述することが対象である。
- 「紙」に代表される「物理的な資料」
- 電子出版された「電子的な資料」
- 出版者以外の手によってメディア変換された「デジタル化された資料」
研究者が生成する「研究データ」は含まれていない。
意義は以下の通りである。
- 形態の枠を超え,利用者が自由に目的とする情報を見つけ出すことのできる環境の構築をめざす。
- 図書館にとって自身が扱う学術情報資源の発見可能性を向上させ,すべての利用者の時間を「節約する」環境を整えることは喫緊の課題だが、この課題を解決するために,日本の学術情報資源のメタデータについて,現状分析を精緻に行い,改善の手法を模索する。
- 後述するとおり、物理的な資料、電子的な資料、デジタル化された資料のそれぞれについて、課題の解決を目指す。
- 多様化する情報資源やそのメタデータを共有,流通する仕組みを検討,構築していくことは,学術研究の進展を側面から支えることができるという点で,図書館のみならず,日本にとっても重要な意味を持つ。
- 多様なサービスを対象に,それぞれが求める適切で「豊かな」なメタデータを流通させうる環境を実現させることは,それほど遠くない時期に達成すべき重要な目標である。
- 日本国内における「紙」と「電子」を包括する発見環境を実現したい。
メタデータ整備の方向性としては、国際流通の促進やウェブ世界での利活用促進を念頭に整備されるべきと考える。そのためには、多様なメタデータスキーマやそれを扱うシステム,それらを活用するためのAPI(Application Programming Interface)等の知識を有する人材を育成していく必要がある。
物理的な資料については、以下を目指す。
- リンクによるメタデータ間の連携を拡大し,機械可読性を高め,さまざまなシステムや書誌作成機関との相互運用性の強化につなげる。
- 和書・洋書を問わず,「日本目録規則2018年版」(NCR2018)を適用する。
- NACSIS-CATの後継となる共同利用システム内部における書誌データは,従来のCATPフォーマットからMARC21へ変更することが望ましい。
電子的な資料については、以下を目指す。
- MARC21やKBARTを相互補完的に利用しつつ「電子的な資料」の総合目録を早急に構築する。
- 国内電子ブックのメタデータは,openBD等から収集し,目次データ(章データ)や抄録(あらすじ)を含むものとする。
- メタデータを相互に紐づけてリンクさせる仕組みを構築し,図書館での資料管理と利用者の利便性向上を図る。
デジタル化された資料については、以下を目指す。
- 学術機関のデジタルアーカイブに収録されるメタデータを集約し,ジャパンサーチへと流通させる「つなぎ役」としてIRDBを位置づける。
- JPCOARスキーマで記述されたメタデータだけでなく,MARC21,DCMIメタデータ語彙等,他のメタデータスキーマを用いて記述されたメタデータを集約できるようにする。
共同利用システムについては、以下を目指す。
- 「新NACSIS-CAT/ILL」に代表されるBIBFRAMEを基礎としたメタデータの提供に向けて検討を行う。
- リンクトデータを前提としたBIBFRAME等への適用に備える。
- 「電子リソースデータ共有サービス」では,JUSTICEのライセンスとタイトルリストについて,メタデータの提供を行う。
2.「これからの学術情報システムの在り方について(2019)」とメタデータ
(以下の「2.1」等は、「これからの学術情報システムのメタデータ収集・作成方針について(2022)」https://contents.nii.ac.jp/korekara/news/20221102 内の章・節に対応)
以下、「これからの学術情報システムのメタデータ収集・作成方針について(2022)」の内容について、詳細な解説がおこなわれた。
2.1.「在り方(2019)」での進むべき方向性とシステム・メタデータ整備の方向性
「在り方(2019)」での進むべき方向性は以下の通りである
- 統合的発見環境を可能にする新たな図書館システム・ネットワークの構築
- 持続可能な運用体制の構築
- システムの共同調達・運用への挑戦
- メタデータの高度化
- 学術情報資源の確保
一方、システム・メタデータ整備の方向性は以下の通りである。
- 整備の方向性1: 統合的発見環境の実現(→ 2.2.1)
- 整備の方向性2: 学術情報資源の共有の推進(→ 2.2.2)
- 整備の方向性3:メタデータの国際流通とウェブ世界での利活用促進(→2.2.3)
- 整備の方向性4:多様化する書誌データに対応できる人材育成(→2.2.4)
2.2.1. 統合的発見環境の実現
以下の内容で構成されている。各項目の具体的な説明がなされた。
- 統合的発見環境
- メタデータの収集
- 多様化する電子的な資料とライセンスモデルへの対応
- 利用のための情報提供
2.2.2.学術情報資源の共有の推進
以下の内容で構成されている。各項目の具体的な説明がなされた。
- 流通系書誌データの利活用
- グループスケールディスカバリーと多元的な文献入手方法の提供
2.2.3. メタデータの国際流通とウェブ世界での利活用促進
以下の内容で構成されている。各項目の具体的な説明がなされた。
- 国際流通の促進
- ウェブ世界での利活用促進
3.「物理的な資料」のメタデータ
NACSIS-CATがこれまで行ってきたリンクによるデータの連携をさらに拡大し,機械可読性を高めることでデータの相互運用性を高めることを目指す必要がある。
3.2.見解と方針
3.2.1., 3.2.2., 3.2.3.はNCR2018の適用対象と細則について、3.2.4.はシステム対応の実施について、3.2.5., 3.2.6., 3.2.7.は典拠コントロールについて書かれている。各項目の具体的な説明がなされた。
4. 「電子的な資料」のメタデータ
「電子的な資料」に関するメタデータは,次の三つの類型によって表現される状況にある。
- 書誌そのものを表現するメタデータ(書誌データ)
- 「所蔵」(アクセス情報)に関するメタデータ
- 「ライセンス」のメタデータ
4.2.見解と方針
以下の内容で構成されている。各項目の具体的な説明がなされた。
4.2.1. MARC21とKBARTの適切な相互補完
4.2.2. 「電子的な資料」の総合目録の実現
4.2.3. 中立的な書誌データの検討
4.2.4. マイクロコンテンツのメタデータ
4.2.5. メタデータ間のリンク形成と識別子の活用
5. 「デジタル化された資料」のメタデータ
出版者以外の手によって電子化された「デジタル化された資料」のうち,とくに「デジタルアーカイブ」と呼ばれるもののメタデータ流通をどのように強化するか,デジタルアーカイブを巡るエコシステムモデルの構築を提案する。
「デジタル化された資料」については,メタデータの整備と流通について、以下の課題を残す。
- 各機関にとってのつなぎ役・まとめ役が不在であるため,デジタルアーカイブのメタデータが効果的に集約・流通できていない
- デジタルアーカイブは各機関で乱立し,さらに機関内においても散在
- 各機関でのメタデータの枠組みもまちまちで定まっていない,あるいはサポートが不在で運用のノウハウが共有されていない
本章は以下の内容で構成されている。各項目の具体的な説明がなされた。
5.1.現況
5.1.1. 大学/大学図書館のデジタルアーカイブの現況
5.1.2. 国立国会図書館の現況
5.1.3. JPCOARおよびNIIの現況
5.2.見解と方針
5.2.1. ジャパンサーチとメタデータ流通ガイドライン
5.2.2. メタデータの適切な外部連携先
5.2.3. つなぎ役としてのエコシステム構築(IRDB経由)
5.2.4.つなぎ役としてのエコシステム構築(IRDB以外)
5.2.5. 意見交換が可能なフォーラムと支援体制
5.2.6. 各機関での取り組み
6. 共同利用システムへの「見解と方針」反映の実際
3章〜5章で示した「物理的な資料」「電子的な資料」「デジタル化された資料」それぞれのメタデータに対する「見解と方針」が,「新たな共同利用システム」へどのように反映されて行くか,その実際について述べる。
本章は以下の内容で構成されている。各項目の具体的な説明がなされた。
6.1. NACSIS-CAT/ILLにおけるメタデータの利活用促進
6.1.1. 利用環境の整備
6.1.2. 広報活動の充実
6.1.3. メタデータ作成・提供および利用にかかる技術的基盤強化
6.2. 電子リソースデータ共有サービスにおけるメタデータの利活用促進
6.2.1. 利用環境の整備
6.2.2. 広報活動の充実
6.2.3. メタデータ作成・提供および利用にかかる技術的基盤強化
6.3. 書誌データ作成の効率化に資するシステム機能の検討
7. 今後の展開
数年に一度の見直しができればと考えている。そのため「(2022)」とした。
まずは目前の課題を解決することが重要である。便宜的に「資料」を類型化して,その特性に応じた規則やスキーマについて述べる形式をとっている。時期を見つつ,それぞれの資料の規則やスキーマの整合性の検討が可能になる状況を構築できればと考えている。
冒頭でも述べた通り、「資料」に焦点をあてており,研究者が研究の過程で生成する「研究データ」については扱っていない。「研究データ」については、今後「これから委員会」あるいはワークフロー部会その他で検討すべき課題と考えている。
参考文献
以上の発表を受けて、以下の質疑があった。
- 研究データについては各研究分野から情報収集する体制が必要ではないか
- デジタル化された資料について古典籍に関しては各専門組織のデータベースと連携すればよいのではないか
- 書籍の章単位のメタデータについては、これまで科研費で作成されたものが利用できるのではないか
- 典拠データの拡充については電子的な資料についても想定をしているのか。また、著作の典拠コントロールについては今後どのように取り組んでゆくのか。独自に作成してゆくのか。
- これからの学術情報システム構築検討委員会およびシステムワークフロー検討作業部会の委員に今後、博物館学や文書館学の専門家が加わる可能性はあるのか
- 「メタデータの高度化」という表現における「高度化」の意味するところは何か
なお、今回の月例研究会については、Zoomの映像を録画し、開催後一週間に限り、出席を申し込んだものの欠席された方にも、映像を配信した。
(記録文責:今野創祐)