情報組織化研究グループ月例研究会報告(2010.9)
学術情報流通とOAI-PMH
横谷弘美(大手前大学図書館)
- 日時:
- 2010年9月18日(土) 14:30〜17:00
- 会場:
- 大手前大学さくら夙川キャンパス
- 発表者 :
- 横谷弘美氏(大手前大学図書館)
- テーマ :
- 学術情報流通とOAI-PMH
- 出席者:
- 安藤一博(国立国会図書館関西館)、井上昌彦(関西学院聖和短期大学図書館)、植松利晃(JST)、大西賢人(京都大学図書館)、川崎秀子(佛教大学)、川瀬綾子、北真治、国岡崇生(JST)、田窪直規(近畿大学)、谷本千栄(神戸外国語大学)、田村俊明(紀伊國屋書店)、寺島陽子(奈良女子大学)、島谷和世(神戸大学図書館)、中村友美、濱生快彦(関大図書館)、平松晃一(名古屋大学院生)、堀池博巳(大阪芸大非常勤)、前川敦子(奈良先端科学技術大学院図書館)、村井正子(日本アスペクトコア)、守屋祐子(大手前大学図書館)、森石みどり(大阪大学図書館)、山中陽子(丸善)、吉田暁史(大手前大学)、和中幹雄(同志社大非常勤)、横谷、<25名>
学術情報流通の基盤を支える一要素となっているOAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)の概略、OAI-PMHと横断的検索機能の実現などについての発表であった。
1.OAI-PMH誕生の背景:学術情報流通の変化
OAI-PMHおよび、それを制定したOAI(Open Archives Initiative)の誕生の背景には、学術研究論文をはじめとした学術情報の流通形態がインターネットを介した電子流通へ移行してきたということがある。研究者が個人的にインターネット上で研究成果、プレプリント等を公開する例もでてきて、やがて連携する動きが形作られていった。そうしてその数を増しつつあったeプリントアーカイブの、相互運用性の確立を目的としてサンタフェ会議が開催されたのが1999年であった。
このサンタフェ会議で、メタデータの収集を通じて複数のeプリントアーカイブの相互運用を図るという基本的な枠組みが合意され、OAIの運動がここに始まった。そして、デジタル環境下に分散しているメタデータを集めたり検索する必要性の高まりに対して、OAIが規約として定めたのが、OAI-PMHである。
2.OAI-PMHの技術仕様
規約の仕様書および実装ガイドラインの発表が2001年1月〜2003年10月に行われており、仕様書としての最新版はVersion 2.0となっている。
OAI-PMHの特徴としては、1)メータデータのやり取りのみのための簡潔な仕様であることと、2)Web技術標準を利用していること、が挙げられる。
- OAI-PMHを用いたサービスプロバイダとデータプロバイダの間のやりとりは、ベースURLと6種類の命令を表すverb引数からなるHTTP要求と、それに対するHTTP応答からなる。応答は、ユニコードのUTF-8表記を使用してXMLコード化される。
- メタデータフォーマットに関しては、最低限の相互運用性確保のため、DCS(Simple Dublin Core)によるメタデータ提供ができるようにしておくことが義務付けられている。
これらの仕様は、相互運用性の確保という点のみだけでなく、特に初期段階でOAI-PMHの実装と展開を助けたという評価もある。
一方、DCSは専門的に特化した用途には適しにくいために、多くのコミュニティでは異なったメタデータフォーマットが必要とされている。メタデータフォーマットの選択はOAI-PMHを使用するコミュニティに委ねられており、実際にもDCSに加えてそれ以外の、より表現力豊かなメタデータフォーマットが用いられている。
また、OAI-PMHは横断検索を実現する他の規約等と比較されることがあるが、OAI-PMHによる複数リポジトリの横断的検索は、メタデータをいったん取り込んでから行うのであり、複数リポジトリを直接横断検索するのではない。(予めメタデータをハーベストしておき検索に供する方法と、検索実行毎に直接連携先への横断検索を行う方法の、二者を組み合わせてサービス提供する例として「国立国会図書館デジタルアーカイブポータル」(PORTA)がある。)
3.メタデータ収集・活用の具体例
- 国立国会図書館(NDL)の取り組み
PORTAでの取り組みや、「近代デジタルライブラリー」掲載コンテンツのメタデータを「NII図書情報ナビゲータ」(Webcat Plus)に提供していることに始まり、近年ではAPIの公開によるデータ提供の展開にも積極的である姿勢がうかがえる。
- 国立情報学研究所(NII)の取り組み
NIIでは、機関リポジトリから「NII論文情報ナビゲータ」(CiNii)へのメタデータ連携、学術機関リポジトリポータルJAIROの構築等を行って、学術情報の横断的統合検索サービスなどを展開している。
- AIRway (Access path to Institutional Resources via link resolvers)
AIRwayは、リンクリゾルバによるオープンアクセス文献へのナビゲーションを実現するため、OAI-PMHによって各機関リポジトリの収録文献情報をハーベストし、OpenURLを通じた文献所在解決を行う。
ターゲット先機関リポジトリはアメリカ・イギリス・ドイツ・インド・オーストラリアにもおよび、国際連携も見通した取り組みであることも含め、注目されるべき事例である。
4.おわりに
- AIRwayのようなリンキングサービスや、複数リポジトリの連携を目指したサブジェクトリポジトリポータルの構築への取り組みもでてきている。
そうした展開、あるいは国際的な流通をも考える上で、メタデータはどうあるべきか。
- メタデータフォーマットの代表例として、いずれもダブリンコアをベースに拡張をおこなったもので、NDLによるDC-NDL,DCNDL_PORTA、NIIによるjunii2、NDLTDによる電子学位論文のためのETD-MSなどがある。
- メタデータの標準化ガイドライン策定についての試みも行われている。例えば、DRFによる学位論文メタデータ標準案(DRF4横浜合意)や、NIIによるjunii2ガイドラインがある。しかし目録規則のようなもの(ローカルなメタデータの入力手引)ではない。
OAI-PMHはメタデータの流通を促進し、実現しているが、メタデータの内容や質を保障するものではない。数々のメタデータフォーマットも(その記述要素の規定だけでは)メタデータの内容や質を保障するものではない。
メタデータの流通が盛んになり、その利用も盛んになっている中で、難しい問題がまだ残されているといえる。
質疑応答
発表後、機関リポジトリの扱う資料の種類とメタデータ上の扱い、Google scholarの動きなどについて質疑があった。
また、科学技術振興機構の動きとして、J-GLOBAL(β版1.3)というサービスでこれまでのクローズドモデルからオープンモデルへ向い、APIでのデータ提供も開始したこと、今後、リンケージのシステムとしてOAI-PMHを使うということを検討しているとの紹介があった。
- 参考:
- 吉田暁史・横谷弘美「学術情報流通におけるOAI-PMHの役割」『大手前大学論集』10, 2009. p237-257 http://ci.nii.ac.jp/naid/110007645069
(記録文責:横谷弘美)