情報組織化研究グループ月例研究会報告(2012.10)
九州大学附属図書館のディスカバリ・サービスとメタデータ管理
香川朋子氏(九州大学附属図書館)
- 日時:
- 2012年10月20日(土) 14:30〜17:00
- 会場:
- 大阪学院大学
- 発表者 :
- 香川朋子氏(九州大学附属図書館)
- テーマ :
- 九州大学附属図書館のディスカバリ・サービスとメタデータ管理
- 共催:
- 目録法研究会(科学研究費基盤研究(C) 課題番号22500223 研究代表者:渡邊隆弘)
- 出席者:
- 井原英恵(神戸大学)、井村邦博(シー・エム・エス)、江上敏哲(国際日本文化研究センター)、太田仁(福井大学)、小笠原静華(大阪大学)、尾松謙一(奈良県立大学付属図書館)、梶谷春佳(京都大学付属図書館)、川上誠(山口大学総合図書館)、川崎秀子(佛教大学)、川瀬綾子、河手太士(静岡文化芸術大学図書館)、川畑卓也(奈良県立図書情報館)、木越みち(山口大学総合図書館)、古賀崇(天理大学)、塩見橘子、篠田麻美(国立国会図書館)、田窪直規(近畿大学)、田中志瑞子(神戸大学)、田中伸尚(ブレインテック)、谷口由佳(神戸大学)、田村俊明(紀伊國屋書店)、中村恵信(神戸松蔭女子学院大学)、中村友美、西原千尋(大阪大学)、堀池博巳、松井純子(大阪芸術大学)、守永盛志(山口大学総合図書館)、村井正子(日本アスペクトコア)、村上健治(滋賀医科大学図書館)、横谷弘美(大手前大学)、渡辺斉志(国立国会図書館関西館)、渡邊隆弘(帝塚山学院大学)、和中幹雄(大阪学院大学)、香川<34名>
九州大学附属図書館では、2012年1月にディスカバリ・サービスCute.Searchと九大カタログCute.Catalogの正式運用を開始している。今回は、これらのサービスで用いるメタデータの管理を中心とする発表であった。
1.ディスカバリ・サービスのコンセプト
- 紙から電子への移行が進むなかで、様々な学術情報検索サービスが並立し、用途によって適切なサービスを使い分けなければならないという負荷を、利用者に強いている。Google等の検索エンジンで学術情報を探索することもある程度できるが、精度・再現率は十分とはいえない。
- 一つの検索窓から有用な学術情報が探索できる「ディスカバリ・サービス」が求められている。九州大学附属図書館では、学習・研究のあらゆるニーズに応えるべく、内外の学術情報を幅広く集積したサービスを、発展性のあるウェブテクノロジーを活用して構築することをめざした。グローバルリソースを豊富に提供するCute.Searchと、所蔵資料と学内研究成果を検索範囲とするCute.Catalogから成る、世界でも先進的なハイブリッド・ディスカバリサービスである。
- Summon(Serials Solution社)を採用したCute.Searchは、EJなどのグローバルコンテンツ(8億件以上)とローカルコンテンツ(Cute.Catalog)から作られたウェブスケール・インデックスにより、あらゆる資料を一つの検索窓から検索できる。EJ等はリンクリゾルバを通して本文情報に導かれ、図書館所蔵の冊子資料等の場合はCute.Catalogを通じて状況(貸出中など)までリアルタイムに確認できる。
- 一方Cute.Catalogは、冊子の所蔵資料、学内からアクセス可能なEJ/Ebook、九大研究者の研究成果等をインデックスしている。表紙画像や目次、レビュー等の提供、関連度順の一覧表示、「九州大学フラグ」(九大著者の著作)、類似資料の提示、等の機能を備えた検索インターフェースである。
2.eXtensible Catalog(XC)の仕組みとCute.Catalog
- XCは、メロン財団等の出資を受け、ロチェスター大学を中心として開発されているオープンソースのシステムである。Cute.CatalogはXCを採用しており、開発した機能のXCコミュニティへのフィードバックなども行っている。
- XCのソフトウェアは、検索などのユーザインターフェースを担う「Drupal」、メタデータ処理を担う「MST」、ILS(図書館システム)等との接続を担う「OAI」「NCIP」、という4つのツールキットから構成されている。
- 「OAI」はILS等のメタデータをOAI-PMH形式で出力するための中間処理を、「NCIP」は「Drupal」からのリクエストに応じた所蔵/貸出情報のリアルタイム表示等を、それぞれ担当している。
- 「MST(Metadata Service Toolkit)」は、各システムからOAI-PMH形式でハーベストした(OAI-PMH非対応の場合は「OAI」ツールキットを介する)メタデータに各種の処理を施し、「Drupal」ツールキットに引き渡す、XCの「頭脳」とも言える部分である。より具体的には(MARCデータの場合)、MARCXML形式への「集約」、データチェック等の「正規化」、著作・表現形・体現形というFRBR化されたXC形式への「変換」、著作・表現形等を名寄せする「照合・集約」、識別子付与を含む「インデックス」の処理を順次行っている。
- Cute.Catalogでは、ILSの書誌・所蔵データ、EJ/Ebookの書誌データはMARCデータで、機関リポジトリや文献DB(九大研究者の成果)等のデータはDC(Dublin Core)データで、それぞれMSTに受け入れて処理している。また、書誌データに対して、「概要/目次」「主題」「ISSN-L」の各「エンリッチメント」処理も行っている。
- 概要/目次のエンリッチメントは、「BOOK」データベース、Syndetice ICE(Bowker)、LC等から、概要情報・目次情報を書誌データに埋め込む処理である。
- 主題のエンリッチメントは、ファセットブラウジング(絞り込み)のために、件名標目が付されてない書誌レコード(全体の約50%)に主題データを補完するものである。国立国会図書館サーチAPIを利用したNDLSH補完(ISBNで照合できる場合)、NDC機械可読版等を利用した分類記号からの主題語補完(九大文系部局の独自分類にも変換表作成により対応している)を行っている。
- ISSN-Lのエンリッチメントは、ISSN 国際センターのデータを利用して逐次刊行物の媒体違いデータの紐付けを行う処理である。
- XCのデータスキーマ(XCスキーマ)は、DCMI由来、RDA由来のエレメントに、XC独自の若干のエレメントを加えたものである。九大ではこれに、PRISM(論文関係)、DC-NDL(ヨミ関係)、ローカル(九大フラグ関係などごく限定されたもの)の各エレメントを加えた複合スキーマを用いている。極力、メタデータレジストリ等に登録され標準化されたエレメントを用いることが重要と考えている。なお、関係する各システム(ILSやリポジトリなど)とのスキーママッピング表を作成している。
3.今後の課題(計画)
- XCでは、書誌・所蔵レコードという従来型のデータをMARCタグ単位で解析して、著作・表現形・体現形・所蔵の各データへの分割・再構成を行っており、スキーマレベルでのFRBR階層化を一応実現している。今後の課題は、ユーザインターフェースにおける有効な表示法の開発、名寄せ等の精度をあげるためのより精緻なメタデータ整備、資料種別を超えた典拠データの整備などである。
- Linked Open Dataへの対応も今後の課題である。メタデータをリソース・プロパティ・値のいわゆる「RDFトリプル」の集積ととらえ、リソース・プロパティ・値のそれぞれを可能な限りURIで表現できることが望ましい。具体的には、件名標目等のエレメントに拠り所となる典拠データのURIを埋め込むこと、エレメント間の関係を明確に認識できる構造化されたスキーマとすること、などを図っていきたい。
- 資料種別を超えたメタデータ管理のために、典拠コントロールをさらに進展させたい。FRBR対応にも関連して、書名のコントロールが重要である。NACSIS-CATの統一書名典拠ファイルの活用等によるローカル典拠ファイルの作成を計画している。また国内電子資料のメタデータ基盤の弱さが大きな問題と考えており、国立国会図書館による電子出版物の収集制度化、九大も参加している国立情報学研究所(NII)の電子リソース管理DB(ERDB)プロジェクトの成果などに期待している。関連して、合集などの場合に、ISBD区切り記号を用いた現行の書誌データから各著作情報を切り出すのが困難な場合があることも問題と認識している。
- 著者の典拠コントロールに関しては、様々な外部のリソースを活用した九大著者典拠ファイルの作成を予定している。
- 資料種別を超えたメタデータ管理を進める基盤として、次期システム更新において、各種のメタデータ管理システムの整理統合をめざしている。
- 重複レコード除去への対応方法の見直しも課題である。現状では、複数の提供元DBに同一リソースのデータがあった場合、DB単位の優先順位に沿って採用する(残す)データを決定しているが、各提供元の得意分野を勘案したエレメントごとの対応が必要かもしれない。
4.まとめ
- ユーザインターフェースでの見せ方を意識したメタデータ構築が求められる。ディスカバリ・サービスを十分に機能させるために、資料種別を超えた精緻なメタデータの整備が必要である。これには、国レベルの枠組みのもとで、大学や関係各機関が連携し、さらには国際連携も視野に入れた対応が必要である。
終了後、主題情報の補完やFRBR化の詳細、関連度順出力の仕組み、データ更新の頻度・負荷、導入後の利用状況、開発仕様等のオープン性(他機関への提供可能性)などについて、活発な質疑があった。
(記録文責 渡邊隆弘)
- 当日プレゼン資料
- スライド(PDF 3.7M)