情報組織化研究グループ勉強会記録(2008年度)

臨時「リンキング関係」


日時:
2008年3月28日 19:00〜20:40
会場:
日図研事務所104号室
発表者 :
守屋祐子氏(大手前大学図書館)
テキスト:
リンキング関係文献
増田豊「OpenURLとS・F・X.」『カレントアウェアネス』274, 2002 CA1482 http://current.ndl.go.jp/ca1482
松下茂「OpenURLとリンクリゾルバーがもたらした研究情報サービス」『情報管理』50(9), 2007. pp.550-557 
http://www.jstage.jst.go.jp/article/johokanri/50/9/550/_pdf/-char/ja/
出席者:
杉本節子(相愛大学)、山本知子(システムズデザイン)、横山由紀(大阪府立中央図書館)、猪俣裕子(ナカバヤシ)、松井純子(大阪芸大)、川崎秀子(佛教大学)、蔭山久子(元帝塚山大学図書館)、堀池博巳(摂津市施設管理公社)、田窪直規(近畿大学)、渡邊隆弘(帝塚山学院大学)、守屋祐子(大手前大学図書館)、吉田暁史(大手前大学)

 以下のまとめは、必ずしも輪読テキストや発表内容のみに基づいては行っていない。吉田が他の文献も参照して独自のまとめ方をしている。


1.リンキング技術の背景

 電子ジャーナルが普及しネットを通して原文に容易にアクセスできるようになった。しかし原文情報の所在は、出版社の都合などによって変化する可能性がある。したがって、書誌データベースによって検索した何らかの資源の原文情報、あるいは引用文献の原文情報が、ネット上のどこかに存在するならば、それらに対し安定して確実にアクセスするための技術が必要となる。こういったことを実現するための多様な技術や仕組みが開発されてきた。CrossRefとDOI、OpenURLとリンクリゾルバなどがそのための技術や仕組みの一つである。

2.CrossRefとDOI

(1)CrossRefの概要

 1999年11月にCrossRef事業が始まった。欧米の主要出版社12社が加盟し、CrossRefサービスが開始された(2007年現在で登録会員は507社、登録電子ジャーナルは約2万タイトル、図書約4.6万タイトル、会議録約1.2万タイトル)。管理運営には非営利団体である出版社国際リンキング連盟(Publishers International Linking Association, Inc.: PILA)が当たっている。電子化された雑誌論文の引用文献(これも電子化されている場合)の原文をリンクによって直接参照できるようにする、というのが発足時の主たる目的であった。このサービスでは雑誌論文を特定するための識別記号として、DOI(Digital Object Identifier、デジタルオブジェクト識別子)を用いている。その後2002年5月には、JSTが維持するJ-STAGEがCrossRefに参加した。

(2)DOI

 デジタル資源(厳密にはデジタル資源でない場合もありうる)を恒久的に識別するための識別記号。現在3300万件以上の資源にDOIが与えられている。図書や雑誌の単位だけでなく、その中に含まれる章、論文、表などどんな単位にでも付与できる。またテキスト系のみならず、音楽・映像データにも適用できる。国際DOI財団(International DOI Foundation: IDF)が管理している。例えば、D-Lib Magazineの2001年5月号に掲載された、Amy Brandの論文"CrossRef Turns One"のDOIは,"10.1045/may2001-brand"である。10.1045をプレフィックス、may2001-brandをサフィックスといい、2つの部分に分かれる。プレフィックスはIDFが付与する登録機関(出版社など)を識別するための記号であり、サフィックスは、各登録機関が付与し管理する、個々のデジタル資源を識別するための記号である。なおDOIシステムはISO規格となっている。

(3)CrossRef−利用者側からみたリンキングの仕組み

(4)CrossRef−加盟出版社のなすべきこと(電子ジャーナルの場合を例として)

 なお、http://dx.doi.org/のあとに、既知のDOIを付加して検索すると原文が表示される。またDOIを用いて、参考文献1のサイト、参考文献2のサイトからも原文アクセス可能である。

3.OpenURLとリンクリゾルバ

(1)リンクリゾルバの必要性

 書誌データベースから電子ジャーナルの全文データベースへアクセスするとき、従来は次の2つのパターンの何れかであった。

a.内部リンク
 アグリゲータであるProQuestやEBSCOのように、全文データベースを自社内で構築し、書誌データベースからの検索後、内部的なリンクで全文情報にアクセスする場合である。この方式には次のような問題点がある。(1)アグリゲータでは一般に,契約のない出版社の持つ全文情報に対してリンクがない。(2)また著作権などの問題から,出版者社が全文の提供を一部に制限することもある。このようなことから、利用者は必ずしも完全な形で網羅された全文に対してアクセスできない。(3)アグリゲータが持っていない電子ジャーナルには当然アクセスできない。
b.外部リンク
 Web of Scienceなどに見られるように、書誌データベースを検索後、外部の電子ジャーナルへ直接リンクされる場合である。書誌データベースから電子ジャーナル論文へと、1対1の固定リンクを貼る必要があり、非常に手間がかかるうえ、相手先のリンクが変わると対応はきわめて困難である。

 以上の方式では、(1)複数ある電子ジャーナル提供サービスを選択できない、(2)提供先の都合によりサービスが限定される、(3)1対1のリンクとなり、設定・保守作業が繁雑となる、という欠点がある。これを解決するため、リンク付けだけを専門に行うリンクリゾルバ(link resolver、リンク解決者)と呼ばれる仕組みが登場した。リンクリゾルバは,電子ジャーナルなどの所在を示すアドレスが最新の状態に保たれたデータベースを内蔵している。そして、書誌データベースなどから資料に関する書誌データを受け取ると、アドレスデータベースを使ってこれを解釈し,電子ジャーナル論文などに対するアドレスを生成する。複数の対応資源がある場合は、最適の原文を選ぶ。最適原文のことを「適切コピー」(appropriate copy)という。リンク元のサービス(ソース)が、リンクリゾルバに対し情報を送信する記述方法、およびリンクリゾルバが原文を獲得するためのリンク先(ターゲット)に送る記述方法は、OpenURLという標準化された規格に基づいて行われる。

(2)OpenURL

 2000年に登場した最初のリンクリゾルバであるS・F・Xを開発したバン・デ・ソンペルが提唱し、OpenURL0.1として制定、その後拡張され2004年にはNISO規格としても採用された(OpenURL1.0相当)。書式例は以下のとおり。例1(The far side gallery 3という図書)

0.1の例
http://resolver.example.edu/cgi?genre=book&isbn=0836218310&title=The+Far+Side+Gallery+3
1.0の例
http://resolver.example.edu/cgi?url_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:book&rft.isbn=0836218310&rft.btitle=The+Far+Side+Gallery+3
例2(雑誌論文:0.1に基づく仮想サンプル、メタデータとしてISSNと巻号ページ年が記載)
http://openurl.jlc.jst.go.jp/servlet/resolver01?issn=1234-5678&volume=12&issue=3&spage=456&date=2005

 OpenURLは、デジタル資源をURL化する方法と、URLそのもの、の両方を指し示すが、後者に関して説明する。?を境にして2つの部分に分かれる。前半をbase URL部、後半をquery string部という。検索サービスなどのソースから送出されるURLの場合は、ここにリンクリゾルバのURLが書かれる。上記例では、リンクリゾルバのURLが書かれている。またリゾルバからターゲットへアクセスする場合も必要となることがある。後半のquery string部には、上記例であれば、ソースで検索した結果の雑誌論文に関するメタデータが書き込まれている。query string部は、DOIやPMIDといった資源識別記号が書き込まれる場合もある。リゾルバはこのURLを受け取って該当する雑誌を検索する。そしてもし利用できる全文情報が存在するなら、そのターゲットへのOpenURLを作り送出する。
*URLはURIの一種であり、情報資源を一意に指し示す識別子であるはずだが、query部を含めてしまうと、検索結果は1資源に絞り込めない可能性がある。これはURLの定義に反しないのか。

(3)リンクリゾルバのしくみ(下記は典型的な流れである)

 ソース          リゾルバ        ターゲット
 論文検索システム  →  リンクリゾルバ  →  電子ジャーナル出版社
         (OpenURL)       (OpenURL)
                            →  アグリゲータ
                       (OpenURL)
                            →   OPAC、ILL

 まずソース検索システムでは、OpenURLの作成、送出機能が必要である。ターゲットとなる電子ジャーナル提供側では、OpenURL受信機能が必要。複数の電子ジャーナルが存在する場合、リンクリゾルバは契約条件等によって最適の提供サービスを選ぶ。また利用できる電子ジャーナルが存在しない場合は、OPAC検索に振り向けたり、さらにはILLに振り向けたりする。こういった照合と判断はナレッジベースが行う。
*ソース側の検索システムがOpenURLに対応するということは、検索システム提供業者だけの機能でそれが実現できるのか、あるいは何らか電子ジャーナル出版社も対応しなければならない面もあるのか、いずれだろうか。

(4)CrossRefとOpenURLによるリンクの相違点

【参考文献】

1. DOIシステム
http://www.doi.org/
2. CrossRef
http://www.crossref.org/
3. OpenURLの簡単な紹介(英語ウィキペディア)
http://en.wikipedia.org/wiki/OpenURL
4.宇陀則彦 図書館サービスにおけるシステムモデル
http://www.kc.tsukuba.ac.jp/colloqium/041221.pdf
5.和田光俊 J-STAGEと電子ジャーナルの今後
http://www.jsla.or.jp/seminar/document/s1-JST-Wada-PM.pdf
6.千村文彦 情報のリンク付け
http://www.lib.keio.ac.jp/publication/medianet/article/pdf/0100050.pdf
7.片岡真 リンクリゾルバが変える学術ポータル−九州大学附属図書館「きゅうとLinQ」の取り組み−
https://qir.kyushu-u.ac.jp/dspace/bitstream/2324/2905/3/katalinq.pdf
8. Ann Apps and Ross MacIntyre. Why OpenURL?
http://webdoc.sub.gwdg.de/edoc/aw/d-lib/dlib/may06/apps/05apps.html
9. ANSI/NISO Z39.88-2004 The OpenURL Framework for Context-Sensitive Services
http://www.niso.org/kst/reports/standards?step=2&gid=&project_key=d5320409c5160be4697dc046613f71b9a773cd9e