整理技術研究グループ月例研究会報告(2007.9)
科学技術文献検索システム:
エンドユーザサーチを中心として
石井静(JST西日本支所)
- 日時:
- 2007年9月29日(土) 14:30〜17:00
- 会場:
- JST西日本支所
- 発表者 :
- 石井静氏(JST西日本支所)
- テーマ :
- 科学技術文献検索システム:エンドユーザサーチを中心として
- 出席者:
- 尾松謙一(奈良県立図書情報館)、蔭山久子、川崎秀子(佛教大)、河手太士(大阪樟蔭女子大図書館)、楠本成生(相愛大)、甲田彰(JST)、末田真樹子(神戸大学生)、田窪直規(近畿大)、田村俊明(大阪市立大学術情報総合センター)、韓相吉(韓国・大林大)、堀池博巳(摂津市施設管理公社)、松井純子(大阪芸術大)、山野美贊子(帝塚山学院大非常勤)、渡邊隆弘(帝塚山学院大) 石井<15名>
科学技術振興機構(JST)の科学技術文献検索システム JDreamIIについて、特に「大規模用語辞書」の構築・利用を中心に発表された。
1.JDreamIIの概要
- JSTでは2006年4月にシステムをリニューアルし、JDreamIIをスタートさせた(http://pr.jst.go.jp./jdream2/)。国内外の科学技術系ジャーナルを中心に、約4,600万件(2007年9月現在)の文献情報を収録している。各文献に日本語による抄録・索引を付与しており、外国語文献を含めて日本語で検索・概要把握が可能である。
- 検索機能の面では、サーチャーだけでなくエンドユーザの利用にも対応できるよう、操作が簡単なインタフェースを採用している。また、辞書機能(後述)、頻度分析機能(結果集合を特定の観点からランキングする機能)の搭載も特徴である。
2.JDreamIIにおける索引
- 主な索引語の種類として、「分類コード」「シソーラス用語」「準シソーラス用語」「物質索引用語」がある。
- 「JST科学技術分類表」に基づく8桁の分類コードを付与している。精細分類というよりは、主題の大まかなふるい分けを目的としている。
- 「JST科学技術シソーラス」に基づくシソーラス用語を付与している。シソーラスは1999年版(語彙数約3.7万)が最新版であり、2008年度に次期改訂を予定している。シソーラスでは各語の同義関係、階層関係等を管理している。
- シソーラス用語を補強する目的で、固有名や新概念を表す「準シソーラス用語」が付与されることがある。準シソーラス用語を付与する場合は、必ず上位語に相当するシソーラス用語も付与している。
- 「日本化学物質辞書」に基づく物質索引用語(有機低分子化合物名)を付与している。
3.索引を用いた検索の問題点と解決策
- あらかじめ定められている索引語を知らないと十分な検索が行えない点が、索引を用いた検索の問題点である。インターネットの普及とともにエンドユーザによる検索が増えているので、従来以上に大きな問題となっている。これを解決するため、JSTでは「大規模用語辞書」を構築し、検索支援と索引支援の両方に活用している。
- 大規模用語辞書のデータソースは、JSTシソーラス、JST機械翻訳辞書、MeSHなどであり、初期データの語数は約140万件であった。この初期データについて、(1)JSTシソーラスや各種事典類に収録されている用語とその同義語・異表記語、(2)JSTデータベース上で索引頻度の高い自然語、(3)自然語とJSTシソーラスとの包摂関係、の観点から内容の整理を行った(約2年をかけて集中的に作業)。
- 大規模用語辞書では概念単位で「同義語ID」を付与し、そのもとに同義語が列挙される(同義語間で優先語を定めることはしない)。さらに、各語ごとに文字種の異なりなどによる異表記語が管理されている。JSTシソーラス中に各概念に対応するディスクリプタがある場合には同義・類義関係が、上位概念に相当するディスクリプタがある場合には包摂関係が、それぞれ管理されている。2007年9月現在、概念数は約13.5万、収録語数(異表記を除く)は約44.1万である。
- 大規模用語辞書を用いた検索支援として、「シソーラスブラウザ」機能を提供している。利用者は文献検索画面とは別に開いたウインドウ上で辞書検索を行って用語辞書中の各語を呼び出し、同義語群やシソーラス用語との関係などを確認して検索語入力に反映することができる。
- 大規模用語辞書の各語は、索引時に「準シソーラス用語」として付与されうる。索引作成システム上の支援機能として、索引者が選んだ語で用語辞書を検索して対応するシソーラス用語を提示するなどの機能を持たせている。これにより、索引作業の効率化と索引品質の向上(均質化)をはかっている。
4.質疑等
- 発表の最後に、図書館目録における主題検索(件名検索など)の問題解決にも大規模用語辞書の考え方や手法が利用できる可能性があるのではないか、という提言があった。
- プレゼンテーション後、参加者が実際にJDreamUの検索を体験する時間を与えていただいた。それも踏まえて質疑・意見交換を行い、大規模用語辞書の管理手法などについて活発なやりとりがあった。
(記録文責:渡邊隆弘)