整理技術研究グループ勉強会記録(2007年度)
「図書館目録の将来設計」第5回
- 日時:
- 2007年5月10日(木) 19:00〜
- 会場:
- 日図研事務所104号室
- 発表者 :
- 吉田暁史氏(大手前大学)
- テキスト:
- Markey, Karen. The Online Library Catalog: Paradise Lost and Paradise Regained?
D-Lib Magazine 13(1/2)
(http://www.dlib.org/dlib/january07/markey/01markey.html)
- 出席者:
- 川崎(佛教大学)、横山、松井(大阪芸術大学)、堀池、渡邊(帝塚山学院大学)、吉田(大手前大学)、河手(大阪樟蔭女子大学図書館)
1. この論文の目的
考察
・図書館のオンライン目録が使われなくなった理由
・1次情報への新しい方向性が人々をオンライン目録に向かわせなかった理由
2. この論文を作成した(impetus)動機
動機…Googleおよび巨大デジタル化プロジェクト時代における図書館目録の現在と将来の方向性に関する図書館界の確信のなさ
マーカム(LCの副館長)の示唆
「記述目録作業における詳細な配慮はもはや正当化されない、そして目録は典拠コントロールや
主題分析や資源の識別と評価に対して、もっと時間をかけるよう再構築されなければならない」
★「資源の評価」←異なる図書館や人間が同じ資料について同じ評価ができるのか?
マンとシュナイダーマンの指摘
「LCが主題目録作業を犠牲にして、目録簡略化の方向へ向かおうとしている」
…LCが目録レコード中の主題情報一つであるシリーズ副出を停止した
カルホーンの主張
・大量生産の資源(図書など)の目録から唯一の1次資料(unique primary sources)の目録へと方向転換
すべき
・既存の目録の市場位置は、情報探索者への魅力競争に耐えられる能力があるかどうかという、現実的
な地点にまで追い詰められている
カリフォルニア大学図書館の指摘
件名標目をやめて代わりに自動生成されたメタデータを採用
3. なぜオンライン目録は魅力を失ったのか
(1)オンライン目録全盛期
1980年代の初期までに、全米で膨大なオンライン目録の配置が達成
80パーセント以上の図書館利用者が新目録に賛意
1980年代初期からの15年間…黄金時代
検索について独占的な地位を占めていた
情報を探索する適切な手段だった
←図書はネット情報と違って社会的なフィルタ機能を経由して出版されるため
(2)失われた楽園
主題検索の改善…オンライン目録当初からの利用者の希望=データベースへの目次と雑誌論文の追加
CLRのBibliographic Service Development Programによる解決策(1990年代初頭)
1. ブール演算に代わる確率的な方法
自動スペル修正・単語の重み付け・語幹処理(intelligent stemming)
レレヴァンスフィードバック・ランキング出力
★レレヴァンスフィードバックとランキング出力
←失敗の原因として対象となるMARCデータだけでは情報が不十分であるためその有用性が発揮できなかったからではないか
2. 目録レコードへの目次および巻末索引の情報を付与
3. 雑誌論文などについては全文情報をオンライン目録に負荷して検索結果ゼロのケースに対応
★索引言語の改善(semantics面と特定性)、事後結合索引の採用、
索引方法の改善(網羅的索引)、統制語と自然語の併用戦略等、は盛り込まれていない。
解決策が実行されなかった理由
(1)図書館専門職がずっと記述目録法に執着していたこと、
(2)目録部門の優先順位が遡及入力・ログ管理・典拠コントロールなどに振り向けられたこと
(3)専門職の意識が整理からサービス優先へと移ったこと
(4)1冊あたりの目録コストの増大
(5)オンライン目録の改善を推進することと研究界におけるコンセンサス作りに失敗したこと
(6)必要とされるシステム改善について協議するRFPs(Requests for Proposals)へ図書館スタッフによる
提出に失敗したこと
(7)図書館への財源充当がインフレ率より低かったこと
(8)コレクション構築と資源のライセンス料のコストがインフレ率より高かったこと
→オープンアクセス運動を引き起こす
(9)統合図書館システムのコストが一般的に高かったこと
(10)統合図書館システム業者の失敗…情報検索技術とそれにともなうシステム改善
(11)他の組織や市場をオンライン目録に注目させることができなかったこと
(3)Googleの時代
1990年代後半
Webが指数的に成長→ポストブール演算検索機能を持つ検索エンジンの発展
2000年代の初め
Googleは「世界の知識の組織化」を打ち出す
→日あたりの検索回数がカリフォルニア大学全州キャンパスの目録検索の700倍(1ヶ月間で)
現在
Googleは巨額の資本と高度の技術を駆使して市場に実用的なシステムを提供して成功
4.検索の第一歩でなぜGoogleが好まれるか
(1)図書館における情報の検索は人々を感情のジェットコースターに乗せる
「私は、図書館で図書やその他の資料を探すのが嫌いだ。それは時間がかかり、
そのくせ目指す情報源にはめったに出会わない。この困難さは、私が図書館を
使うときのことを考えると、いつも最初に思い浮かぶ」
…このモデルは、情報探索に際して人々が抱く否定的あるいは肯定的感情を言い表すだけでなく、
彼らの感情のジェットコースターが上昇したり下降したりする様をぴったり表現している。
(2)情報ニーズをことばで表すことは、非常に難しい
利用者はオンライン目録を使う場合1〜3の単語という短い語を入力する
その理由
「問題領域における探索者の知識不足のために、彼らはどうやったらそれを解決できるか、
ということを特定できないのだ」(Bulkin)
←「探索の過程で何を望み何を望まないのかを認識する能力があるかどうか」の中に、
解決のための重要なヒントがある
(3)領域の専門家−何を知りたいか、そしてどこで見つかるかの知識がすべてだ
領域専門家にとって1次資料が真に重要なもの…新しい発見と新しい1次資料の創造へつながる
★未知検索において、検索結果が図書でなければならないことはない。雑誌論文や美術品やWeb資源でもよい。
★図書館目録はまとまったもの(図書)が結果としてでてくるが、Googleは初心者に分かりやすいものが結果としてでてくる。
(4)人が知らない何かを探すということは、混乱した目的のないそしてでたらめな過程である
オンラインシステムで未知検索をするとき…目的を絞り込めていなく直接的でない→混乱した表現を用いる
「私は目的がないのを感じた、暗闇の中で射撃しているような感じ、結局何かを見つけるであろう」
デボウスキーの観察
・入力ばかりに時間を消費している…適切な探索プロセスを経ていない
・探索過程を理解することに失敗←知識基盤がないため
→探索をつつけて、誤った探索習慣を身に付ける
ランドとグリーンの指摘
・デボウスキーの観察結果をメタ認知知識のせいと考える
・「探索過程の効果の反映と監視の過程、そして必要であればその過程を精密化する過程」と領域初心者における誤り注意すべき
(5)人々の検索出発点は、GoogleとWebである
人々はGoogleで知識に対する質問と理解を開始する。
→基本的で分かりやすい情報を検索結果の先頭近くに集めてくれる
World Wide Web=人々が情報を選択する百科事典
検索エンジン…トピックについての基本的な知識を与える
全文情報の提供…図書館の書架を歩き回って図書を探さなくても自分の家庭や職場で全文情報を検索することができる
Web検索…「最小努力の原則」に適合する
「どの検索システムの設計も、易しく利用できるよう心がけるべきである。もしある組織が高品質の検索を望む
なら、一番重要なことは、使いやすさに力点をおくべきである。」
5.図書館オンライン目録再設計へのチャンス
オンライン目録の再設計に必要なこと
(1) 精度を向上させるためにポストブール演算による確率的検索方法
同時にオンライン目録で図書、雑誌論文、百科事典、会議録などの全文検索の提供
(2)主題目録は、利用者のニーズに合わせて、どんな情報が欲しいか、あるいは欲しくないかを考えたもの
(3) 初心者から専門家まで、利用者のレベルに合わせて、検索のカスタマイズが出来るような目録
(1)ポストブール演算の確率的な検索方法
ブール演算からポストブール演算の確率的な検索手法に置き換える
←デジタル化されたすべての図書館資料テキストの語を図書館オンライン目録で利用者は直接検索
→ブール演算は時代遅れ ★確率論的手法が必要
(2)主題検索
ベイツの報告書
・タイトルと件名標目は目次の30分の1、目次は巻末索引の30分の1、巻末索引はテキスト長の30分の1。
・「こういった比率の主張は、30分の1が整理統合のプロセスの結果を経験上よく言い表しているからだ、そして人は
その比率で段階的に情報サクセスすることを好む」
件名標目・分類記号・分類項目名・目次や巻末索引からの記入…ポストブール演算の目録においても重要な役割を果たす。
(1) ランキングアルゴリズム…テキスト中の語よりも、件名標目・分類項目名・目次および巻末索引からの記入に
重みを付ける
(2)簡略な本文表示…キーワード、句、文の簡略表示以外にタイトル・件名標目・分類項目名があればより分かりやすい
(3)レレヴァンスフィードバック技法…本文中の語より、タイトル・件名標目の方により重みを与える
例)North Carolina州立大学のEndeca
…仮想分類ブラウジングとファセット化されたLC件名に対する適レレヴァンスフィードバック技法を使用
★文章には構造化が必要←記述目録も必要になる
(3)qulificationメタデータの展開
文献の属性リスト…利用者は検索された文献をさらに高い精度で限定し領域知識のレベルに応じてカスタマイズすることができる
追加すべき文献の属性
・ある主題領域において…生物学、コンピュータ科学、芸術史、数学、気象学、物理学、神学など
・どの学問段階レベルにおける主題知識か…初等教育、高校レベル、大学レベル
・著者の範囲はどうか。そのトピックに関し権威かどうか。
・対象年齢層…ティーン、シニア、引退
・文献ジャンル…百科事典、法律、新聞、詩、歴史、書誌、研究、日記、統計、最近のレビュー、小説など
・どの時代の出来事か…6世紀、啓蒙時代、ヴィクトリア時代、など
・その文献で何が出来るか…買う、読む、売る、解決、ダウロード、売る、検索する、聞く、見守る、など
・他人への便益…レビューする、品定めする
・その文献を得ることによりどのような経験が出来るか…恐い物語、面白いジョーク、、悲嘆の叙情詩、など
など
6.全文検索問題を改良する
ポストブール演算検索、主題目録、限定メタデータについての改善事項←全文検索問題を改良
7.将来のオンライン目録を今構築しよう
図書館コミュニティと関連分野の研究者、実務家、システムデザイナーが協力
将来のオンライン目録を構築するために
(1)適切な情報収集
(2)ポスト大量デジタル化時代の目録の雛形作成
(3)結果の評価と意志決定
(4)機関への仕事割り当て
(5)実行
将来のオンライン目録の雛形における主題アクセスの機能性の実例
・ランキングアルゴリズム…メタデータレコード中の要約データ(タイトル・件名標目・分類記号など)により高く重み付けする
→ランキング出力の精度を高めることが期待できる
・レレヴァンスフィードバック技法…テキスト中の語よりも件名標目・タイトル・分類記号などの重みを高くする
・検索された文献の簡略表示における利用者が望むデータ要素の表示
・検索結果が満足でき、その内容を理解しやすく、)詳しい検索を可能にする有効なデータ要素
・索者が理解し利用するのが容易な、qualification属性の選択
・検索、ランキング、適合性フィードバック、および表示のための引用データの役割
・全文情報の表示や操作機能(検索、ナビゲート、下線引き、メモ書き込み、余白への書き込み、仲間との共有など)
・利用者参加を促す、メタデータ付与(つまりタグ付け)手法 ★←フォークソノミー?
・図書館オンライン目録と他の情報検索との統合
意思決定を小数の限られた個人、助言グループ、組織、専門職協会にゆだねるべきでない
→新たな参加者による新たな発想が必要
8.結論
図書館界がどの方向にいこうとも、オンライン目録を再検討する時期は来ている。
マーカム、カルホーン、ベイツ、マン、ヒルドレス、アンダーソンらからの知見…図書館目録の将来を考えるためには必須
図書館目録に関心のあるグループが、真剣な対話をしシステムの雛形構築し、意志決定しそして行動すべき
すべての図書がデジタル化され著作権問題が解決されるときまでに実現できなければ、
図書館を灯す光を消してしまうことになるだろう。