情報組織化研究グループ月例研究会報告(2011.6)
FRBR研究会の取り組み
著作同定作業の試み
谷口祥一 (筑波大学)
- 日時:
- 2011年6月25日(土) 14:30〜17:00
- 会場:
- 大阪市立総合生涯学習センター
- 発表者 :
- 谷口祥一氏 (筑波大学)
- テーマ :
- FRBR研究会の取り組み:著作同定作業の試み
- 共催:
- 目録法研究会(科学研究費基盤研究究(C) 課題番号22500223 研究代表者:渡邊隆弘)
- 出席者:
- :井原英恵(神戸大学図書館)、上野芳重(大阪市立大学)、川崎秀子(佛教大学)、川瀬綾子、河手太士(静岡文化芸術大学図書館情報センター)、川畑卓也(奈良県立図書情報館)、故選義浩、塩見橘子、篠田麻美(国立国会図書館)、末田真樹子(神戸大学図書館)、杉本節子(相愛大学)、高城雅恵(京都大学)、田窪直規(近畿大学)、田村俊明(紀伊国屋書店)、中村恵信(大阪府立大学羽曳野図書センター)、中村友美、堀池博巳、前川敦子(奈良先端科学技術大学院大学図書館)、松井純子(大阪芸術大学)、水野翔彦(国立国会図書館)、村井正子(日本アスペクトコア)、八幡圭子(大阪教育大学図書館)、山野美贊子、和中幹雄(大阪学院大学)、渡邊隆弘(帝塚山学院大学)、谷口<26名>
1.FRBR研究会のめざすもの
- 2009年6月に始動した本研究会のメンバーは、現在6名である。わが国の図書館目録へのFRBR適用にかかる課題検討を活動目的としており、これまでは主に「著作同定」の問題を扱ってきた。即ち、著作−表現形−体現形−個別資料という「第1グループ」の系列に沿ったOPACを実現する基礎となる、著作による資料のグルーピングである。
- 概念モデルであるFRBRをもとに新たな目録規則等が作られ、それに沿ってレコード作成が行われるのが本来の道筋である。しかし一方で、現行の規則に沿った既存レコードに一定の処理を加えてOPACの「FRBR化」を実現しようという試みがある。代表的先行例はOCLCのFictionFinderやWorldCatで、「Work-setアルゴリズム」を開発して、MARC21書誌レコードを対象に著作の機械的同定を行っている。
- 日本の書誌レコードは、著作の表現・手がかりが少ない(海外の試みでは統一タイトルや基本記入標目が重用されている)ことなどから、困難度が高い。それでも、発表者等によるいくつかの試行例や、最近では「ゆにかねっと」レコードを対象とする「国立国会図書館サーチ」での実装例があり、ある程度の性能が得られることはわかった。
- しかし一方で、古典著作など、機械的な著作同定が困難な著作群があることもわかってきた。FRBR研究会では、これらについて既存書誌レコードに対する人手による著作同定作業を行っている。統一タイトル典拠レコードの作成と適用を事後的に行う作業ともいえる。著作同定は一度行われれば繰り返し行う必要はなく、かつ同定結果は共有でき、機械的同定結果と組み合わせて活用されることが期待できる。
2.著作同定作業手順
- NDC9版の本表・索引に現れる著作を中心に、現時点では158著作を対象としている。
- 明治期から2009年3月までの刊行図書について、J-BISCから各著作の同定作業対象レコードを抽出し、個々のレコードに対して人手により当該著作に該当するか否かを判定した(2009年4月以降のものも現在作業中)。作業対象レコードの抽出は、再現率を重視してできるだけ幅広く網をかけている。1著作に対する作業対象レコードの平均は208.7個である(著作間のバラつきは大きい)。
- 当該著作に該当すると判定した場合は、JAPAN/MARCレコード上の著作タイトル出現箇所を記録した。該当しないと判定した場合も、その旨を記録した。なお、欧米における先行事例とは異なり、図書中に複数の著作が含まれる場合には各著作について同定を行っている。
- 並行して、シリーズものに対して、編集・収録方針等の観点を確認し、著作の原文を採録しているシリーズかどうかの判定も行った。
- 著作同定にあたっては、FRBRの示す基準に整合させるとともに、「国書総目録」など古典著作に関わる既存の基準にも整合をはかった。原則として、書誌レコードのみから判定することとし、資料現物は参照していない。また、国立国会図書館による作業方針とその作業結果(分類、件名など)はできるだけ活用して判定することとした。
- より具体的には、校注書・現代語訳・影印本・縮約・要約・抜粋・朗読などは同一著作とした。一方、評釈書・学習参考書・児童書・絵本・漫画・索引・梗概・暗誦などは異なる著作とした。貢献の度合い(後の関与者の貢献が大きいものは異なる著作)、同一性の追跡可能性(追跡できない場合は異なる著作)等を判定の根拠としている。
3.著作同定作業結果の集計
- 最も大きな集合となる「源氏物語」を例にとれば、4,112の対象書誌レコードから、1,018レコードが当該著作に該当と判定された。著作同定(タイトル出現)フィールドは、251(タイトル・責任表示)が9割以上を占めるが、290(各巻書名)や377(内容注記)も一定数にのぼる。また、該当レコードのタイトル、責任表示(先頭のもの)、著者標目(先頭のもの)を集計すると、「源氏物語」「紫式部」でないレコードも一定数ある。
- その他いくつかの著作についても結果が示された(略)。
- 該当レコードに現れる著作タイトルの種類数(バリエーション)を「表現形数」の近似、同定されたレコード数と複数冊の冊数の合計を「体現形数」の近似ととらえ、全体集計を行った。各著作に平均で3.5表現形、45.9体現形が存在し、古典著作をFRBR化する意義が認められたと認識している。ただし、著作によるバラつきは顕著に大きい。著作の成立年代、形式、著者の有無による集計も行ったが、カテゴリごとの著作数が大きく異なるため、明確な結論は出しにくい。
4.今後の課題
- まず、判定結果の妥当性の検証(質の保証)、同定作業体制の拡充が課題としてあげられる。また、JAPAN/MARC以外のレコードに対する同定作業や、古典著作以外の著作(例えば音楽作品、近代著作など)の著作同定処理など、対象の拡大も考えられる。
- 同定作業結果の公開も行いたい。OCLCのWork Pageを模したウェブ画面での公開と、同じくOCLCのxISBNを模したAPIによる公開を考えている。想定する使用者とその使用目的の検討がさらに必要である。
発表後、著作同定手順、典拠レコードの活用可能性、著作判定基準、わが国の書誌レコードの問題点、音楽著作への適用事例等について質疑があった。
(記録文責:渡邊隆弘)