TOP > 月例研究会 > 2022 > / Last update: 2022.9.23

情報組織化研究グループ月例研究会報告(2022.06)

「アジア資料の組織化の課題」

徳原靖浩氏(東京大学附属図書館アジア研究図書館寄付研究部門(U-PARL)特任助教)


日時:
2022年6月18日(土)14:30〜16:00
会場:
(Zoomミーティング)
発表者:
徳原靖浩氏(東京大学附属図書館アジア研究図書館寄付研究部門(U-PARL)特任助教)
テーマ:
「アジア資料の組織化の課題」
出席者:
荒木のりこ(大阪大学附属図書館)、石田康博(名古屋大学法学部アジア法資料室)、今野創祐(京都大学)、江上敏哲(国際日本文化研究センター)、木村麻衣子(日本女子大学)、坂田絵理子(大阪大学附属図書館)、佐藤久美子(国立国会図書館)、塩見橘子、高久雅生(筑波大学)、高野真理子(大学図書館支援機構)、高山和歌子(東京大学附属図書館(U-PARL))、田窪直規(近畿大学)、中道弘和(堺市立図書館)、前川敦子(富山大学附属図書館)、前田直俊(国立国会図書館)、村上健治、森原久美子(秀明大学図書館)、和中幹雄、他5名、徳原<24名>

1.はじめに

 発表者から自己紹介があり、自身の専門(ペルシア文学・イラン思想史、イスラーム地域研究情報資源学)、図書館に関わる経歴、前職の東洋文庫研究部イスラーム地域研究資料室での活動、現在の職場である東京大学附属図書館U-PARLでの活動が紹介され、本日の発表の概要が示された。

2.目録等規則に関係すること

 アジア資料の本発表における定義(主にアジア諸地域で生み出された資料)につづき、図書館で整理する上で問題となる特徴として、アラビア語のように右から左に読み書きする言語や、モンゴル語のように縦書きで左から右に改行する言語もあること、欧米や日本とは異なる出版の様式や知識体系の違いに由来する特徴が挙げられた。実際に整理をしてみると、目録規則から零れ落ちるような特徴を持つ資料に遭遇し、頭を悩ませることが多い。
 目録作成者がつまずくアジア資料の特徴として、以下が挙げられた。

 外国語能力や知識の不足に起因する問題については目録作成ワークショップ等で対応できるが、規則類が十分に整っていないためにつまずくものもある。以下、より詳細に具体的な例について説明する。
 まず、タイトルの言語に関して。NACSIS-CATにおいては、コードブロックのTTLLフィールドにタイトルの言語を入力する必要があるが、そのコーディングマニュアル(以下、NC)には、「本タイトルの言語は、特定の1言語であるか、言語が特定できないかのいずれかである。本タイトルの言語が特定できない場合に、本タイトルの言語コードにコード「mul」(多言語)を記入してはならない。」「言語が特定できない場合は「und」」を入れるという規定がある。しかし実際には、言語を超えて使われるタイトルがある。例えば「ISLAM」というタイトルは何語として扱うべきであろうか。和書のタイトルであれば「日本語」とみなすのではないだろうか。中国の古典作品の題名が日本語訳や日本語の解説でもそのままの形で使われるのと同じように、同じ文字を用いるサンスクリット語とヒンディー語、アラビア語とペルシア語やオスマントルコ語などでも同様の例がある。
 では、本タイトルを決定する基準はあるのか。通常は、責任表示の記述や本文の言語、すなわち文脈によってタイトルの言語を特定しているのではないだろうか。こうした点については、マニュアルで詳細に規定されているものではなく、作成者の裁量に委ねられる範囲にあたると考えられている。
 しかしそもそも「本タイトルの言語」の記入は必要か。MARC21では、本タイトル(title proper)の言語コードを記入する箇所はないように思われる。それでも、どの言語の翻字規則やヨミを適用するかという問題は残り、検索に影響する。タイトルも本文もウイグル語やチベット語の図書で、奥付の中国語の情報によって書誌データが作成されたものも少なくない。統計をとる主旨からすると、本タイトルの言語より本文の言語(複数ある場合の処理が必要だが)を基準にしたほうが良いように思われる。
 次に、西暦でない出版年のコード記入に関して。目録作業の実務上、アラビア語等の資料に表記されたイスラーム暦が西暦の複数年にまたがるとき、コードブロックのYEAR(刊年1と刊年2のフィールドがある)にはどちらの年を記入するのか、またその典拠は、という疑問が生じる。AACR2では、西暦以外の暦法で書かれた出版年から推測される西暦が、複数年にまたがっている場合、以下のように記録する。

 PUB: 出版地: 出版者, 1400 [1979 or 1980]

 この場合、NACSIS-CAT上のデータの記入では、コードブロックのYEAR (刊年1と刊年2のフィールドがある)には、通常刊年1に1979を記入し、刊年2は空欄にするように見受けられるが、1980でなく1979を記入する理由はNCをさがしても見つからない。海外の文献を参照したところ、MARC21のコード記入について解説した書物の中で、「角括弧内に可能性のある出版年が複数示されている場合、早い方の日付を008 Date 1に記入せよ。008 Date 2に転記すべき日付はないため、Date 1は単年であるから、[...]」といった記述が認められるが、NCにはこのような規定はない。このことから、コーディングに関する英米の基準が、書誌データの流用を通じて浸透したのではないだろうかと考えられる。
 三つ目に、手書きのカード目録等からMARCへの移行で生じた問題として、文字コードの問題がある。Windows2000の登場により多言語の扱いが容易になり、2003年、NACSIS-CATにおけるアラビア文字資料の運用が開始された。以後、デーヴァナーガリー資料、タイ文字資料(2006年)の運用が開始され、「特殊文字・特殊言語資料に関する取扱い及び解説(2011.12)」をもって、その他の非ラテン文字資料の目録作成も可能となった。しかし、見た目が同じ文字でも、ユニコードでは違う文字として登録されている場合があり、どれを使えばよいかという規定がない。
 例えば、アラビア文字のアイン(ع)の翻字に使う記号について、ALA-LC Romanization Tables には、文字コードの指定がなく、どの文字を使うか共通認識がないために、日本と米国で異なる文字が使われており、目録作業ではしばしば混乱が生じている。こうした混乱は、LCの規則を採用しながら、米国でのローカルルールや解釈を適用しないために生じているといえないだろうか。

3.図書館システムに関係すること

 MARCへの移行で生じた新しい問題として、多言語データの格納のための環境の問題がある。多言語目録を行うためには、クライアントPCのOSのユニコード対応だけでは不十分で、図書館システムのアプリケーションでの対応が肝要である。例えばFlashなどを使用するアプリケーションでは、アラビア語には対応していても、追加文字を使うペルシア語やウルドゥー語では文字が正しく表示されないことがある。文字を表示するためのフォントも必要である。
 また、正しい検索のためには正規化処理が必要である。同じ文字なのにユニコード上では異なる文字として登録されているケースや、符号と文字の組み合わせが別々の文字としても、合字としても登録されているケースがある。NACSIS-CATではアラビア文字の正規化処理を行っているのに対し、各図書館のローカルOPACでは同様の処理をしていないため、ローカルDBの直接検索と、CiNii経由の検索では、自館所蔵資料の検索結果が異なってしまう。

4.分類について

 東京大学附属図書館アジア研究図書館分類表を紹介する。まず地域ごとに図書を並べるという前提に立ち、アジア研究図書館の開架フロアの書架分類は地域、言語、主題の順に展開している。
 地域分類には広く浸透したものがない。また、現代の地理区分が歴史研究などにおいてかならずしも自明のものではない。
 主題分類については、容易に参照できる分類表のうち、NDCは日本(語)で刊行された資料、DDCは英語圏で刊行された資料の分類に重点をおいている。NDCを基調としつつ、アジア各国の資料を同じように分類できるようにしたいと考えた。以下のサイト「アジア研究図書館資料の探し方」 https://www.lib.u-tokyo.ac.jp/ja/library/asia/material に分類表へのリンクがある。
 図書の請求記号ラベルの例を挙げる。1段目の左に地域分類、右に言語分類、2段目に主題分類、3段目の左に著者記号、右に必要に応じて巻号or年数が書かれている。
 アジア研究図書館分類表の地域分類は、地域によって下位区分の仕方に違いがある。詳細は上記リンク先の分類表をご覧いただきたい。中央ユーラシアや西アジアは小区分なしといったばらつきがあるのは、これらの地域は広くとらえた方が研究上の利便性が向上するといった判断によるものである。
 言語分類は、地域によって使用する言語記号に違いがある。基本的にはJ 和書、W 洋書、X アジア諸語他で分類しているが、地域によって言語区分を細分化している。
 主題分類は、地域・言語によって付加記号の使い方に違いがある。NDC9の第2次区分(綱目表)00〜99を基調としているが、「199 ユダヤ教」のような不均衡項目や、「16 宗教」の細目を表現するため、一部第3次区分を採用し、全体として3桁の数字に揃えた。反対に、「20 歴史」「80 言語」「90 文学」は第2次区分に含まれる地域や言語の区分を省略し、200(伝記、地理は除く)、800、900に統一した。小数点以下は採用せず、地域ごとに独自のアルファベット1文字の付加記号を設定し、付加記号の部分でNDCとは異なるロジックを表現した。
 以下は分類についての振り返り、反省点である。
 例外もあるが、基本的には、他部局からの移管資料の請求記号付与を容易にするため、地域・言語・主題ともに、既存の分類より簡略化した。将来的なことを考えると、列挙式で細かく区分していくよりも、組み合わせのできるファセットごとに更新していくことで、分類法のメンテナンス作業がより軽減されるのではないかと考える。また、必要に応じて部分的にDDCなど他の分類法を取り込めるとよいと思った。主題分類で一番つまずくのは、地域研究や文化研究など、学際的・領域横断的な方法論によって編まれた資料(特に論文集)であるが、分類体系をいじるより、注記を追加していくのがよいのではないかと感じた。分類の精度を高めていく上で、実際の運用においてはラベルの形式などもネックになっているのではないか(巻冊次が5桁以上だと枠からはみ出る、等)。

5.まとめ

 目録に関する規則やシステムの改修などにおいて、少数の多言語資料が取り残されないことが重要ではないか。(和書、和漢書や東アジアに関する規則類は別として)、日本の図書館が特に先進的立場にあるとはいえない洋書、特にアジア資料の目録や分類については、一つ一つの言語や地域の特徴を把握しながら規則類を整備していくことに限界を感じる。とはいえ、ただでさえ手のかかるアジア資料の組織化が、規則やシステムの更新から取り残されないためには、LCRIのような規則の解釈と適用を検討する継続的な作業が必要である。RDAやALA-LC翻字規則といった準国際的な目録関係の規則・基準や、Unicode等の多言語環境に関わる動向を〈多言語資料を念頭において〉継続的にフォローし、日本の情報組織化の環境に適用していくことが重要だ。

 以上の発表を受けて、東京大学附属図書館アジア研究図書館分類表を作成するにあたって参考とした専門書やアドバイスを受けた専門家はいたのか、請求記号が長くなると書架に排架する際に困難が生じるという説についてはどのように考えるのか、NACSIS-CATにおける不十分な点についてNIIにかけあうといったことはしたのか等の質疑があった。

 なお、今回の月例研究会については、Zoomの映像を録画し、開催後一週間に限り、出席を申し込んだものの欠席された方にも、映像を配信した。

(記録文責:今野創祐)