情報組織化研究グループ月例研究会報告(2014.7)
アーカイブズ記述の組織化に関する最近の動向
寺澤正直(国立公文書館)、坂口貴弘(京都大学大学文書館)、五島敏芳(京都大学総合博物館)
- 日時:
- 2014年7月26日(土) 14:00〜17:00
- 会場:
- 近畿大学会館
- 発表者 :
- 寺澤正直氏(国立公文書館)、坂口貴弘氏(京都大学大学文書館)、五島敏芳氏(京都大学総合博物館)※3名による分担発表
- テーマ :
- アーカイブズ記述の組織化に関する最近の動向
- 出席者:
- 稲葉洋子、江上敏哲(国際日本文化研究センター)、川崎秀子、河手太士(静岡文化芸術大学図書館)、古賀崇(天理大学)、坂口貴弘(京都大学文書館)、坂本拓(京都大学)、篠田麻美(国立国会図書館)、菅真城(大阪大学)、杉本重雄(筑波大学)、田窪直規(近畿大学)、田村俊明(紀伊国屋書店)、土田賢省(東洋大学)、長坂和茂(京都大学)、中村健(大阪市立大学)、深井美貴(人と防災未来センター資料室)、福島見恵(京都大学)、堀池博巳、松井純子(大阪芸術大学)、松林正己(中部大学)、水谷長志(東京国立近代美術館)、山崎一郎(山口県文書館)、渡邊隆弘(帝塚山学院大学)、和中幹雄(大阪学院大学)、寺澤、坂口、五島<26名>
(1) アーカイブズの情報組織化(寺澤正直)
はじめに、アーカイブズ資料の特徴、アーカイブズ記述の整備にかかる考え方について概説した。アーカイブズ資料は図書館資料と異なる点が多々ある。具体的には、一点ものの資料であること、同一名の資料が多いこと、作成者や作成年等の書誌情報がわからない場合があること等である。アーカイブズ資料は、個々の書誌情報では資料を識別しにくいので、資料の塊(資料群)から探せるように、記述を整えて、機械可読化している。アーカイブズ記述の特徴として、「多段階記述的な資料把握」と「資料の作成母体重視」がある。アーカイブズ記述の機械可読化の代表例として、Encoded Archival Description(EAD)がある。
次に、アーカイブズの情報組織化について理解を深めるため、2011年樹村房出版の『情報資源組織論』を基に図書館の情報組織化について概説した。具体的には、目録法としての書誌と標目、主題組織法としての件名と分類である。
アーカイブズの情報組織化について概説するにあたり、国際公文書館会議(ICA)が公開している次の4つの国際標準を取り上げた。各国際標準の役割の把握を促すため、個々の事例を用いた。
- 書誌の記述に関する国際標準としてGeneral International Standard Archival Description(ISAD(G))がある。多段階記述的な資料把握を書誌で表現する事例として、アメリカ国立公文書記録管理局(NARA)を取り上げた。
- 所蔵機関の記述に関する国際標準として、International Standard for Describing Institutions with Archival Holdings(ISDIAH)がある。検索結果に個々のリポジトリが表示される事例として、イギリスのArchive Hubを取り上げた。
- 典拠の記述に関する国際標準としてInternational Standard Archival Authority Record for Corporate Bodies, Persons and Families(ISAAR(CPF))がある。人名(Person Name)や団体名・機関名(Organization Name)の典拠レコードから検索する事例としてNARAの詳細検索を取り上げた。
- 機能の記述に関する国際標準としてInternational Standard for Describing Functions(ISDF)がある。機能による検索の具体例として、オーストラリア国立公文書館の詳細検索画面を確認した。
さらに、図書館とアーカイブズの情報組織化について比較し、共通する記述の整備対象として、書誌及び典拠があることを確認し、図書館にはあるがアーカイブズの国際標準に含まれていない対象として、件名や分類があることを確認した。図書館とアーカイブズがともに書誌を整えることで実現できるサービスとして横断検索がある。横断検索の事例として、カナダ国立図書館・公文書館(LAC)とユーロピアーナを取り上げた。LACは機関名のとおり、図書館とアーカイブズの複合施設である。LACでは図書館の資料を検索する「Library Search」とアーカイブズの資料を検索する「Archives Search」の他に、両者を検索可能な「Search All」が存在する。またユーロピアーナは図書館やアーカイブズ以外の資料も対象にした検索を実現している。なお、ユーロピアーナのアーカイブズの資料に限定した検索画面としてArchives Portal Europeがある。また、国際標準にはないものの、アーカイブズの主題を用いた検索について、イギリス公文書館の詳細検索やICA-ATOMの機能を取り上げ、主題検索の取り組みがアーカイブズにおいても実装されつつあることを確認した。
(2) アーカイブズ記述規則をめぐる動向(坂口貴弘)
はじめに、アーカイブズ記述規則の前提となる基本概念として、ISAD(G)で規定された4階層からなる記述レベルについて概説した。
- フォンド(fonds)は、「特定の個人、家、団体が、個人的もしくは組織的に活動するなかで有機的に作成され、または蓄積され、使用された記録の総体」と定義される。例えば日本図書館協会文書、坂口家文書といった単位。
- シリーズ(series)は、同じ業務・活動の過程で作成され保管されてきた一連の資料群、あるいは同じ方式で整理された一連の資料群を表す単位。
- ファイル(file)は、紙資料の場合、簿冊1冊やフォルダ1点などがこれに相当する。
- アイテム(item)は、手紙1通や写真1枚などがこれに相当する。
アーカイブズ資料の記述項目(要素)については、ISAD(G)は25の項目を挙げ、それらを7つのエリアに区分している。
アーカイブズ記述の具体例として、3つのアーカイブズ資料群(フォンド)の記述を取り上げて検討した。
- 米国図書館協会文書(イリノイ大学文書館所蔵)の中のシリーズ「理事会議事録(1920年〜)」の記述では、数量(16立方フィート)、編成(年代順)、内容(扱われている主なトピックなど)等の項目がみられ、ISAD(G)の項目と共通する部分が多い。
- 連合国軍総司令部文書(NARA所蔵)は、基本的に総司令部(GHQ/SCAP)内の組織別(局など)に区分されており、その下位階層では当該文書を整理・管理していた際の単位(原秩序)が維持されている場合が多い。
- 伊藤博文関係文書(国立国会図書館憲政資料室所蔵)については、同館Webサイトの「リサーチ・ナビ」に記述があり、その項目はISAD(G)を意識していると思われる。
アーカイブズ記述規則の代表例として、Describing Archives: A Content Standard (DACS)を取り上げた。米国アーキビスト協会が2004年に制定したこの標準は、図書館界の英米目録規則を参照している部分も大きいが、その基本的な考え方や記述要素はアーカイブズ界の国際標準であるISAD(G)に準拠している。
DACSの規定内容について、「組織歴・履歴」「範囲と内容」など、アーカイブズ記述特有の項目を中心に分析した。
2013年1月にDACSの第2版が制定された。主な改訂内容は以下の通り。
- 初版は3部構成だったが、第2版では第3部「名称の形」が削除され、個人名・団体名・家名・地名の形については他の標準(RDAなど)を用いることが推奨された。
- 第2部「作成者の記述」が「アーカイブズのオーソリティ・レコード」と改称され、アーカイブズ資料の作成者である団体・個人・家の記述に関する規定の充実が図られた。
- タイトルにrecordsやpapers等の語を含めるとする規定について、資料に応じた多様な語の使用が許容されるようになった。
- 初版は有料の出版物だったが、第2版は米国アーキビスト協会のWebサイトで無料全文公開された。
(3) アーカイブズ記述の符号化標準類(五島敏芳)
アーカイブズ記述の符号化標準類(データ構造の標準)について、その動向を歴史的に概説した。
- アーカイブズの世界の記述データ符号化はMARCに淵源がある。アーカイブズ関係者が参加しなかったMARC Format for Manuscripts(1973年)の反省をふまえ(itemレベルに偏る)、1984年にMARC AMC(Archives and Manuscripts Control)が発表された。APPM/APPM2等目録規則(DACSの淵源)とも対応し、一定の普及をみた。
- アーカイブズの記述データの量的膨大(とその可能性)は、MARC AMCの適用を限定した。しばしば、seriesレベル以上(主としてcollection/fondsレベル)とitemレベルとで別々の情報システムとして実現し、前者のデータが情報交換用となった。
- この状況の改善(catalogとinventoryの統合)のため、1993年より後にEADとなる符号化標準の開発が始まる。入れ子構造(階層的構造)の記述データ取り扱いのためSGMLに準拠し、1995年からアルファ版、ベータ版と開発を進め、1998年に1.0版DTD(文書型定義)が発表された。
- 2002年にはEAD 2002版DTDが発表されXMLに正式対応した。2006年にはスキーマも公表され、ある程度データ内容(値)を制御できるようになった。
- EAD 2002開発前後より作成者の記述も意識され、Encoded Archival Context(EAC)の開発が始まり、2003年にベータ版が発表される。EADがMARC Bibliographicに対応するとすれば、EACはMARC Authorityに対応する。
- EACは、開発当初よりISAAR(CPF)の影響を大きく受けていたが、いずれ作成者に限らない記述データを志向し2009年に廃止される。同年EAC-CPFのスキーマ草稿版が、翌年スキーマ2010版が発表された。
- 2008年頃には、ISDFに対応するEAC-F(Functions)の構想もあったらしい。EAC-CPFやEAC-Fは、EADの要素との共通性よりも、国際標準類との共通性を保つ志向が見られる。
- EAD・EACの動きとは別に、欧米スペイン語・ポルトガル語圏では所蔵機関のデータ共有・交換を目指す動きからEAGが開発され、対応する国際標準として位置づけられるISDIAHの発表と同じ2008年にアルファ0.2版を公表している。
つづいて各符号化標準類の位置関係とEAD改訂(EAD3)の動きを紹介した。
- EADは検索手段(典型的には資料目録)を統合的に電子化することを当初の目的としていた一方、他の符号化標準はアーカイブズの検索手段に取り込まれていたデータを取り出し効率的に共有することを志向する。
- EAC以降の方向と技術的状況(XMLの成熟、情報システムの進展等など)に、EADを合わせようとする動きが、EAD3にあらわれている。
- EAD3は、DTD廃止、要素の整理、XHTMLとの連携、リンクの容易化、多言語対応等などを実現しようとしている。具体的には、紙媒体の検索手段を再現する慣行的・書式的要素の排除、EAC-CPF/-FやEAGのデータとなる部分を外部化(または複数名前空間を許容して外部データを取り込めること)、アーカイブズ情報システムにおけるデータ管理からの機械的処理への適合、である。
最後に、既存のEADデータや典拠データ等からEAC-CPFデータを抽出・蓄積するSNACプロジェクトにもふれた。
- SNACプロジェクトは、EAD開発以降に蓄積された大量EADデータ(OAC, Online Archive of California等)からそのコレクションや資料(群)の出所・作成者等のデータを抽出したり、図書館の世界の既存典拠データ(VIAF等)から加工したりして、EAC-CPFデータを大量かつ機械処理的に生成している。
(記録は各発表者による)