情報組織化研究グループ勉強会記録(2008年度)

「図書館目録の将来設計(続)」第2回


日時:
2008年2月5日(火) 19:00〜
会場:
日図研事務所104号室
発表者 :
渡邊隆弘氏 (帝塚山学院大学)
テキスト:
谷口祥一, 緑川信之『知識資源のメタデータ』 東京 : 勁草書房, 2007.5 (ISBN:9784326000319) 1章(知識資源の組織化)、2-1(メタデータの機能規定と概念モデル)
出席者:
尾松(奈良県立図書館)、松井(大阪芸術大学)、蔭山、村井、猪俣(ナカバヤシ)、吉田(大手前大学)、横山、田窪(近畿大学)、川崎(佛教大学)、渡邊(帝塚山学院大学)、河手(大阪樟蔭女子大学図書館)

はしがき

・「知識資源のメタデータによる組織化」
  用いなかった用語
   「情報」…抽象的。組織化の対象は具体的な資源
   「資料」…図書館に限定しない
   「メディア」…媒体を意味する場合もある

第1章 知識資源の組織化

1.1 知識の組織化と知識資源の組織化
・「知識」→組織化→「知識資源」→組織化→「メタデータ」 (図1-1)
  知識=人間の知識活動によって生産される作品・記録・データなど
  知識資源=知識が何らかのメディア上に体現されたもの
    知識を整理して表現=組織化が必要
     ★文章やデータなどは入るのか?(「電話」は例示されている)
          ←例示されている「ラジオ」や「電話」は「チャネル」ではないのか?知識と情報の区分が不明確では?
     ★情報が組織化されて知識になるのではないか。
  メタデータ=知識資源の諸特徴(属性)を表すデータ(属性値)を抽出したもの
     例)図書館目録や検索エンジンの検索結果など
      属性・属性値の特定=組織化が必須

・知識資源もメタデータも、「コンテンツ」と「メディア(媒体)」の側面を持つ

・本書で扱うのは「知識資源の組織化」
  その目的:効率のよい検索、内容の確認、存在の発見→検索利用を間で含めて組織化を考える必要がある

1.2 メタデータの設計、作成、提供 ((図1-3)
1.2.1 メタデータの設計
・概念設計→レコード設計、記述規則設計→DB設計、エンコーディング設計 (図1-4)
  要求・特性定義(前提条件):対象、目的・機能、体制など
                    ★「体制」は少し先のことを考えるときの前提条件
  概念設計:対象資料と利用要求を検討してモデル構築
          ←必ず行われているわけではないが、本来は不可欠
  レコード設計:レコード/データ項目設計=メタデータの種類とデータ要素を定義
  記述規則設計:属性の分析方法や属性値の記述方式の評価
  DB設計:メタデータDBのスキーマ設計(具体的システム上での) ← 外部提供のみが前提なら不要
  エンコーディング設計:外部交換様式の設計 ←内部処理のみが前提ならば不要
     ★メタデータの構文側面の決定

・実際には「標準化」の観点が重要

・メタデータ設計の特徴:レコード設計
  他の一般的なデータベース設計では概念設計→DB設計+データ項目設定


1.2.2 メタデータの作成と提供
・最終的には、検索システムを介して利用者に→検索機能やユーザビリティの重要性←機能・要件の分析が必要

・メタデータ作成システム…独立型、外部取り込み型、共同分担型


1.3 知識資源の主題分析
1.3.1 主題の表現
・主題=contents、theme、aboutness
      知識の組織化の非常に重要な部分

・知識資源自体にはそのままの形で記載されていないのが一般的
   主題分析→メタデータ上で属性値として表現

・さまざまな表現法…分類、索引、ようやく、翻訳・解説、評価、関連付け
  ★ここでの「索引」はindex一般ではない
  ★「解説」は主題検索に役立つというわけでもない

1.3.2 分類と索引 ←特によく使われているもの
・分類:主題分析→分類表を参照→記号を付与
  ★「頭の中で明文化されていない素朴な分類表」はフォークソノミーを意識しているのか?

・索引:主題分析→用語リストを参照→記号を付与
  自由語=頭の中で明文化されていない素朴な用語リスト
        ★「自然語」ではなく「自由語」
  統制語=体系化され明文化された用語リスト
     同義語の統制、多義語の処理
     その限界も:索引語と検索語の不一致の可能性、新語や固有名詞の扱い
             →自由語との併用も
     分類記号も統制語の一種


第2章 メタデータの設計

2.1 メタデータの機能規定と概念モデル

2.1.1 メタデータの機能の定式化

・要求・機能特性定義の一部として:メタデータの目的や機能を具体的に規定
   ここでは、これまでの図書館目録を前提として
    主な目的・機能:知識資源の発見や同定の識別
     「目的」と「機能」は同一のレベルのものとしてとらえられている

・「パリ原則(1961)」の「目録の機能」
 機能1:既知事項による検索・アクセス機能  ★「識別機能」「ファインディングリスト機能」
 機能2:著者及び著作による集中機能  ★「コロケーション機能」
       既知事項によるアクセス機能のみでは達成できない→著者、著作の表記の多様性 
            ★典拠コントロールの必要性
 (機能3:主題からのアクセス機能)
       パリ原則では対象外
 さまざまなメタデータを見渡すと…機能1と機能3は不可欠、機能2は選択に幅
   ★機能2は図書館目録に特徴的な機能

2.1.2 メタデータの概念モデリング
・概念モデル
   …対象領域(domain)の特性について、達成すべき目的に沿ってデータやメタデータの構造・意味・関連等を示したもの
         直接的表現やシステム実装は考慮外

・モデル記述言語
  実体関連モデル(E-Rモデル)
     「実体(entity)」「関連(relationship)」「属性(attribute)」「実体実現値(instance)」
  オブジェクト指向モデル
     UML(統一モデリング記述)
      「クラス」―「オブジェクト」
      「関連(association)」―「リンク」

・実体関連モデルを用いた「パリ原則」を満たすモデル (図2-1)
  4実体:「資料」「著作」「著者」「主題」
       それぞれに属性を規定しうる
  関連:実体クラス間の関連
       「資料」―「著作」、「著作」―「著者」、「著作」―「主題」
        2項関係、多重度(基数、連続数)
      単一クラス内の関連
        包含関係、その他の関連(継続、補遺、改作など)

2.1.3 FRBRと国際目録原則
・「書誌レコードの機能的要件」
  基本的に現行の目録に沿ったモデル…パリ原則モデルを更に展開した側面も
  現在、このモデルを踏まえて目録際規定化作業が進行中

・第1グループ実体(書誌的実体)
    著作(work):知的・芸術的創造、従来モデルと基本的には変わらない
    表現形(expression):何らかの表記・形式による知的・芸術的表現
    体現系(manifestation):媒体に特定の形式・様式で固定化(物理的な具体化)
    個別資料(item):個々のコピー(単一の例示)
  従来の「資料」を3分割
    各レベルにおける特性の適切な記録
    各レベルにおける集中化→従来モデルよりも書誌的事象を明確に表現

・第2グループ ★第1グループの各実体に責任をもつ実体
  「個人(person)」と「団体(cooprate body)」  ★今は「家族(family)」も
  第1グループのそれぞれの実体と関連

・第3グループ(著作の主題を表現するための実体) ★FRSAD
  「概念(concept)」「物(object)」「出来事(event)」「場所(place)」
  第1、2グループの各実体も「主題」となりうる

・属性の定義…第1グループ実体については包括的に

・関連の定義
  実体間の関連…各実体について定義  ★「ハイレベルの関連」
  その他の実体(実体クラス内の実現値間の関連)…第1グループ実体について包括的に定義

・「利用者タスク」
  「発見する(find)」「識別する(identify)」「選択する(select)」「入手する(obtain)」
  第1グループ実体の属性・関連との対応付け

・「国際目録原則」の策定作業(パリ原則の改定)
  目録の機能:既知事項アクセス機能と集中機能(利用者タスク「発見」)
           集中機能をさらに展開
          他の利用者タスクも機能として位置づけ

2.1.4 目録以外のメタデータにおける概念モデリング
・それぞれの目的や機能に合致したモデル…「著作」実体を必要としない場合も多くある
  例1:「JST Plus」データベース
       「著作」実体は不要、「著者」も少し怪しい(集中機能を実現していない)
       「個人」と「団体」の所属関係
       「記事・論文」と「雑誌・会議録等」の収録関係
  例2:国立国会図書館「雑誌記事索引」
       「著者」―「論文・記事」―「雑誌」―「出版者」
  ※これらはあくまで、実装データから想定したもの