情報組織化研究グループ勉強会記録(2008年度)
「図書館目録の将来設計(続)」第2回
- 日時:
- 2008年2月5日(火) 19:00〜
- 会場:
- 日図研事務所104号室
- 発表者 :
- 渡邊隆弘氏 (帝塚山学院大学)
- テキスト:
- 谷口祥一, 緑川信之『知識資源のメタデータ』 東京 : 勁草書房, 2007.5 (ISBN:9784326000319) 1章(知識資源の組織化)、2-1(メタデータの機能規定と概念モデル)
- 出席者:
- 尾松(奈良県立図書館)、松井(大阪芸術大学)、蔭山、村井、猪俣(ナカバヤシ)、吉田(大手前大学)、横山、田窪(近畿大学)、川崎(佛教大学)、渡邊(帝塚山学院大学)、河手(大阪樟蔭女子大学図書館)
はしがき
・「知識資源のメタデータによる組織化」
用いなかった用語
「情報」…抽象的。組織化の対象は具体的な資源
「資料」…図書館に限定しない
「メディア」…媒体を意味する場合もある
第1章 知識資源の組織化
1.1 知識の組織化と知識資源の組織化
・「知識」→組織化→「知識資源」→組織化→「メタデータ」 (図1-1)
知識=人間の知識活動によって生産される作品・記録・データなど
知識資源=知識が何らかのメディア上に体現されたもの
知識を整理して表現=組織化が必要
★文章やデータなどは入るのか?(「電話」は例示されている)
←例示されている「ラジオ」や「電話」は「チャネル」ではないのか?知識と情報の区分が不明確では?
★情報が組織化されて知識になるのではないか。
メタデータ=知識資源の諸特徴(属性)を表すデータ(属性値)を抽出したもの
例)図書館目録や検索エンジンの検索結果など
属性・属性値の特定=組織化が必須
・知識資源もメタデータも、「コンテンツ」と「メディア(媒体)」の側面を持つ
・本書で扱うのは「知識資源の組織化」
その目的:効率のよい検索、内容の確認、存在の発見→検索利用を間で含めて組織化を考える必要がある
1.2 メタデータの設計、作成、提供 ((図1-3)
1.2.1 メタデータの設計
・概念設計→レコード設計、記述規則設計→DB設計、エンコーディング設計 (図1-4)
要求・特性定義(前提条件):対象、目的・機能、体制など
★「体制」は少し先のことを考えるときの前提条件
概念設計:対象資料と利用要求を検討してモデル構築
←必ず行われているわけではないが、本来は不可欠
レコード設計:レコード/データ項目設計=メタデータの種類とデータ要素を定義
記述規則設計:属性の分析方法や属性値の記述方式の評価
DB設計:メタデータDBのスキーマ設計(具体的システム上での) ← 外部提供のみが前提なら不要
エンコーディング設計:外部交換様式の設計 ←内部処理のみが前提ならば不要
★メタデータの構文側面の決定
・実際には「標準化」の観点が重要
・メタデータ設計の特徴:レコード設計
他の一般的なデータベース設計では概念設計→DB設計+データ項目設定
1.2.2 メタデータの作成と提供
・最終的には、検索システムを介して利用者に→検索機能やユーザビリティの重要性←機能・要件の分析が必要
・メタデータ作成システム…独立型、外部取り込み型、共同分担型
1.3 知識資源の主題分析
1.3.1 主題の表現
・主題=contents、theme、aboutness
知識の組織化の非常に重要な部分
・知識資源自体にはそのままの形で記載されていないのが一般的
主題分析→メタデータ上で属性値として表現
・さまざまな表現法…分類、索引、ようやく、翻訳・解説、評価、関連付け
★ここでの「索引」はindex一般ではない
★「解説」は主題検索に役立つというわけでもない
1.3.2 分類と索引 ←特によく使われているもの
・分類:主題分析→分類表を参照→記号を付与
★「頭の中で明文化されていない素朴な分類表」はフォークソノミーを意識しているのか?
・索引:主題分析→用語リストを参照→記号を付与
自由語=頭の中で明文化されていない素朴な用語リスト
★「自然語」ではなく「自由語」
統制語=体系化され明文化された用語リスト
同義語の統制、多義語の処理
その限界も:索引語と検索語の不一致の可能性、新語や固有名詞の扱い
→自由語との併用も
分類記号も統制語の一種
第2章 メタデータの設計
2.1 メタデータの機能規定と概念モデル
2.1.1 メタデータの機能の定式化
・要求・機能特性定義の一部として:メタデータの目的や機能を具体的に規定
ここでは、これまでの図書館目録を前提として
主な目的・機能:知識資源の発見や同定の識別
「目的」と「機能」は同一のレベルのものとしてとらえられている
・「パリ原則(1961)」の「目録の機能」
機能1:既知事項による検索・アクセス機能 ★「識別機能」「ファインディングリスト機能」
機能2:著者及び著作による集中機能 ★「コロケーション機能」
既知事項によるアクセス機能のみでは達成できない→著者、著作の表記の多様性
★典拠コントロールの必要性
(機能3:主題からのアクセス機能)
パリ原則では対象外
さまざまなメタデータを見渡すと…機能1と機能3は不可欠、機能2は選択に幅
★機能2は図書館目録に特徴的な機能
2.1.2 メタデータの概念モデリング
・概念モデル
…対象領域(domain)の特性について、達成すべき目的に沿ってデータやメタデータの構造・意味・関連等を示したもの
直接的表現やシステム実装は考慮外
・モデル記述言語
実体関連モデル(E-Rモデル)
「実体(entity)」「関連(relationship)」「属性(attribute)」「実体実現値(instance)」
オブジェクト指向モデル
UML(統一モデリング記述)
「クラス」―「オブジェクト」
「関連(association)」―「リンク」
・実体関連モデルを用いた「パリ原則」を満たすモデル (図2-1)
4実体:「資料」「著作」「著者」「主題」
それぞれに属性を規定しうる
関連:実体クラス間の関連
「資料」―「著作」、「著作」―「著者」、「著作」―「主題」
2項関係、多重度(基数、連続数)
単一クラス内の関連
包含関係、その他の関連(継続、補遺、改作など)
2.1.3 FRBRと国際目録原則
・「書誌レコードの機能的要件」
基本的に現行の目録に沿ったモデル…パリ原則モデルを更に展開した側面も
現在、このモデルを踏まえて目録際規定化作業が進行中
・第1グループ実体(書誌的実体)
著作(work):知的・芸術的創造、従来モデルと基本的には変わらない
表現形(expression):何らかの表記・形式による知的・芸術的表現
体現系(manifestation):媒体に特定の形式・様式で固定化(物理的な具体化)
個別資料(item):個々のコピー(単一の例示)
従来の「資料」を3分割
各レベルにおける特性の適切な記録
各レベルにおける集中化→従来モデルよりも書誌的事象を明確に表現
・第2グループ ★第1グループの各実体に責任をもつ実体
「個人(person)」と「団体(cooprate body)」 ★今は「家族(family)」も
第1グループのそれぞれの実体と関連
・第3グループ(著作の主題を表現するための実体) ★FRSAD
「概念(concept)」「物(object)」「出来事(event)」「場所(place)」
第1、2グループの各実体も「主題」となりうる
・属性の定義…第1グループ実体については包括的に
・関連の定義
実体間の関連…各実体について定義 ★「ハイレベルの関連」
その他の実体(実体クラス内の実現値間の関連)…第1グループ実体について包括的に定義
・「利用者タスク」
「発見する(find)」「識別する(identify)」「選択する(select)」「入手する(obtain)」
第1グループ実体の属性・関連との対応付け
・「国際目録原則」の策定作業(パリ原則の改定)
目録の機能:既知事項アクセス機能と集中機能(利用者タスク「発見」)
集中機能をさらに展開
他の利用者タスクも機能として位置づけ
2.1.4 目録以外のメタデータにおける概念モデリング
・それぞれの目的や機能に合致したモデル…「著作」実体を必要としない場合も多くある
例1:「JST Plus」データベース
「著作」実体は不要、「著者」も少し怪しい(集中機能を実現していない)
「個人」と「団体」の所属関係
「記事・論文」と「雑誌・会議録等」の収録関係
例2:国立国会図書館「雑誌記事索引」
「著者」―「論文・記事」―「雑誌」―「出版者」
※これらはあくまで、実装データから想定したもの