情報組織化研究グループ勉強会記録(2008年度)

「図書館目録の将来設計(続)」第7回


日時:
2008年4月17日(木) 19:00〜21:10
会場:
日図研事務所104号室
発表者 :
松井純子氏(大阪芸術大学)
テキスト:
谷口祥一, 緑川信之『知識資源のメタデータ』 東京 : 勁草書房, 2007.5 (ISBN:9784326000319) 第4章「知識資源の主題分析」4.3、第5章「ネットワーク知識資源のメタデータ」
出席者:
新谷祐香(千里文化財団)、横山由紀(大手前大学図書館)、猪俣裕子(システムズデザイン)、蔭山久子(元帝塚山大学図書館)、堀池博巳(摂津市施設管理公社)、尾松謙一(奈良県立図書館)、渡邊隆弘(帝塚山学院大学)、川崎秀子(佛教大学)、松井純子、吉田暁史(大手前大学)

4.3 シソーラス作成

 統制語による索引語付与を前提としたうえで、シソーラス作成の方法が述べられる。用語の単位については、「できるだけ最小の単位で収録するのが原則」であるが、「何を持って最小の単位とみなすかは難しい」ともある。
*この方針は単に用語の収録段階だけでなく最終的な出来上がり段階にまで適用される原則なのであろう。要するに複合語の分解規則について言及していると思われる。しかし複合語の分解規則については、最後まで具体的な指針は示されない。非常に大きな問題であるので、何らかの指針が示されるべきではなかったか。

4.3.2 用語間の関係

 等価関係、階層関係、連想関係の3種類の関係性が示される。それぞれの関係性認定基準は、ISO2788−1986等の一般的基準に一応近いものとなっている。しかし相違点もある。類種関係の認定基準では、ISO2788-1986および、ANSI/NISO Z39.19-2005両規格では、some−allの判定基準が示されているが、ここでは用いられていない。また部分−全体関係の階層関係基準では4種類が示されており、この種類分けは上記両規格とほぼ同様である。しかし両規格では、部分−全体関係の認定基準適用に際し、かなり厳密な但し書きが設けられている。それに対し本書では特にそういった制限は説明されていない。実際、「組織」というところで、「図書館とサービス係、整理業務係、会計係」が組織の階層関係例示としてあがっている。この場合、単に図書館ではなく、図書館事務部とでもすべきだと思うが、たとえそうだったとしても、会計係との間にさえ階層関係を設けてしまうのか、という疑問が生じる。

4.3.3 表示

(1)音順表示

 「ディスクリプタと非ディスクリプタの関係は等価関係である」とある。原則はそうであろうが、実際には細かい下位語を上位語としてまとめる手法はよく用いられる。そんな場合も、採用されなかった下位語から探せないのは困るので、非ディスクリプタとしては採用されるケースは多い。等価関係とはかぎらないことになる。このあたりの言及があった方がよいのではないか。
 p.200では、UFをUse Forの略としている。一般的にはUsed Forの略であるとされるが。
 p.202、図4-31で、大学施設の2行下、教室の前にNTが抜けていると思われる。
*この部分の階層関係は、大学−大学施設−教室、となる。これは部分−全体関係であるが、4種類のうちのどの例に該当するのであろうか。こういった階層関係が認められるなら、教室−机-引き出し、という階層関係も認められることになろう。つまり大学と引き出しの間に階層関係が成立してしまう。これでは現実的に困らないだろうか。歯止めに関する何らかの基準説明が必要ではないのか。
*例えば、ANSI/NISO Z39.19-2005では、部分−全体の階層関係をISOのように4種類に限定することなく、学問分野をのぞく3種類を例示するにとどめるも、次のように厳しく制限する。This relationship covers situations in which one concept is inherently included in another, regardless of context, so that the terms can be organized into logical hierarchies, with the whole treated as a broader term.
これは次のように表現できると思われる。AとBが全体/部分階層関係とみなされるためには、まず(1)AとBが同じカテゴリーに属する、次に(2)Bは常にAの部分である、という2つの条件を同時に満たさなければならない、と。(1)によって大学と大学施設との間の階層関係を排除し(大学は物的存在であるが、機能的存在としての側面もある。機能的な存在として捉えた場合、大学施設は大学の部分とは必ずしもいえないであろう)、(2)によって大学施設と教室との間の階層関係を排除する(教室は大学施設のみに属するとはかぎらない)。

(4)中間項

 中間項とは、いわゆるノードラベルのことであろう。図4-35では、図書館のNTとして、館種別と業務別の2通りの区分原理による下位語が示される。そもそも図書館の下位語とは図書館の種類であろうから、すべてが館種別と思われるが、館種別のほかに業務別区分が現れる。業務別区分として、選書や分類・目録が示される。部分−全体関係による下位語と想定しても腑に落ちない。いかがなものであろうか。

(5)用語の形

 多義語を区別するための限定詞についての説明があり、精度(測定)、精度(情報検索)といった例が示される。この限定詞は一般的にqualifierと呼ばれるものであろう。妥当な説明方法と思われる。

4.4.2 主題を表現する用語の探索

(2)主題概念を用語に変換

d)複数の主題概念を複数の用語で表現
 4.3では複合語の分解規則に関して、ほとんど具体的指針は示されなかった。ここでは、付与段階における複合語の分解について、若干の事例が説明される。しかしそもそも複合語については、基本的にはシソーラス構築段階の問題ではないのか。少なくとも、構築段階との関連性について言及があるべきではないだろうか。例えばISO2788-1986の基準に従ってシソーラスを構築すれば、付与段階において揺れが生じることは少ないと思われる。

4.4.3 索引語を知識資源に付与

(1)限定子の付加

 ここでは「肺癌:治療法」というような、結合形の問題が論じられる。後から付加する治療法を限定子と名付けている。先に精度(測定)を限定詞と表現され、こちらでは限定子である。おそらく英語形は後者もqualifierであろうか。MeSHにおけるqualifierに近いものと思われるが、要するにシンタックス問題である。MeSHでは肺癌が先で治療法が後になるが、一般的にはどちらが先と断定することはできない。シソーラスは一般に事後結合索引のために用いられ、事前結合索引に対して用いられることは少ない(MeSHは例外である)。こういった一般論も論じるべきではなかっただろうか。

第5章 ネットワーク知識資源のメタデータ

 第2章で行ったような、メタデータの概念モデル分析やデータ項目の構成といったことが、この章ではネットワーク知識資源を対象として論じられる。メタデータスキーマとしては、この世界でよく知られたダブリンコアが用いられる。ダブリンコアは、対象となる知識資源が汎用的であること、知識資源の作成者・公開者自身が作成することを念頭に置いて作られていること、が特徴であるとし、それゆえ複雑な概念モデルは必要ないとする。つまり単に知識資源に対応する実体さえ定義すればよい。
 データ項目としては、ダブリンコアは基本的に簡略な項目しか定義しないが、それでも最もシンプルな項目定義のほか、限定子と呼ばれるものを用いて若干詳しく展開する方法、さらには独自項目の追加設定の可能なアプリケーション・プロファイルを用いる方法、の2つがあるとする。
 最後に、ダブリンコアの提案する3つのエンコーディング方式(HTML方式、XML方式、RDF/XML方式)が簡単に説明される。