図書館情報学

教えてNIIさん!(兄さん、と読む)

Nacsis-Webcat で「計量国語学」でヒットするのに「計量国語」では0件だ。

ヘルプを読んでみた。なるほど、前方一致検索には末尾にアステリスクをつけるのか。

そこで「計量国語*」として検索した。5件だった。
一方「計量国語学」では2件だ。この2件はすべて上の5件に含まれる。

(1)「計量国語」0件
(2)「計量国語*」5件
(3)「計量国語学」2件


(2)と(3)でヒットした書誌情報を比べてみたが、区別がわからなかった。なぜ結果が違うのだろうか?


| | コメント (0) | トラックバック (0)

データ入力のミス?NIIのミス?

Manga Shakespeare というシリーズの "As You Like It" という本を京都精華大学から借りて読んだ。漫画でわかりやすくシェイクスピアの戯曲を翻案した本だ。まあまあ面白かったので、シリーズの別の本を借りたいと思った。

そこで LIMEDIO の検索をかけてみた。ラジオボタンを NACSIS目録に合わせて manga shakespeare と検索すると2件ヒットする。2件目をクリックする。詳細画面がでる。

しかしこの画面を見ると、これがあたかも一冊の本であるかのような誤解を与える。Webcat Plus をクリックしても所蔵館が0になっている。実際は多くの大学が所蔵しているのに。

NACSIS WEBCAT で調べると、多数の大学がそのシリーズを所蔵していることがわかる。

わたしは NACSIS で調べる前、てっきり「こんなに人気のでそうなシリーズなのに、ここの大学しか所蔵していないなんて、凄いなー」と思ってしまった。

これは目録関係のミスなのだろうか。それともミスですらないのだろうか。

| | コメント (0) | トラックバック (0)

ワードクラウドと聞き返し、両方ほしい?

福井県立図書館の「覚え違いタイトル集」に刺激されて、大学 OPAC を比較してみた。

開高健は、「かいこうたけし」とも「かいこうけん」とも読む。しかし「かいこうたけし」のほうが正式なのだろうか。

京都大学の KULINE は富士通の ILIS を使っているようだ。「かいこうけん」を著者名に入れて詳細検索すると中国人が著した本の1冊がヒットする。書名に入れて検索すると0件だ。開高健に関す る本もしくは開高健作の本を多数所蔵しているにもかかわらず、だ。よくわからないが、これは目録を作るほうの責任なのか?それともシステムの問題なのだろ うか。

一方慶大の KOSMOS や筑波大の Tulips では「かいこうけん」でもちゃんとヒットする。しかし KOSMOS では「かいこうたけし」の検索よりもずっとヒットが少ない。やはり目録作成の問題なのだろうか。

やはり次世代 OPAC にはファセットだけではなくて、ワードクラウドが必要なのだろうか。「かいこうけん」検索をしても、現状のファセットだけだと「かいこうたけし」だともっとヒットしますよ、という喚起・提案がぜんぜん出来ていない。私は次世代OPACにはそこまで求めている。ワードクラウドで、「かいこうけん」に近接する「かいこうたけし」を目で見えるようにすることで、「あ、これはマイナーな綴りだったんだ」とわかる。

いや、そうはいっても聞き返し(Did you mean to search for...?)でもできる。複数の候補があるときの場合には、聞き返しでもワードクラウドでも対応できる。

| | コメント (0) | トラックバック (0)

KOSMOSにもひらがな・漢字間の互換性はないんだね

前の記事の続きだ。慶応大学 KOSMOS で以下の検索を試してみた。

「まんが」「とうけいがく」で検索したら、4件ヒットした。
「まんが」「統計学」で検索したら、4件ヒットした。
「マンガ」「統計学」でも 4件ヒット。
しかし「漫画」「統計学」では 0件。

これはどういうことなのだろうか?

別の検索語で試してみた。

「純粋理性批判」で検索したら 104件ヒットする。(これをXとする)
「じゅんすい理性批判」なら 0件。
「じゅんすいりせいひはん」なら45件ヒットする。(これをYとする)

なぜ X の件数と Y の件数が等しくならないのだろうか?まず私は、外国語図書のせいだと思った。中国語の本かなにかを拾ったから104件なのだろう、と。しかしファセットを見ても、日本語102件、ドイツ語1件、フランス語1件だった。

よって理由がわからない。

しかし基本的には、「まんが」「とうけいがく」の検索で4件拾ったのも同じ理由からと思われる。

NACSIS Webcat でも「まんが」と「マンガ」の間の互換性はあるが「まんが」と「漫画」の互換性がないことがわかった。しかし、KOSMOS と同じく「まんが」「とうけいがく」なら「まんが」「統計学」と同じ件数だけヒット(5件)する。

| | コメント (0) | トラックバック (0)

とはいってもひらがなと漢字のあいだの互換性がほしい場合もあるよね

『マンガでわかる統計学、回帰分析編』という本がある。統計学をわかりやすくマンガで解説したこのシリーズは、凄くためになるし、勉強にもなる。 Amazon のレビューを見てもわかるが、外国語(中国語や英語、多分ドイツ語など)にも翻訳されて高い評価を受けている。絶賛のコメントも多い。

筑波大学の TULIP の記事で、TULIP には「ひらがな」と「漢字」間、ないし「カタカナ」と「漢字」間の互換性がないと書いた。これは場合によっては良いことだし、場合によっては悪いことでもある。

悪い場合にあたるのがこの記事で紹介する本を探すときだ。
例の本を探し当てるために、「まんが」あるいは「マンガ」と「漫画」のすべてを試さなくてはいけない。2回検索しないといけないのだ。LIMEDIOに「ひらがな」と「カタカナ」間に互換性があることは、前述の記事で述べたとおりだ。

日本は漫画大国だ。漫画関係の書物を探しての検索をする人も多いだろう。本を探すたびに「まんが」と「漫画」の両方を入れて試さなくてはならない。

筑波大学TULIPのファセット(左のフレーム)を見ても、「まんが」と「漫画」と「マンガ」の括りの項目が見られなかった。

あいまい検索を発動して利便性が増す例と不便さが増す例を研究すべきだろう。

| | コメント (0) | トラックバック (0)

筑波大学 Tulips に関して

筑波大学の Tulips で manga shakespeare と入れて検索した。

すると『非正則推測理論と情報量の概念に関する研究』という本がヒットした。書誌情報画面のどこにも manga も shakespeare の文字列が見られなかった。

また『言語文化論集 54号 2000年10月10日』もヒットした。しかし検索結果詳細画面のどこにも manga shakespeare がなかった。

『アジア(含オーストラリア)における英米文学の受容・変容(19世紀―21世紀)』
という報告書に関してもそうだ。

『文学研究論集 12号 1995/03/20』に関してもそうだ。

一番最初の資料以外は、おそらく職員のみが見れる画面では表示されているのだろう。これは仕方のないことなのだろうか。

一方 「まんが」「とうけいがく」と入力して検索したら0件だった。
しかし「漫画」「統計学」と入力して検索したら多数ヒットした。
これはミスなのか?そうではなさそうだ。試しに「しょうけいもじ」で検索しても0件だった。ということは、富士通のILIS に備わっているような漢字とひらがなの互換性はないわけだ。

「統計学」「まんが」で検索したら、39件のヒット。
「統計学」「マンガ」で検索したら、39件のヒット。
「統計学」「漫画」 で検索したら、14件のヒット。
「とうけいがく」「まんが」で検索したら、0件。

ひらがなとカタカナの互換性はあっても、漢字とひらがな間、あるいは漢字とカタカナ間の互換性はないということになる。

ひらがなと漢字の互換性のないことは、WYEIWYG (What You Enter Is What You Get)をよしとする立場からは結構なことだ。しかし LIMEDIO は「あいまい検索」を採用している。なるべく多くを拾いたい考えだと思う。ひらがなと漢字の互換性がないことは、あいまい検索を採用した背景の考えと矛盾 しているのではないだろうか。

このあたりのこと(互換性)は、Tulips のヘルプをざっと見ても見つけられなかった。きちんと書いておくべきだと思う。

------------------------------
one with を検索してみた。book      
OECD environmental performance reviews のシリーズが上位に多数ヒットした。しかし詳細情報を見ても one with が見当たらなかった。なぜだろう?

注記:Tulips のことを TULIP だと思ってた。ところで Tulips って何の略?最後の ps がわからない。

| | コメント (0) | トラックバック (0)

LIMEDIO のあいまい検索

LIMEDIOのヘルプのページのあいまい検索の項から引用する。

引用:
英単語の語形変化

名詞の複数形や、動詞の人称や時制による変化などを吸収します。

たとえば、「company」と「companies」、「throw」と「threw」、「quick」と「quickest」を、それぞれ同じ単語として扱います。

そこで missed と検索語に入れて検索してみた。やはり危惧していた結果がでた。図書だけで965件ヒットした。

1ページ目に、著者名が Hasnia-Sonia Missaoui  なのを拾っていた。また1ページ目にはドイツ語の Kommission をシリーズ名に含む資料もヒットしていた。

これは「あいまい検索」の欠点だろう。いや、あいまい検索自体は評価できる。検索漏れを少なくできるから。しかし余計な検索結果がわんさかと増えるのは問題だ。

もしかしたらこの問題はLIMEDIO だけではないのかもしれない。

しかしノースカロライナの大学共同の TRLN のOPAC もKOSMOSも、missed と入れて問題なく検索できた。

| | コメント (0) | トラックバック (0)

バイエルン州立図書館のOPACは先進的だ

バイエルン州立図書館(Bayerische Staatsbibliothek)は WorldCat とそっくりな次世代 OPAC だ。ファセットを採用し、検索の聞き返し機能(Did you mean...?)がついている。ドイツ語で聞き返さず英語で聞き返しているということは、おそらくOCLCのシステムと共通のものを使っている可能性が ある。

そこで Vater と Väter の両方を検索してみた。さすがにドイツの図書館だけあって、Väter を入れても 上位に Vater の結果がずらりと並ぶなどということはなかった。なぜこの検索を試したかというと、単複同型の単語だからだ。同様に Töchter と Tochter でも試してみた。感動した。やはり Töchter が上位にその単語を含む書名をずらりと表示してくれた。これは当たり前に装備して欲しい機能だ。しかし日本の多くのベンダーのOPACで はこれは当たり前になっていない。

ところで、今 WorldCat で图书馆(tushuguan 注:このブログでは簡体字を表示できないようだ)を入れて検索したら最初の1ページに中国語の書がほとんどヒットせず、日本語タイトルの書が多くヒットした。慶大KOSMOS のように関連度順にソートした結果がでていれば楽なのだが。しかし WorldCat には facets がある。Language で絞ればいいのだ。Chinese で絞って万事解決した。

追記:慶大KOSMOS で globalisation の検索語で検索したら、globalization と globalisation の順序がごちゃ混ぜの結果がでた。先ほど感動したが、あれはたまたまだったのだろうか。


| | コメント (0) | トラックバック (0)

LIMEDIOのあいまい検索について要望したいことが...

LIMEDIO で前方一致検索をするにはどうすればいいのだろうか。私はこの点に絞ってLIMEDIOの解説を読んだ。前方一致検索は「請求記号」でしか発動されないということなのだろうか。もし私が誤解していたならば申し訳ないが、この解説から私はそのように理解した。

ユーザーが前方一致検索を指定できないのは問題ではないだろうか。おそらく部分一致検索が前方一致検索を兼ねているとのことだろう。しかし前方一致検索を 指定したほうがヒットする件数が絞れるので必須の機能なのではないだろうか。前方一致検索の指定はILISはできるようだ。早稲田大学の WINEはデ フォルトで前方一致の書名検索ができる。

一度簡単に触れたことだが LIMEDIO の「あいまい検索」も両刃の剣だ。ある検索語から多くの資料を拾ってきて検索漏れを少なくするのは利点だ。しかしその分だけ余計な資料を拾ってくる可能性が大きくなる。

現状では「あいまい検索」によって拾ってきた資料の「ふるいわけ」機能は、おそらくついていまい。自動的に「国」と「國」のヒットを分けてユーザーに提示 したほうが便利に決まっている。同様に「ヴェニスの商人」と「ベニスの商人」をごっちゃに並べるのではく、分けて固まりで提示したほうがいい。

それだけでなく、ILISでもLIMEDIOでも中国語で tushuguan 图书馆を入れたら日本語の「図書館」を含む本がずらりとヒットするようだ。これは問題だろう。(これには誤解があった。「続きをよむ」の「追記」を参照)

次世代OPAC には WYEIWYG (What you enter is what you get) 性を重視してもらいたいものだ。

今、慶応大学のKOSMOSで検索語に 图书馆 (tushuguan 注:このブログでは簡体字は表示されない)と入れて検索してみた。感動した。デフォルトでは「関連度」順にヒットするのだが、ずばり欲しかったタイトルの本が上位にずらりと並んででてきた。奈良教育大学の使っている LINUS も筑波大学などの使っている LIMEDIO も現時点ではここまで実現できていないようだ。

追記:こちらの記事にも書くように、のちほど globalisation でKOSMOS検索したら globalization と順序がごちゃごちゃの結果がでた。たまたまだったのかもしれない。
globalisation と globalization の結果をそれぞれクラスター化して利用者に提示する機能は、おそらく実現しているシステムは今のところないのだろう。あればすごく便利だ。

追記:今LIMEDIO の詳細検索で、キーワードに「図書館」、言語に chi と入れて検索したら中国語の「図書館」のタイトルの本が検索できた。

| | コメント (0) | トラックバック (0)

ILIS を使っているユーザーとして、改良してほしい点など

LIMEDIO のヘルプがインターネットにあったので興味深く読んだ。これがその目次だ。私は「前方一致検索」をLIMEDIOはどう扱っているのだろうか、ということに絞って読んでみた。

さて、早稲田大学の WINE を使っていて気づいたことがある。書名検索は前方一致検索だ。タイトル検索では部分一致もできる。昨日気づかなかったが、WINE では二重引用符検索ができる。"in and out"の検索で試してみたが、便利な機能だ。書名検索で economic と入れて検索してみた。Economic で始まる書名の他、The Economic で始まるものもある。the は特別扱いのようだ。どうやら the のみが例外だと思えるのだが、そうなのだろうか。WINEを一通り試してみて、その便利さに気づいた。

京都市立図書館が使っている富士通のILIS は「書名」検索をすると「書名」に含まれる文字列だけでなくその他諸々の付属情報の文字列まで拾ってくる。だから職員だけに表示される画面にその文字列が 表示されていたとしても、我々ユーザーの画面には一切表示されない文字列のものも多数ヒットする。だから使っていていらいらするのだ。試しにデフォルトの部分一致検索で usb と入れて検索してほしい。言っている意味がわかるはずだ。

ひどいのは、外国語の小説が日本語の小説に訳されている図書の場合だ。原題に usb という文字列が含まれているらしく、しかしその原題をユーザーの書誌詳細画面に一切表示していない図書館が多数ある。これはなんとかすべきだろう。

私は京都市立図書館にこう申し入れたことがある。OPACは、ドライバーにとってのハンドルのようであるべきだ、と。ハンドルを右に切れば右に曲がり、左 に回せば左に曲がるというのが反応としてドライバーに伝わってくる。そのような感触を与える操作性が必要だ。そうでなければ、余計な本がたくさんヒットし て、その理由がわからずイライラするし、不安にもなる。

そういった要素はOPACにとっても案外重要なことだ。次世代OPACの開発は、そういったことにも気を配って行ってほしい。なぜ

<この検索語を入れたら>
<この検索結果が返ってきたのか>

ということが利用者にわかりやすいようにしてほしい。

ダメ押しに、この例も挙げておこう。「カナブン」「糞」の検索語で 京都府図書館横断検索、K-LIB で検索してほしい。森鴎外全集が1件府立図書館のが出るはずだ。その資料詳細画面を見て、どうしてこの本がヒットしたのか、利用者にわかるように設計すべ きだ。カナブンは「仮名文」を拾ったのはわかる。しかし「糞」はどれを拾ったのだろうか?私はてっきり、「糞」をひらがなから拾ったのだろうか、と最初は 思った。経験からそのようなことはないと思うのだが、そう思って一生懸命「ふん」にあたる言葉を捜した。しかしなかった。

このあとNDL-OPACで同じ検索をしたら、「糞」でこの資料を拾った理由がわかった。K-LIBの資料詳細画面で表示されていた「内容細目注記」には続きがあったのだ。しかし利用者用の画面にはこれしか表示されていなかった。

これは問題だと思う。なぜPを入れたらQが出たのかをわかりやすく見せるような配慮がぜひ必要だろう。もしそうでないなら、HELPにこうはっきりと書くべきだ。「職員用の画面にのみ表示される文字列も書名検索で拾います」、と。

これは富士通だけの責任ではないのかもしれない。よくわからないが、もしかしたら書誌データかウェブ製作会社の責任なのかもしれない。

しかし早稲田の WINE を使ってみて、こちらの方が絞り込みやすいと思った。WINEはどこの会社のシステムを使っているのだろうか。今検索したら本「システムは米国Innovative社製の図書館システム・ソフト、INNOPACを使っています」とのことだった。

| | コメント (0) | トラックバック (0)