[ トップページ ]
Web とインターネット:Web 検索とその応用, 数学・計算・情報学・プログラミング:検索・抽出・組織化

軸づけ検索と項目タイトル

私が以前研究していた 「軸づけ検索」 は,最近はときどきみかける結果を年表のかたちにする検索の一種を実現していた. 検索の単位は文ないしそれより細粒度の単位 (句点のあいだなど) だったが,検索結果を表示するときにはまず文章のタイトルを表示していた. ところが,最近あるひとから,タイトルが先頭ちかくにあるのはじゃまだという意見をきいた. これは目からウロコの意見だった.

軸づけ検索の研究をしているとき,検索対象としては百科事典や新聞をかんがえていた (実験していた). 百科事典であればテキストは項目単位になっているし,新聞記事であれば記事単位になっていて,いずれもタイトルがある. 項目単位の検索では,結果を表示するときにタイトルを先頭にもってくるのは当然のことである. タイトルがその項目を代表しているはずだからである.

しかし,もっと細粒度で検索するとき,タイトルが検索結果を代表しているとはかぎらない. 世界大百科事典のおおくの項目や新聞記事のように比較的ながい文章は,その一部をとってみると,タイトルにはあらわれていない内容でありうるからだ. それなのにタイトルがめだつように先頭ちかくに配置されているのはじゃまだということだろう.

私自身が検索単位を文にしたりそれよりこまかくしたりしたのに,結果を表示するときにはあいかわらず項目にとらわれていたことになる. 細粒度検索をこころみるつぎの機会には,この経験をいかしたいとおもっている.

キーワード: テキスト検索, テキストサーチ, 軸づけ検索, 軸付け検索, 百科事典検索

トラックバック

このエントリーのトラックバックURL:
http://www.kanadas.com/mt/mt-tb.cgi/4195

コメントを投稿

Google でブログを検索:

メインページアーカイブページも見てください.
Creative Commons License
このブログはつぎのライセンスで保護されています. クリエイティブ・コモンズ・ライセンス.
Powered by
Movable Type