[ トップページ ]
言語・コミュニケーションとネットワーキング:新聞・マスコミ・ジャーナリズム, 数学・計算・情報学・プログラミング:検索・抽出・組織化

半導体の歴史を知るための新聞検索

私は 1998 年ころ 「軸づけ検索」 という検索法を研究していた. 軸づけ検索の公開されたサービス (「ネットで百科」) では世界大百科事典だけが検索できた. しかし,プロトタイプにおいては,研究用に使用することができた毎日新聞の記事検索もためすことができた. 「軸づけ検索法 -- 文書からの抜粋を抽出・整理して出力する全文検索法」 という論文で使用した例をつかって,毎日新聞の記事から半導体の歴史を知る検索例を紹介したい.

新聞はニュースを知るためのものであるから,本来,歴史を知るのには適していないとかんがえるべきだろう. しかし,特定の視点で書かれた歴史書とくらべると,ふるい新聞はよりナマの歴史情報を提供してくれるということがいえるだろう. ここでは使用許諾や開発時間の関係で 1995 年の 1 年分の毎日新聞だけを使用して,半導体の歴史に関する検索をこころみている (1 年分だけなので,ナマの情報はほとんどない).

ここでは上記の 1 年分の新聞だけから半導体に関する年表をつくっている. すなわち,年代を軸とする軸づけ検索において,検索語として 「半導体」 を指定している. それによって,つぎのような検索結果がえられた.

newspaper_search.jpg

上図に表示された範囲では,まず 1947 年にベル電話研究所においてトランジスタが発明されたことが検索されている. これは 「[特集] マルチメディアの未来 / 1」 というかこみ記事にふくまれている情報である. 3 番めの項目は 1962 年に可視光の半導体レーザが開発されたことを記述している. この記事を右下のウィンドウでひらいている. ひとつの文のなかに 「1962 年」 という年と 「半導体」 という検索語の両方があらわれていることがわかる.

このように,わずか 1 年分の新聞記事からも,それなりにおもしろい検索ができることがわかる. 新聞記事が長期にわたって蓄積されたデータベースを使用すれば,さらにおもしろい検索ができるだろう.

関連項目:

キーワード: テキスト検索, テキストサーチ, 軸づけ検索, 軸付け検索, 百科事典検索, 情報抽出, 情報組織化, 検索結果組織化, 組織化検索, 整列, 検索結果構造化, 構造化検索

トラックバック

このエントリーのトラックバックURL:
http://www.kanadas.com/mt/mt-tb.cgi/3411

コメントを投稿

Google でブログを検索:

メインページアーカイブページも見てください.
Creative Commons License
このブログはつぎのライセンスで保護されています. クリエイティブ・コモンズ・ライセンス.
Powered by
Movable Type