日経産業新聞2004年9月7日に掲載されたコラムです。
マイクロソフトがAsk MSRという開発プロジェクトを進めている。MSRはMicrosoft Research(マイクロソフト研究所)の略で、マイクロソフトらしい直球の名前だ。「マリリンモンローはいつ生まれたのか?」といった自然文をインプットすると、インターネット上から答えを探してくる検索ツールである。
Ask MSRはこんな仕組みになっている。
1) まず、元の文章を分解し、その中の言葉を組み合わせていろいろな構文を作ってみる。機械的に行うので、間違った構文ももちろん誕生するが、「マリリンモンローが生まれたのは」という正しい構文も中には生成される。
2) 全ての構文で、インターネット上を検索する。
3) いろいろな検索結果が返ってくるが、間違った構文を含むページは少ないので、この時点で間違った構文は消えるので問題ない。また、正しい構文でも間違った記述をしたページが検索されてしまうこともある。しかし、インターネット全体を見れば、より数多くあるのは正しい答えのほう。よって「マリリンモンローが生まれたのは1926年」という正解が検索結果の上に表示される。
マイクロソフトの開発者は、「検索結果の上位3位に正解がある確率は75%」としている。試しにGoogleで「Marilyn Monroe born」という三つのキーワードで検索してみると、上位には正しい答えが記されたページが並ぶので、確かにAsk MSRは機能するだろう。
これまでも「自然文検索に正しい答えができるようにしよう」という試みはたくさんあったが、それは人工知能を利用するものだった。そして、通常その答えの源泉は、注意深く作り上げたデータベースだった。ところが、Ask MSRが利用するのは「インターネット上に圧倒的多数の人々が作り上げた知識倉庫」である。つまり、「インターネット上には、世界中の大勢の人たちが情報を掲載している。ただ、そのほとんどは無名の人たちによるものだし、真偽のほども定かではない。しかしその量の膨大さから、全体としてみれば、より正しく有益な情報が浮かび上がってくる」という事実の活用だ。
最近では、ごく普通の個人でも簡単にインターネット上に自分のホームページを持つことが可能になった。中でも毎日のようにさまざまな出来事を書きとめるものはブログと呼ばれるが、ブログはその作成の簡単さもあって、爆発的に増加しており、私自身も2年近く続けている。私のブログでは読んだ人は誰でも自由にコメントが追加できる仕組みになっているのだが、いつも感心するのは、どんな質問を投げかけても、必ずといっていいほど誰かが答えを返してくれることだ。また、私が書いた内容に関する興味深い情報を教えてくれる人もいる。
IT関連で著名なコラムニストのダン・ギルモアもブログを持っているが、彼は昨年、自身の書く本の骨子をブログで公開、さまざまな人からのフィードバックを受けた上で最終稿に持ち込むという手法で執筆中。「インターネットを始めとした新たなメディアの誕生でいかにジャーナリズムが変わりつつあるか」がテーマで、うち一章はインターネットを利用した本の執筆プロセスそのものに割かれる予定だ。
どれほどの専門家であっても、個人が知ることのできる量には限界がある。そしてインターネットの向こう側には、たとえ個々の知識は断片的であっても、全体としては壮大な知識が広がっている。Ask MSRはこの新たな知識の海を活用する試みとして注目に値するだろう。
以前にシソーラス検索で人別にネット上で辞書を持って、自分の嗜好に合った検索ができるようになればいいなぁと思ったことがありました。ご紹介の検索ツールはそれをもっと高度化したものですね。マスからone to oneの方向に流れてゆくんですね。
いいねいいね
いつも拝見しています。とても勉強になっています。
さて、私も似たような研究はしているのですが、個人的に一番欲しいのは、略歴情報だったりします。人名と略歴と検索エンジンに入れても、まず必要な情報にたどり着けません。ネットには確かに膨大な情報が山積していますが、偏りがありますね。
いいねいいね
MSR
情熱起業列島で面白いと紹介されていたblogを読んだ。 # 偶然だけど、上記blogの持ち主もmckinsey経験者のようだ。 ## 1つ前の記事参照 話が逸れてしまったが、MSR。かのDoxBox様がご在籍です�…
いいねいいね
cocoon-san
サーチのパーソナライズはAmazonもGoogleもいろいろ試しているので、もっと良いものはできていくるのではないでしょうか。(必ず、プライバシーとの兼ね合いが問題にはなりますが・・・・)
kenny-san
略歴ですか・・・どこかで働いていたことがある、という情報は入手できることはありますね。でも、確かにそれをまとめて時系列にするのは難しいですね。
なお、私自身で検索してみたところ
「渡辺千賀」「略歴」では出てきませんでしたが、単に「渡辺千賀」だったら、いくつか略歴が出てきました。なので、人には寄りますが、調べようはあるかもい知れませんね。
また、ネット情報の情報は偏りがあるのに加え、間違っていることもあります。たとえば、9-11はCIAの・アメリカ国家の・FBIの陰謀だった、といった説はあまたあります。9-11に限らずこの手の「XXの陰謀」説、はあちこちに流布していますが、これはまず99・999%嘘ですし。このあたりの判断を行うのは、最後は自分、ということなのでしょうか。
いいねいいね
[web][essay]完璧な検索/検索の現在
http://blog.japan.cnet.com/watanabe/archives/001622.html 以前,機会があって整理した事がありますが,僕の考えではこんな感じになりました.名前 …
いいねいいね
�ηä������夬��
�ʻ��ϥ��������ʤΤǰ��ֺǽ��Υ�����������Ƥޤ����˵�ư���Υ��������ˡ��֥ߥΥե�����γ�ҡפȤ����Ͷ���γ�Ҥ��ФƤ��ޤ����ߥΥե�����γ�Ҥ����ۤ��줿���֤Ǥϡ��Ļ������ʳ����ż��Ȥ��������ʤ����Ȥ������ꡣ ���¤α������֤Ǥ����ȤǤϤ뤫�ޤǤ…
いいねいいね
「縁尋奇妙」時代のコミュニケーション戦略
久米繊維工業の久米信行社長の本「メール道」(NTT出版)の出版パーティーがあった
いいねいいね
グーグルニュースの曼荼羅あるいは神学
グーグルニュースの日本版のサービスが先週から始まっている。 日本の主要マスコミ
いいねいいね
お久しぶりです。毎回、楽しみに記事を拝見しています。
お書きになったテーマに関連していると思われる小生のブログのエントリー記事をTBさせていただきました。
いいねいいね
こんにちは、はじめまして。
最近渡辺さまのサイトに辿り着き、興味津々にアーカイブを拝見しています(片っ端から読んでいます。もっと早くに発見していたかったです。)
本題とはズレますがコメント欄のネット情報の偏りの例として挙げられていた9/11テロのご意見がひっかかりました。
9/11事件の際にはわたしもアメリカ留学中だったのですが、Conspiracy Theories が99.9%嘘っぱちと切り捨てられるような感じはしませんでした。WTC崩壊はじめ、素人目にも不思議な、異様な事が一杯でした。
このエントリーから4年ほどたっていますが。。。
いいねいいね
chikaです。
アーカイブ読破、お疲れさまですw
conspiracy theaoryは、9/11に限らず、またアメリカ関連に限らず、私は信じられないんですよね。
「誰かを雇って暗殺させる」「何かが起こる危険があるのを見て見ぬ振りをし、何かが偶発的に起こる可能性を高める」位の「陰謀」はあると思うのですが、二段階以上のステップが必要な複雑な陰謀は、それを遂行する能力が人間の組織にはないと思うのでした。
つまり「陰謀を起こす悪意の存在」は信じるが、「複雑な陰謀を実施する能力」の方を信じてないという・・・。
いいねいいね
Chikaさん、
昔のエントリーへのコメントでしたのに、お返事ありがとうございます。
私はつい複数形にしてしまいましたが、Conspiracy theoryを遂行する能力の存在に疑問がある、という点、よくわかります。
それでも、『同方向性の目的を持った緩やかな繋がりを持つ特定の人間たちが、ベクトルを、ある一定方向に向けると言う曖昧な目的のもと、その繋がりに関わる者に利が生じる様に動く』だけでも、それなりの権利や政治力を持つ知識集団が関わり、動くと、かなり色々な事が出来そうで、権威や実権に遠い位置にいる一個人としては恐ろしく感じるばかりです。
9/11に限定しますと、こういう
http://www.youtube.com/watch?v=q8XToX7aSdg
のも出ています。
こういうのを見てもEngineering 知識皆無のわたしには理論的に賛成も反対も何も無く、歯がゆいですが、幾分か『漠然と感じていた不自然さ』が専門家によって説明されスッキリはします。
(プロフィールに大学でのご専門が都市工学とありましたので)ちかさんなら、もっと専門的な目でご覧になるかと思います。
どのエントリーもとても楽しませて頂いています。
ありがとうございます。
いいねいいね