[HOME] → [通信]

馬 鼠

検索エンジン{goo , yahoo , lycos , infonavi}でキーワード「馬 鼠」で検索すると、ロシア語のページが多量にヒットしてしまいます。

駄目なサーチエンジンのグループ

後ろの数字はヒット件数です。

検索エンジン 2000/7/13時点 2000/6/10時点 2000/3/15 2000/2/17 再検索のためのリンク
最初のロシア語ページの順位 最初のkoi8-r順位 ヒット件数 最初のロシア語ページの順位 ヒット件数 ヒット件数 ヒット件数
lycos 8 18 4063 12 4039   4326 ycosで馬と鼠を検索
goo ,yahoo 4 4 1844 4 1882 2112 12481 gooで馬と鼠
infonavi 27 27 886 6 874   1511 infonaviで馬と鼠を検索

困ると思うので、4つのサイトには、メールを出しておきました。(2000/2/17)gooとinfonaviから技術部に伝えるという返事があり、gooは何らかの対処をしたみたいで2/17の12481件から2112件に減っていました。でもまだロシア語が混じります。結局どれも、まだ直っていませんね。(2000/3/15)gooからサイト毎フィルタリングされるという目にあったので、このページが原因かと思って、このページの更新に来ました。2112件から1882件に下がっていましたが、4番目にロシア語のページが出てきます。Lycosも4326から4039件に減ったものの12番目にロシア語ページ。infonaviも1511件が874件に減ったものの6番目にロシア語のページ。(2000/6/8) gooは相変わらずロシア語以外のヒット件数が減少中です。(2000/7/13)

難しいことではないと思う理由は、マイクロソフトのIEでさえ、ロシア語のページはキリル文字を使ってちゃんと表示しているからです。つまり、これらのサイトの技術者はマイクロソフトの技術者以下の技術力の持ち主です。最大級の罵倒でしょう。

バグを取らずに、バグについて書いてある僕のサイトの1000件程のデータを丸ごと削除してしまった上で、gooの事務局から返事がきました。それによれば、1バイトカタカナのページを排除しないためにそういう仕様になっているということでした。つまり嘘が返ってきました。

(IEは自社専用の秘密のAPIを駆使するマイクロソフトの製品ですが。)IEが特別なことをやっているわけではありません。gooが日本語サイトとして並べるロシア語サイトのヘッダーには、"charset=koi8-r"と書いてあって、それを見れば、マイクロソフトのプログラマでさえもキリル文字だと分かるというだけのことです。

とりあえず、lycosとinfonaviもバグを取っていませんが、すくなくとも、報復してきたり嘘ついたりはしていません。

2000/6/9追記

3社ともなぜロシア語だけ? これまでは、たまたま僕が見つけたのがロシア語だけだと思っていたのですが、文字セットと言語の対応表に共通の誤りのあるプログラムをgoo lycos infonaviが共通して使っているということかも知れません。外注で外注先はすでに倒産とか?

2000/6/10追記

そういえば、最近、yahooの掲示板に3回も書き込めなかったのですが、文句を言ったら空いている時間に書き込んでくれと返事のメールが来ました。いつならOKなのかは書いてありません。書き込もうと思うのは読めるときですが、yahooの掲示板をまともに読めないこともたびたびです。きっと、技術スタッフにくだらない仕事ばかり与えて、まともな人がいなくなっているのでしょう。

日本には、技術力が評価できず、土日も休まず夜遅くまで働いてさえいれば、投資する類のベンチャーキャピタルしかいないので、技術力が低くて、まともに動作しないサイトを見て、非常に混雑していると勘違いしてくれるに違いありません。

PS2の予約を行うサイトが、混雑でダウンしたり、購入者の情報が漏れてしまったりした(僕もその被害者の一人です。)のを捕らえて、IBMではなくSunに発注していればそんなことにはならなかったとサンでは言っているというニュースがありましたが、SCEIは、IBMに頼んだおかげで、3度も余分にニュースになって喜んでいるのかも知れません。それと同じように、ロシア語のサイトが混じってしまうプログラムのおかげで、検索時のヒット件数がライバルより増えて、より網羅性が高いかのように錯覚してもらえる効果で、技術が低い方が有利に作用しているのかも知れません。

以下はOKだったグループ

サーチエンジン ヒット数 検索し直しのためのリンク
raging Altavista 6966 Raging Search - Results for +馬 +鼠
AltaVista - Web Results
excite 1538 Excite エキサイト サーチ結果 馬 AND 鼠
OCNnavi 797 OCN navi -NTT DIRECTORY-
netplaza 598 「NETPLAZA」データ検索結果
ODIN 279  
fresheye 81 フレッシュアイ
infoseek 17 インフォシーク 馬 鼠
MSN 17 MSN サーチ - 馬 鼠
Mondou 2 Search Results
Ringring 0 馬鼠

インターネット上には、技術重視のサイトとマーケット重視のサイトがありますが、こういう細かいところに差が出てしまうわけですね。それにしても、and検索だとこれだけ差がついてしまうとは思いませんでした。これはこれで別の問題だと思います。

検索デスク では、Ringringやinfoseekが検索力上位に来るわけですが、and検索では、Altavistaと2桁以上違っては役に立たないと評価すべきなのではないでしょうか? CPUパワーの差が如実に現れているという感じではないかと思います。多くのページを覚えていても、思い出せなければ無意味です。

rinringが1文字キーワードがあると0件になってしまうという問題は現在はなくなっていました。

2000/7/19

関連ページ

3語の積で調査続行
6語の積
ロボット型検索エンジン総合評価結果
goo関連の話題
検索エンジンの評価方法について
Unicodeについてのアスキーの記事 

2004/01/31更新

通信ディレクトリ目次

Google
Web www.PAG1U.net

関連ディレクトリ

発明

個人情報

PC

関連サイト

matsuokahajimeのアンテナ

matsuokahajimeの日記

乱雑な本棚:反グローパリズム

 

 
 
 
 
 
 
 
 
 
 
seo

外部リンク

毎日新聞問題の情報集積wiki - この問題をとりあげたメディア(時系列順) 東京のキー局はそろって沈黙

 

HOME ネットワークディレクトリ (C)松岡肇