 | gooでは、HTTP1.0で読めるところしかロボットが収集しないということが最近わかりました。
 | gooに問い合わせてもちゃんと反応が返ってこずに、わかるのにかなり時間がかかりました。 |
|
 | .comや.net,.orgなどを収集範囲にしていないロボットもいます。
 | kensaku.orgが当初は、jpドメインに限っていたと思います。他の検索エンジンでも.comや.orgのサイトでトップページしか収録されていないサイトというのは散見します。 |
|
 | fresheyeとかでは古いページは検索できません。
 | 僕のサイトでは、トップページに最近2,3日の間に更新したページを自動的に表示するようにしています。この期間をもう少し長くしようと思っているのですが。 |
|
 | jpeg画像だけで、説明がついていないと検索エンジンでは見つかりません。 |
 | 目次のページを作る
 | とりあえず、FrontPage98を使っているので、自動生成目次がありますが、最新バージョンでは知りませんが、僕が使っているバージョンではディレクトリ内のページ数が増えると極端に遅くなるという問題があって、ディレクトリを分けているのですが、そうすると、全ディレクトリの目次は作れないのでした。 |
|
 | サイト内でのリンクが切れていると収集されません。
 | FrontPage98では、ナビゲーションバーがほぼ自動でできるのでこれはこれで良いかと思っています。 |
 | ページを移動した時などにも、移動先へのリンクを付けています。それでも切れがちですが。 |
 | フレーム内のページにいきなりやってくると、フレームのページにジャンプするという仕組みがあるサイトもありますが、最近はフレームは不評みたいですね。 |
|
 | サイト内でのリンクが深すぎると普通は収集されません。
 | 昔のトップページはディレクトリへの数個のリンクがあるだけだったりしたのですが、200程のリンクのあるサイトマップを持ってくることでアクセスが増えた気がします。 |
 | gooはなぜだか数十万レベルまで掘り下げていましたが。 |
|
 | 多くのページがあるサイトが優遇されている傾向があります。
 | gooでは100ページと、100の被リンクが、マイルストーンになっているようです。 |
|
 | 多くのサイトからリンクされるようにする
 | pag1シリーズの使用許諾条件に、pag1シリーズで減色した画像を含むサイトからはリンクを張ってもらうというのを入れたので初期には有効だったと思います。 |
 | あとは、掲示板への書き込み時にURLを入れておくくらいでしょうか。 |
|
 | アクセスの多いページからサイト内の他のページへのリンクを増やす
 | でも、これをやると検索エンジン内の蓄積が消える場合もあるみたいで、検索結果で上位に来なくなることもあります。 |
|
 | 検索エンジンへリンクを張る
 | gooだけかも知れませんが、gooへのリンクが多く見つかるということは、gooへリンクを張っているサイトを優遇しているということだと思います。 |
|
 | リンクフリーにする
 | WWWを作った人が、WWWとはそういうものだと言っているということなので、リンクをトップページに限るとか、書面で許可を得てからとかいうサイトは無くなって行くのでしょう。 |
 | フレームを使っていると、ついうっかり、他人のサイトをフレーム内で表示してしまうことがあって、これが冷や汗ものです。フレームは使わない方向に向かっているということなので、そうしようと思っています。 |
|
 | コンピュータ(あるいは自動車)関係の話題を入れる
 | 垂直型の検索エンジンを自動的に作る意味の空間の構造化と画像理解を前提とした検索エンジンの企画を、IPAの未踏ソフトウェアに応募したのですが落選しました。 |
 | 現在ではまだまだ、コンピュータや車に関するページが多く、そういうページ間のリンクは多くなるものの他の分野のページは少ないので、そういうページは、コンピュータなどのページに埋もれがちだと思います。とりあえず、コンピュータ関係の話題も載せて、そういうリンク経由で別の話題にロボットがたどり着くという経路も用意した方が有利だと思います。 |
|