グラデーション近似機能付きベクトル化ツールの研究開発

通信・放送機構(TAO)の助成金が出ることになった( TAOのプレスリリース中のこのページにあります。先進技術型研究開発助成金の交付決定) ので、グラデーション近似機能付きのベクトル化ツールを2月いっぱいを目処に現在開発中だったのですが、締め切りをすぎて完成していません。

1998/12/30 ベクトル化も、従来の方法ではなく独自の方法で行おうとしているので、余分に考え込んでいます。しかし、そうしないと、人間の視覚に近い処理になりません。
1999/1/3 アルゴリズムを練ってばかりでは間に合わないし、細部にはまり込んでしまうので、とりあえず、前後関係の判別の部分のコーディングを始めます。ここでは、有向グラフの最適表示問題を考えていた時のアルゴリズムがそのまま使えます。書く前の予想としては、新たな関数を3つくらいでコードの増加量は5KB程度かと思います。
1999/1/7 結局また動画の場合の圧縮率を上げることや、凹の部分を含む図形を姑息な手段でなく効率良く扱うためのアルゴリズムを考えていて、コーディングにかかっていません。
1999/3/1 近況を書いていませんでした。2/10に実地検査があって、遅れを再確認して、さらに、提出書類も予定より多いことがわかってあせりました。それでもプログラム自体は2月いっぱいにできるつもりだったのですが、ついに間に合いませんでした。かなり仕様を限定して、「人間の視覚に近くない」とかいうこだわりは、画像理解のシステムを作るときに伸ばしてしまって、とりあえず、僕らしいアルゴリズムを使っているという範囲のこだわりにとどめてベクトル化(トレース)部分のコーディングを始めたのですが、1日に20KBペースくらいで書けるかというと、全然そうではなくて、赤ちゃんがいるので、コーディングのスピードが遅くて、間に合いませんでした。とりあえず次の目処は3/15です。
1999/4/13 3/15の時点でも、コーディングは間に合いませんでした。3月末までにはなんとかなりそうに思ったのですが、前後関係の判定のアルゴリズムに問題があって、考え直し始めたのでさらに延びてしまいました。必要なデータを前の段階で過剰に捨てていた間違いに気づいて、現在もコーディング中です。4月中には動くようにして、5月には3件くらい特許出願しておきたいと思っています。
1999/5/6 ほんとうならコーディングが終わっているはずなのですが、サーバーの入れ替えなど、後回しにしてきた雑用を片づけているうちに時間が経ってしまってまだできていません。前後関係の判定と同じアルゴリズムを、意味の空間を構造化するのに使えそうだと思っています。
1999/5/26 出願が終わっているはずなのですが、ISDNでの出願のための申し込みなどの手続きもまだです。ほんの少し前までパトリスの300ボーとかの世界だったと思うので、進歩した物です。 それはともかく、書類を書き始めると、まだ時間は数倍かかるけれど、パラメーターを減らすことができるアイデアとか、3件程まだ実験しなければならないことが出てきてしまって、さらに遅れそうです。
1999/6/14 出願前に実験しないとならないといっていた1つめのアイデアで以前の方法の問題点に気づきました。Flashには、平行なグラデーションと放射状 (用語はそうなっているのですが、同心円状に同じ色が来ます。) のグラデーションしかないので、それに囚われすぎていました。とりあえず、結果としてグラデーション数当たりの画質は変化しないのですが、余分な境界線がさらに減ります。
1999/8/13 出願すべきことは増えているものの、出願しても権利確保できずに、真似されるだけという気がしたりして、細かいプログラムをいじっていたり、Webサイトのの更新をしていたりで、あまり進んでいません。

8/5に児島君淳心学院無線部が、テクスチャー抽出のコンテストPattern Recognition-Media Understanding Society Algorithm Contest 99 Pageが行われているのを教えてくれたので、ついつい考えていたのですが、昨年末くらいからまとまらずに、行き止まりになっていた境界線を辿る従来の方法ではない独自の方法がやっとまとまって、このコンテストの問題も、ベクトル化の残りの部分もこの方法でうまくいきそうです。このコンテストではソースを出さないとならないので、出願していたら間に合わないので、コンテストには出せませんが、これまで、別々の問題として考えていた{ベクトル量子化圧縮の圧縮率をあげる問題、双峰性の分布で局所解に陥らない方法、境界線を辿らない方法}などの複数のアイデアが1つにまとまって、すっきりしました。

99/11/29 ベクトル化のための部分と、オブジェクトの検索の部分と、目的によって、異なる部分を減らして、共通点を増やそうと考えていたのですが、複数のカメラを使って3Dを復元するという問題は、時間のずれのない画像が得られるので、普通のビデオから3Dを復元するという問題より簡単なので、それも考慮しようかなと思ったりしています。

というのは、「日経サイエンス」1999/12に、コンピュータビジョンによる自動操縦でアメリカを横断したという人が、2050年までを見通す記事を書いていました。普通のコンピュータが人並みの処理能力を超える時点をそれくらいに想定してロボットの進化の具合を予想しているわけです。でも、ノイマンの2001年には画像理解が実用になっているはずという予想からは遅れています。

2000/1/5 ディザーをかけるソフトやペイントソフトなどで人工的にできてしまった繰り返しテクスチャーを自然画像のテクスチャーと同様に扱いなおかつ、人工的なものについては誤差無しで扱えるようにする方法を考えていて、ほぼまとまったのですが、それを考えている内に、すでにかなり昔に思いついていたテクスチャーによる領域分割の方法を忘れてしまっていて、「あれ?」とか思い始めていました。「テクスチャー解析」で検索すると例によって、ニューラルネットとか遺伝的アルゴリズムを使った遅そうなアルゴリズムが出てくるので、ここが侵略すべき領地であることが分かります。
2000/3/3 オブジェクト化の入り口部分だけ出願していたのが公開されている時期だということを思い出して、愕然としています。この前、電車の中で目に入った画像を、僕のアルゴリズムでうまく処理できないことに気づいて、しばらく止まってしまっていました。前の時みたいに、実はもう一手間かけるだけで大丈夫なのかも知れません。その間、Webのメンテナンスをしていたのですが、全く別のアイデアはでませんでした。例えば、既存のアルゴリズムより良いのがあるはずだと思い込んでいる部分があって、既存のアルゴリズムを試してみることさえ無駄手間だと考えてしまっています。焼きなましのアルゴリズムに例えて言えば、良いアルゴリズムに対する欲求水準が高すぎて、現実的にはかなり良いアルゴリズムのそばにいても、ロングジャンプをして遠ざかってしまうみたいです。そろそろ、無関係な失敗作みたいなのからリリースを始めて3ヶ月後くらいには、シェアウェアであれば、気の早い人が送金をするくらいの完成度にしたいのですが。
2000/5/18 かなり遅れているのに最近になっても、まだ新しいアイデアが出てきてしまいます。かなり複雑なものになっているので、1つの新しいアイデアが全体と矛盾無く存在しうるかの検討だけで1週間くらい費やしてしまいます。駄目という結論になりそうになっても以前に捨てた別のアイデアと組み合わせると大丈夫かも知れないとかいう無数の可能性があるわけです。バベッジの解析エンジンが完成しなかったのは技術的に無理があっただけではなくて、途中で仕様変更を繰り返しすぎたせいだったみたいですし、エジソンの会社がレコードでビクター社に遅れをとったのも、広告費だけではなく、大量生産が始まってからも仕様変更を繰り返していたせいみたいです。現在では以前にMMCAに応募した究極のと言っていた企画よりさらに複雑なものになっています。
2000/6/24 「bit」と「Cマガジン」の2000/7号で、ベクトル量子化の記事が出ていて、僕のアイデアの方が良いと思っていても、実物がないので、困ってしまいます。かなり以前に、作りかけて放置しているのでした。当時、TV電話サービスを企画していた会社に画像圧縮ソフトの需要がありそうだということで、大阪まで行って説明したことがあります。その時の様子は、たまたまその会社を取材していたNHKBSでちらっと放送されたのでした。という様なわけで、新製品に取り込めないアイデアを中心にVQのプログラムを書こうと思っています。その分、新製品がさらに遅れます。
ベクトル量子化圧縮フレーム
Cマガジンのベクトル量子化についての記事
2000/12/5 gooで検索できなくなったのをきっかけにまた意味空間の構造化や画像理解などの検索エンジン関係のことを考えて、しばらくFlash関係のことから離れていました。

11月末からまたコーディングを再開しています。オプション的な部分や、オブジェクト化や画像理解関連の部分のスケジュールを後にまわすなどしています。98年の段階でコーディングできた部分でまだコーディングしていない部分があったことにあらためて気づいています。

「インタフェース2001/1」のフジワラヒロタツの現場検証では、仕様を練りに練ってからコーディングにかかる人がいるが、コーディングの効率は上がるだろうけれど、その人が途中で死んだらどうするつもりなのだろう? と書いてあったり、「ワインバーグのシステム変革法」には、バグあり段階でも出荷すべきみたいな、一見するとマイクロソフトを追認するみたいな意見が載っていたりしたせいです。

ワインバーグは、大きな企業にとっては二番煎じ戦略が最善で、小さな企業にとっては欲張ったリスキーな企画が最善と言っている部分もあるので、つまり、コンサルタントを雇うほどの余裕がある大きな企業にとって、二番煎じ戦略が向いていて、二番煎じ戦略をとっている人にとっては、出荷を早めることに最も意味があるという風に、限定すべきだと思います。
先進的な製品の場合、早く出しすぎれば、市場が成熟していなくて、理解されず受け入れられません。極端な例として画家のゴッホを思い出せば簡単でしょう。
二番煎じ戦略が意味を持つのも、市場がある程度成長してから進出することのメリットがあるからでしょう。(3番手になるともう駄目なので急がなければなりません。)

最近のJMMで、三ツ谷誠氏が「醜い自我肥大」と書いているのですが、銀行の人がこういうことを書いていると、バブル崩壊で銀行なのにお金が無くなってなかなか融資したり投資したりできなくなっていて、本来なら投資すべきなのに、「醜い自我肥大」と切り捨てなければしょうがないという状況の反映なのではないかと思ってしまいます。第三次ベンチャーブームと言われながら以前と違って掛け声だけで実際には起業が増えていないという統計の説明として、銀行のせいというのが最近TVで出てきていたので。

関係ありませんが、ベクトル化とベクトル量子化圧縮は、別のものです。

以前からあるページ

幕張メッセのイベントの時に、説明のために会場で作ったページ
Flashフォーマットに変換するツールの市場性と、差別化要因について
意味の空間

04/01/31更新

 (C)MATSUOKA , Hajime

[HOME][グラデーション近似]