2010/11/28

ブログペット終了についての個人的読解

何故、ブログペットが終了するのか。私なりの読解をこれから書きたいと思います。

まずは、次のサイトを読みました。
http://futuremix.org/2010/11/blogpet-close
上記サイトを読み、何故ブログペットを終了するのか、納得はできませんが理解の助けにはなりました。ブログペット開発者とお知り合いの方のようです。

「Chasen を用いた形態素解析と、マルコフ連鎖を用いたアルゴリズム」で動いていると書かれています。

私個人的には、茶筅(ChaSen)に引っかかりました。これは奈良先端科学技術大学院大学で開発されたツールです。私は2002~3年あたりにかけて実際、使った事がありました。日本語を形態素解析してくれるのですが、要するに、品詞・活用・文節などで日本語の文章をバラバラにしてくれます。

私の場合は、とある文章を形態素解析し、頻出する単語を抜き出し、分析する仕事をしていました。しかし、最後の方では、茶筅の開発が止まった事もあり、自分の脳ミソと感でフリーアンサーの内容を詳細分類していましたけれど...苦笑。例えば、アンケートなどで1万件の自由回等があるとすると、だいたいの内容を分類集計するのに数時間~1日で完了できるまでに「私が発達」してしまいました。

それは良いとして、そういう形態素解析は茶筅以外にも自社開発ツールなどあるでしょうが(データ分析系の会社なら開発関係にはいくつか使用するものがあると思います)、当時は茶筅が一番使い勝手が良かったのは確かです。それが、今簡単に調べた限りでは、数年前で開発は終わっているようです。或いは、これ以上開発する必要がないのかもしれません。そして今度は、その茶筅で分解した日本語をマルコフ連鎖というアルゴリズムで繋げたものを、ブログペットが排出していた訳です。マルコフ連鎖は、数学の確率論を文章に応用したものと考えても良いでしょう。簡単に言うと「バラバラにした接頭語から次に繋げられる接尾語を選択してゆく作業を繰り返」して、文章らしきものが出来上がります。比較的単純なアルゴリズムです。現在の選択から未来の状態が決まります。皆さんのブログ内の文章や言葉(ある意味有限と言える材料)から日本語を細かく取り出し、過去に書いた日本語(これも形態素解析でバラバラにされているもの)の中からある一定の文法法則に従って、無作為に選択して繋げる。他のブログや他の辞書機能などから材料を持ってくる事がないので、同じ単語が繰り返し出てくる可能性が高いですし、よもや自分のブログで使っていない日本語が出てくる事はありません。

おおむね、間違っていないと思いますが、私はブログペットの開発者ではないので、この方法が採用されているのかどうかは不確かです。あくまで推測の域を出ませんが、この方法ですと、まず、茶筅が今のところ大きな開発がなされていないのと、マルコフ連鎖では個々のブログペット内で辞書蓄積ができないのではないだろうか、というところで、ブログペットはこれ以上進化もしないですし、終了の時期を迎えたのだとも考えられます。

更に、ブログペットは「人工無脳」がコンセプトでした。人工無脳についてはブログペット以外にも様々な開発があります。ブログペットは手動ではなく自動的に単語選択をして文脈性の高い文章を生成するものでした。

現在は人工知能への過渡期なのだと思います。生まれる技術がある一方で、消えてゆく消される退化する変化を加えられる技術も沢山あります。そういう中にブログペットがあったのではないでしょうか。


0 件のコメント:

コメントを投稿