IT大生、洋楽和訳とプログラミング

これからのIT時代を生き抜くブログ。

AIの強化学習(教師なし)のGAN, モード崩壊とは?

いちばんやさしいAI入門を読みまして、AIを用いて研究をしている方とお話しする機会がありました。そこで「モード崩壊」という言葉を聞きました。

ブログでご紹介した通り、専門用語は使っていないのですなわち専門用語は全く習得していないということです。そこで、二つの単語について調べてみました。

 

モード崩壊(mode collapse)とは

 

そこで、色々調べてみたところ、このようなサイトがありました。

tech.preferred.jp

そして、モード崩壊について次のように書かれています。

生成器 (generator) が似たようなデータしか出力しなくなるという、モード崩壊 (mode collapse) と呼ばれる現象が起きやすいことがよく知られています [3]。モード崩壊は、最適化の用語でいえば、モデルパラメータが悪い局所解にはまっている状態であるといえます。 

「モード」は統計学で出てくる「最頻値」という意味。

つまり、AIで「様々なデータを作ってほしい」のに、「似たデータばかりを出力してしまう」現象のことなのです。

 

画像の例で言えば、犬のデータを学習させてあげて、トイプードルやチワワやブルドッグなどのいろんな種類の犬を出力して欲しいのに、チワワの画像ばっかり出してしまう現象だと言えます。

 

犬という幅広いジャンルでランダムで画像を出す目的なのに、コンピュータさんが犬といえばチワワしか勝たん!と狭いジャンルにハマってしまうことを指しているわけですね。

 

 

画像を作る「GAN」とは?

2014年にイアン・グッドフェローらによって発表された教師なし学習で使用される人工知能アルゴリズムの一種(Wikipedia

 

GANの学習をベースに説明されていますが、そもそもGANとは何か。

日本語では敵対的生成ネットワークというそうです。英語での正式名称は「Generative Adversarial Network」です。

 

これによって自然な画質の良い画像が作れるそうです。画像を作るためのアルゴリズムの一種と覚えておけば問題なさそうです。

 

 

 

 

いかがでしたでしょうか?まだまだ知らないことだらけですが一つずつ勉強していきたいと思います。