「AIが生成したデータ」をAIが学習するとどうなる? / Credit:Canva,ナゾロジー編集
画像生成AIモデルは、膨大なサンプルから学習し、新たな画像を生み出します。
その結果、今やネット上にはAI画像があふれています。
では、AIモデルが、知らず知らずのうちにAI画像を取り入れて学習するようになると、どうなるのでしょうか。
アメリカのライス大学(Rice University)に所属するリチャード・G・バラニューク氏ら研究チームは、生成AIモデルが合成データを学習して新たな合成データを生成するループが生じると、生成される合成データの品質はどんどん劣化していくと報告しました。
研究チームは、こうした状況を狂牛病(ウシにウシの肉骨粉をエサとして与える行為で蔓延した疾患)になぞらえています。
そして現在、静かに「AI狂牛病」が広がっているかもしれません。
この研究は2024年5月オーストリア・ウィーンで開催された深層学習分野の国際会議「ICLR 2024」で発表されていて、論文はプレプリントサーバーarXivに公開されています。
目次
ウシがウシを食べて広がる「狂牛病」次世代AIモデルの開発における課題AIが生成したものをAIが取り込んで劣化していく「AI狂牛病」
ウシがウシを食べて広がる「狂牛病」
ウシがウシを食べることで狂牛病が蔓延した / Credit:Canva
一時期、狂牛病(正式名称は「牛海綿状脳症」)が大きな話題を呼びました。
これは1986年、イギリスで最初に報告されたウシの病気であり、狂牛病にかかったウシは、脳の中に空洞ができてスポンジ状になります。
潜伏期間は数カ月から数年であり、発症後は、異常行動・運動失調(群れから離れたりけいれんを起こしたりする)などの神経症状を示し、2週間~半年で死に至ります。
この狂牛病が蔓延した原因は、簡単に言うと、「ウシがウシを食べること」でした。
そもそも狂牛病は、健康なウシも持っている「プリオン」というタンパク質が異常化したものによって生じたと考えられています。
そして狂牛病のウシを原料とした肉骨粉を、他のウシにエサとして与えたことで多くのウシが狂牛病に感染しました。
世界ではこれまでに19万頭あまり(うちイギリスで約18万5000頭)の狂牛病のウシが見つかっています。
そして現在、全く分野の異なるAIの世界で、狂牛病に似た恐ろしい現象が生じ始めています。
(広告の後にも続きます)
次世代AIモデルの開発における課題
生成AIモデルは、既存のサンプルから学習して、新たな合成データを生み出すことができます。
例えば、様々な人間の顔写真でトレーニングした生成AIモデルは、実在しない人間の顔の画像を新たに作成することができます。
最近ではAIの性能が高まっているため、AI画像と本物の写真を見分けることは容易ではありません。
また、ネット上には様々なAI画像があふれるようになりました。
ネット上にはAI画像があふれている / Credit:Canva
しかしライス大学の研究によると、この状況は次世代のAIモデルを開発する際、大きな問題を引き起こす恐れがあります。
新しいAIモデルを開発し、トレーニングするためには膨大な量のオリジナルデータが必要であるため、開発者たちはその供給に難儀することになります。
そのため、次世代AIモデルのトレーニングでは意図的に、AI生成データが使用されたり、ネット上の情報で学習することで知らない内にAI生成データで学習してしまう可能性があるのです。
つまり、「AIにAIが生成したデータを与える」現象が生じるわけです。
AIの作った文章にしろ、AI生成画像にしろ、人間の目にもわかりやすい問題を抱えている場合がよくありますが、こうした欠陥を含んだデータで新しいAIモデルが学習してしまうと、生成されるデータ(画像、テキスト、その他のデータ含む)の品質と多様性かどんどん低下していく恐れがあります。
そこで今回の研究チームは、AIにAI生成データを与えて学習させた結果、どのような現象が生じるのか実験を行いました。