このアニメーションのモナリザはAIによって作成され、恐ろしいです

Pin
Send
Share
Send

「モナリザ」の謎めいた、描かれた笑顔は世界中で知られていますが、その有名な顔は最近人工知能(AI)の好意により驚くべき新しい表現の範囲を示しました。

5月21日にYouTubeに共有されたビデオでは、3つのビデオクリップがモナリザが唇を動かして頭を向けている様子を表しています。彼女は畳み込みニューラルネットワークによって作成されました。これは、人間の脳と同じように情報を処理し、画像を分析して処理するタイプのAIです。

研究者はアルゴリズムをトレーニングして、顔の特徴の一般的な形状と、それらが互いにどのように動作するかを理解し、その情報を静止画像に適用しました。その結果、単一のフレームからの新しい表情の現実的なビデオシーケンスが生まれました。

モナリザのビデオの場合、AIは3人の被験者のデータセットから顔の動きを「学習」し、3つの非常に異なるアニメーションを生成しました。 3つのクリップはそれぞれモナリザとして認識されていましたが、トレーニングモデルの外観と動作のバリエーションは、「生きている肖像画」に明確な「個性」をもたらしました。 Samsung AIセンター(どちらもモスクワにあります)については、ビデオで説明しています。

ザハロフと彼の同僚はまた、アルバートアインシュタイン、マリリンモンロー、サルバドールダリなどの20世紀の文化的アイコンの写真からアニメーションを生成しました。研究者らは、プレプリントジャーナルarXivのオンラインで5月20日に公開された研究で、ピアレビューされていない調査結果について説明しました。

見慣れた顔は見慣れない顔をします。 (画像クレジット:E. Zakharov et al。)

ディープフェイクと呼ばれるこれらのようなオリジナルのビデオを制作することは簡単ではありません。人間の頭は幾何学的に複雑で非常にダイナミックです。頭の3Dモデルには「数千万のパラメーター」があると研究著者らは書いている。

さらに、人間の視覚システムは、3Dモデル化された人間の頭の「軽微な間違いも」特定するのに非常に優れていると、調査によれば。ほぼ人間のように見えますが、完全ではないものを見ると、不思議な谷効果と呼ばれる深い不安の感覚が引き起こされます。

AIはこれまでに、説得力のあるディープフェイクを生成することが可能であることを示してきましたが、目的の被写体に複数の角度が必要でした。新しい研究のために、エンジニアは動作中の人間の顔を示す参照ビデオの非常に大きなデータセットにAIを導入しました。科学者たちは、どのような顔にも当てはまるランドマークを確立し、ニューラルネットワークに顔の一般的な振る舞いを教えました。

次に、参照式を使用してソースの機能の動きをマッピングするようにAIをトレーニングしました。これにより、AIは、作業するイメージが1つしかない場合でもディープフェイクを作成できるようになったと研究者たちは報告しています。

そして、より多くのソース画像が、最終的なアニメーションでさらに詳細な結果をもたらしました。科学者達は、1つの画像ではなく32枚の画像から作成された動画が、ユーザー調査で「完全なリアリズム」を実現したと述べています。

Pin
Send
Share
Send