人工知能(AI)は最近、猫の写真をゼロから生成しようとしましたが、その結果は猫の悲惨なものでした。
この特定のニューラルネットワーク(人間の脳の働きをモデルにしたAIの一種)は、人間の顔の驚くほどリアルなオリジナル写真を生成できます。実際、これらの構成された人々の画像は、人間の視聴者が実際の人々の写真と区別することはほぼ不可能でした、AIのプログラマーは、プレプリントジャーナルarXivに2018年12月に投稿された調査で報告しました。
しかしネコは別の話であることが判明した。完璧な人間の顔を生成したのと同じアルゴリズムで、頭が奇妙な猫を作成しました。間違った数の目と脚;体が長すぎたり、短すぎたり、異常に丸みを帯びていたり、長方形であったり、特異な角度で曲がっていたりします。
不気味な猫の写真を生成したAIエンジンは、「生成的敵対ネットワークのためのスタイルベースのジェネレーターアーキテクチャ」またはStyleGANとして知られているものです。このようなネットワークは、2つのモデルが同時に機能するため、「敵対的」です。1つは画像を生成し、もう1つはトレーニングデータセットの写真に対して結果を評価します。これにより、ネットワークは誤りから学習し、パフォーマンスを向上させます。
AIがリアルな人間の画像を生成するには、まず既存の写真から人間の顔がどのように見えるかを「学習」する必要がありました。アルゴリズムは、顔を頭の位置などのスタイル機能のチェックリストに分解しました。性別;肌の色;髪の質感とスタイル。目、鼻、口の形も研究者達は報告している。
StyleGANが人間の監督なしでこれらの要素をすべて認識できるようになると、それらを個別に組み立てて、まったく新しい写真のような人間の顔を生成する方法を学びました。研究者たちはインタビューの依頼を拒否しましたが、2018年12月12日にYoutubeに投稿されたビデオで彼らのプロセスを説明しました。
では、なぜStyleGANが愛らしいリアルな猫の写真を作成できないのでしょうか?ニューラルネットワークのトレーニングを行っていたが、研究、ライブサイエンスに語った。
シェーンは2月7日にブログ「AI Weirdness」で奇妙な猫について書きました。 StyleGANの人の顔の写真データセット(体と背景が切り取られ、頭の位置が互いに似ている)とは異なり、データセット内の猫の画像は大きく変動しました。このコレクションには、さまざまな背景でのさまざまな背景での猫のクローズアップとワイドショットが含まれています。 1匹の猫が写っている写真もあれば、複数の猫が写っている写真もあれば、人が写っている写真もあります。
「逆さまの猫がいます。ボールに丸くなっている猫がいます。彼らの目は開いています。彼らの目は閉じています。入力データが少しうるさいのは確かです。そして、うるさいのは、そこに何かがあるということです。それはただの猫の写真ではない」と語った。
だから、悪夢のような猫の恐ろしい動物園のために、StyleGanをあまり厳しくしないでください。
「アルゴリズムが学習しなければならないことはまだまだたくさんある」とShane氏は付け加えた。
競合する視覚的な手がかりにより、StyleGANは実際の猫がどのように見えるはずなのかを理解することが困難になりました。また、ニューラルネットワークには、提供される情報に関する実際のコンテキストはありません。彼らが知っているのは、データセットの内容だけです。 StyleGANは、参照写真から十分に学習して、猫の毛皮や猫の耳の形など、小規模な詳細やテクスチャを正確に再現しました。しかし、プログラムは猫全体をまとめるのに明らかに苦労した、とシェーンは言った。
「ニューラルネットワークは猫の働きを理解していません。猫の足の数も理解していません。目の数や解剖学的構造がどこにあるのかははっきりしていません」と彼女はLive Scienceに語った。
開発プラットフォームGitHubで、StyleGANの不穏な猫の写真、ほぼ完璧な人間の画像、その他のプロジェクトファイルをご覧ください。