人には出せない魅力！？AIアートはどのように生成されるのか

最近、AIが人間に代わって絵や画像を出力するというニュースを見かけることがあり、NFTマーケットプレースOpenSeaにも、部分的にAI描画を採用したと説明するアート作品が販売されています。

今回はそんなAIアートについて、ご紹介していきます。

1. Open Seaに出展されているAIアート
2. AIアートの持つ一種独特の「不気味さ」
3. AIを支える機械学習
- 3.1. 教師あり学習
- 3.2. 教師なし学習
  - 3.2.1. 教師なし学習は人間からすると違和感がある
  - 3.2.2. 注目を集めるGAN(敵対的生成ネットワーク)
4. どうやってAIがアートな絵を描くのか
5. AIの出力はアートなのか
6. まとめ

Open Seaに出展されているAIアート

コレクション「Explosion of Color by AIIV」(https://opensea.io/collection/explosionofcolorreserve )は、Ravi Vora と Phil Bosua の2名連名による作品群で、花束が爆発したような鮮やかな絵柄が特徴です。コレクションには技術面での詳細記述はないものの、AI生成アートと説明されています。

売買実績は豊富で、コレクションは100枚限定発行ですが2022年2月時点で73名のオーナーがおり、2次売買も多数の口座間で盛んに行われています。過去の取引実績価格は作品にもよりますが手数料別で1～9ETH程度(35～300万円)、超投機的なNFT市場としてはまだ比較的健全な相場で取引が行われています。

**OpenSeaのコレクション「Explosion of Color by AIIV」 ※抜粋**

作者の一人Ravi Vora ( https://www.ravivora.com/ )は、商業写真家・CMディレクターとして有名で、ナイキ・マスターカード・カンタス航空などの企業CM制作、HP・フォードなどの雑誌向け広告写真を撮っています。もう一人の作者Phil Bosua (https://www.aimc.ai/philbosua )は、3DレンダリングやAI生成アートを手掛けるAI技術者・兼・美術家です。
作業分担は説明されていませんが、それぞれの専門性から考えて、Ravi Voraが素材撮影と作品のディレクション、Phil Bosuaがコンピュータによる素材のコラージュ・レンダリング・AI操作、といった役割分担と思われます。AI生成画像は独特の「不気味さ」を持っていますが、商業写真家として広く世間に受け入れられているRavi Vora が参加することで、そういった「毒気」が幾分抜け、アート作品として一般層にも鑑賞対象として受け入れやすい作品になっています。

AIアートの持つ一種独特の「不気味さ」

AI生成画像は、「毒気」のような独特の不気味さを持っています。Phil Bosua の方は単独でもAI生成の画像を多数発表していますが、その作品群の持つ独特な不気味さはAI生成画像に見られるこの特徴を良く表しています。
https://www.aiiv.ai/ には多数のAI生成画像が掲載されていますが、これらを見るといずれも人間の身体パーツらしき有機物や、無機物・無生物が融合したような画像で、一見、ダリやマックス・エルンストのようなシュールレアリズム絵画に似た絵柄になっています。しかしそれらシュールレアリズム絵画と比較しても、人間の発想限界を超えた作者の精神状態を疑うような(AIなので実際人間ではないのですが)「そんな風に変形・結合する？」と違和感を覚える合理的とも非合理的とも言える不思議な画像になっています。これは、どの特定の作家の特徴という訳ではなく、AI生成画像に共通する独特の雰囲気です。

AIを支える機械学習

数年前からよく耳にするようになったAI(人工知能)ですが、一般にAIの学習方法には大別して二つの方法があります。

教師あり学習

一般的には、AIと言えばこの教師あり学習を指し示します。これは、入力データ・期待される出力をペアとし、多数のペアが持つ入出力の因果関係をAIが「学習」して、予測能力を持たせようとするものです。応用分野としては、降雨に対する河川水位予測・メールのスパム該否判定・株価予測など、過去データを人間が豊富に持っているケースです。逆に言えば、学習データを大量に準備できない場合、教師あり学習を行うことはできません。また、機械学習の時含まれなかった異なる傾向を持つ未知の入力データに対しては、予想外の反応をする場合があり、その場合予測精度見積りは困難です。教師ありの機械学習によるAIの予測は、ほとんどの場合人間にとって「そうだろうな」という平凡な結果を出力します。

教師なし学習

近年、急速に注目を浴びるようになったのが、この「ディープラーニング(特徴表現学習)」と呼ばれる方法です。AI作成時、人間が学習用に大量の教師データを与えるのではなく(ただし正解基準として少数の教師データを理想の「本物」として与えます)、入力データに対して、特徴を持つ・持たないに分別する基準をAIが自律的に見つけ出します。特徴抽出するAIを複数組み合わせることにより、入力に反応するAIや、入力に応じた出力を行うAIを作ることができます。例えば、監視カメラに映った不審者の抽出・将棋ゲーム・二足歩行するロボットの制御・自然言語処理(翻訳ツール)・昔の白黒写真をカラー写真に着色する、など、人間がアルゴリズムを機械に与えられない分野で威力を発揮します。

教師なし学習は人間からすると違和感がある

教師なし学習ではAIが特徴を自律的に抽出するので、AIの着眼点と人間の着眼点とが必ずしも一致しません。そのため、十分学習が進んだ段階のAIであっても、しばしばその出力に人間として「違和感」を持つことになります。
例えばディープラーニングによる将棋AIの次の一手を人間の有段者が見て、自分の考え方や定石と違うと感じることがよく話題になりますが、これは盤上の形勢を捉えるAIの着眼点と人間の着眼点が異なるためです。人間の方が正しいとも、AIの方が正しいとも一概に判断することはできません。試合に勝利する側が正しいという結果だけが残りますが、結果しか残っていないのでなぜAIがそう振舞ったのか過程・理屈は、人間にもAIにも説明不可能です。そのためしばしば「AIはどういう発想でこう考えたのだろう？」と人間を悩ますことになります。

注目を集めるGAN(敵対的生成ネットワーク)

ここ数年、ディープフェイクと呼ばれる画像の偽造・絵を描くAI技術として注目を集めるのは、この教師なし学習のディープラーニングの一種のGAN(Generative Adversarial Networks：敵対的生成ネットワーク)です。

GANは上図のように、生成者(Generator)・識別者 (Discriminator)と呼ばれる2つのAIを備えています。偽札作りにもよく例えられますが、贋作士・鑑定士の分担分けになります。生成者・識別者は互いに切磋琢磨しながら教師なし学習を通じて成長していきます。

生成者・・・識別者に見破られないよう、偽物を本物に近づけていく
識別者・・・生成者の出力を本物と比較して偽物だと見破る

と、騙し・騙され合いの競争を行います。学習段階でこの競争を繰り返します。これにより教師なし学習であるにも関わらず、少数の本物データを参照することで教師ありに近い学習効果を上げることが可能になります。

生成者の出力の偽物を、識別者が本物と見分けがつかなくなる(類似している)と判定するようになれば学習完了です。ただし、類似している・類似していない、判定は、AIが獲得した特徴抽出次第なので、必ずしも人間の持つ特徴の捉え方とは一致しません。

最初のGANは2014年に登場しましたが、その後もDCGAN・CycleGAN・Age-cGAN・StyleGAN・StyleGAN2など、多くの改良・派生タイプが発表されています。ディープフェイクと呼ばれる、写真の証拠能力への懐疑に繋がった偽造技術はStyleGANによるもので、リアルで高画質だが偽物という画像が作成可能になりました。これにより、有名な例として元アメリカ大統領のドナルド・トランプを誹謗中傷するバラク・オバマ（https://youtu.be/cQ54GDm1eL0）

(ネタバレ解説部分含む)といった政治意図を持つ偽造映像などが制作され、もはや、まばたきの有無で本物と偽物を判別するしかない、といった完成度にまで到達しています。

どうやってAIがアートな絵を描くのか

前述のOpenSeaコレクション「Explosion of Color by AIIV」もAI応用による作品ですが、こちらの場合は、本物そっくりの偽物づくりに注力しているのではなく、意図的に本物とはかけ離れたカラー化にAIを応用しています。作成方法としては、白黒化したカメラ画像にAIで着色していると述べられています。この方法は近年テレビ放送で見かける、過去のモノクロ報道映画をカラー映像化する技術に近いと思われます。

例えば、「NHK技研2020年夏号 No.182」の「白黒映像の自動カラー化システムの開発」では、GANとは学習方法が異なりますが同じくディープラーニング技術の一種であるCNN(Convolutional Neural- Network：畳み込みニューラルネット)を用いてNHKアーカイブに残されたモノクロ記録映像をカラー化したとの報告が載せられています。

現代人に敬遠されがちなモノクロ記録映像を、人々の興味・関心を引く、つい最近の記録のような生々しいカラー映像に生まれ変わらせています。

出典：NHK技研2020年夏号 No.182 報告01「白黒映像の自動カラー化システムの開発」（遠藤/河合/望月）より　ー　システム構成

ここでも正解基準となる色付け修正を人間が「本物」として与えますが、その基準を元にAIが自分で学習し、カラー化画像を出力しています。

「Explosion of Color by AIIV」の場合も類似AI技術応用による着色方法と考えられますが、オリジナルの色合いに近づけようとするNHK技研とは着色方針が異なり、自然界にはない派手な色付けした画像を「本物」基準として与えます。そのため、AI学習段階での本物・偽物の色合い基準に意図的なバイアスが掛かります。この学習済AIの出力が、オリジナルの色合いとは異なる、派手でアーティスティックな色付け画像を生み出しています。

AIの出力はアートなのか

冒頭でディープラーニングによるAIの生み出した画像がシュールレアリズムに似ていると紹介しました。シュールレアリズムは人間の理性の奥底にある潜在意識や欲望・夢を文学・絵画として描こうという人文運動です。そのため、できるだけ人間の意識的な作為を排除しようと、自動筆記・筆を使う以外の方法で絵を描く、などの実験的方法が模索されていました。そのシュールレアリズム絵画に人間の意図を直接反映しないAIの出力が似ているのは納得の行く話です。また人間の脳の働きを知る上でもAIの生み出すアートは新しい発見と言えます。

まとめ

AI出力がアートなのか？という議論も存在はしますが、AI技術の探求により逆に人間自身を知ることに繋がるため、AIアートには短期的なブームではなく今後も永続する普遍的なものだと考えます。

今後もこちらでは、NFT関連の役立つ情報をお届けしていきます。NFTや暗号資産など、ブロックチェーン技術にご興味のある方は当社に是非ご連絡ください。

人には出せない魅力！？AIアートはどのように生成されるのか

Open Seaに出展されているAIアート

AIアートの持つ一種独特の「不気味さ」