絵を《書く》時代
絵を《書く》時代がやってきた。
生成AIのMidjourneyが登場し、われわれは言葉で絵を生成する時代の幕開けを目の当たりにした。入力した言葉に従って、自動的に画像が生成される。しかも、なかなかどうして完成度の高い画像だ。
ただそれは、言葉というよりも、コマンド入力に近い。描きたい対象物の名前、イラストの作風、特定動作を行うコマンドを、英単語で列挙していく。その複雑怪奇な英単語の羅列は、いずれ呪文と呼ばれるようになった。呪文の唱え方が絵の精度を左右する。これは言葉で絵を描いているのではない。
おそらくは、プログラミングだ。
AIを操るコマンドを打ち込むことで、画像をプログラミングしている感覚に近い。呪文で画像を生成する行為を「絵を書く」とは言えない。
絵を書く時代はChatGPTが切り拓いた。
ChatGPTは周知の通り、自然言語でチャットしながら様々なテキストコンテンツを生成する。最新のChatGPT-4では画像生成が可能になった。
正確にはDALL・E3(ダリ3)という生成AIを用いる。これはChatGPTと同じくオープンAI社が開発した画像生成AIだ。ChatGPT-4に「○○の絵を描いて」と指示を出すと、これをChatGPT-4がDALL・E3に引き渡し、DALL・E3が画像を生成。ChatGPT-4上に生成された画像を表示する。ChatGPT-4とDALL・E3の連係プレイで画像生成するのだ。
このときChatGPT-4は自然言語のインターフェイスと化す。
人の言葉を聞き、理解し、返答するインターフェイスだ。このおかげで、ついにわれわれは絵を《書く》ことに到達した。描きたい対象物を伝えるだけではない。それがどのようなシーンで、どんな意味があるのか、何を表現しているのか。そうした意味内容も含めてChatGPT-4に伝える。ChatGPT-4は単に命令を遂行するのではなく、指示内容を理解した上でそれを画像化してくれる。
たとえばこんな具合だ。
「女子高生を日本のアニメ風に描いてください」
これだけの指示なら呪文系生成AIと変わりない。ChatGPT-4の場合は意味内容まで踏み込める。
「彼女はこれから大学入試です。大学校舎の試験会場は広く、たくさんの受験生がいます。このような状況で女子高生の心情を踏まえ、イラストを描いてください」
こうした文章による指示が、女子高生の表情、仕草に現れる。ディテールは何ひとつ指示していないのに、彼女は不安と決意の入り交じった表情を浮かべ、受験票を手に握り、彼女の背後にある光が将来の希望を示唆する。
絵面を指示するのではない。内容を伝えるのだ。
それこそイラストレーター相手に打ち合わせをするように、どんなイラストを描いてほしいのか、ChatGPT-4に打ち込んでいく。ノーアイデアの場合はその旨を伝える。「表現したいことはこんな内容なんだけど、具体的にどう描けばいいのかわからない。何か考えてみて」と素直に伝える。そうすると、AIなりの答えをイラストで見せてくれる。それが気に入らないなら、どう直したいのか、チャットで話しながら詰めていく。
まさに言葉を紡いで《絵を書く》のだ。
正直なところ、効率という点では呪文系生成AIのほうがスムーズだろう。ピンポイントでほしい絵を指示できるからだ。しかし、生成AIに何か表現させてみようとか、コンセプトに沿った絵を描かせたいのなら、ChatGPT-4で絵を《書く》作業がしっくりくる。思い通りに描かせるにはたくさんの言葉を重ねる必要があるが、実際に絵を描くことを思えばどうということはない。自分が生きているうちに、《描く》が《書く》になる瞬間に立ち会えるとは思ってもみなかった。
Generated by ChatGPT-4 and DALL·E3
Comments