生成AIの今の立ち位置雑感

OZUさんがとても興味深い話を書いていたのと、昨日の記事の最後の蛇足が生まれた背景として、自分の経験談もまとめておこうかと思って。

SNS上では長文になってまとめづらかったので、こっちにぺたり。

  • 画像生成AIについては、最初はそもそも生成のコツがつかめなくて、適当に少量の単語を並べて手探り
  • 慣れてきたら自分の好みに合うよう仕向けるように超複雑なプロンプトを書き始め、同時に生成モデルをたくさん漁りはじめる
  • 相当慣れたら、逆に自分の好みのモデルいくつかと、短めのプロンプトで、アイデアのインプットを積むのに使い始める

って感じで、今はウチの中ではブレインストーミングの相方に落ち着いてますね。
画像生成だけでなくLLMもそんな感じの使い方してます。

最近は、さらなるアイデアの加速用と、あとは純粋なエンタメのために、みんなの話題を拾いながら、それなりに意味を保ったままランダムに画像生成をするようなものをうまく作れればなあという思いつきをどうにかしようと思って、件のMastodon Botの"DALLE-3 画伯機能"(?)で試行錯誤してます。
…が、「意味を保ったランダム」の匙加減がむちゃくちゃ難しい。
プロンプトエンジニアとかになる気はないですけど、ある種の職人芸ではあります。

一次創作に慣れた人は、そのままそのへんの下馬評に惑わされずこだわりつづけたほうがいい。それは間違いない。
何かを創る人口が広がった時に、自分の表現を出し続ける人はむしろ輝きを増し価値が上がってくる。

でも、インプットが不足した時の加速用の外部拡張システムとしては、相当な有用性を見出せる感じがしました。

あともう一つ、これはLLM限定ではありますが、人になかなか聞きづらいことの相談相手。
特別すごい回答が返ってくるわけではないけれど、セルフチェックの役には立ちます。
創作活動は脳を酷使してメンタル不安定にしがちなので、その対策として。

本当の意味で自律行動・自律学習を繰り返す存在が現れたらまた別ですけど、今のところの道具としての生成AIの立ち位置は、こんな感じかなあと…。どうでしょうか。