話題の動画生成AI「Kaiber」についてはこのブログでも記事にしてきました。
今回は既存のビデオのスタイルを変える「Transform」という機能をご紹介します。
その中で無駄なクレジットを消費しないためにも数値やプリセットごとにいろいろ試してきましたのでこの記事が参考になれば幸いです。
内容は、
各パラメーターと作り方
8つの完成動画レビュー
となっています。
各パラメーターと作り方
上記の画面から一番右端の「transform」を選択します。
実際のサイトではサンプルが表示されており、背景や人物の雰囲気がガラッと変わっているのがよくわかります。
Exploreプランだと最長1分までの動画を変換できますが、Pro&Artistプランだと最長4分の動画を高画質で変換することが出来ます。
プロンプト入力画面
Kaiberではお馴染みの画面ですね。
緑の部分に動画のスタイル
を入力します。
それぞれ、自分で独自の説明を書いてもいいですし、おすすめのプリセットが用意されているのでそれを使用しても構いません。
触っている中で気付いたのですが、スタイルのプリセットが拡張されていました。
「8bit」や「Claymation」「Cosmic Neon」などが追加されており、ここから選ぶだけでもいい動画が作れそうです。
セッティング画面
Evolve=変化の度合い
Modelは「Animated」と「Photorealistic」が追加されています。
アニメーション的にするか写実的にするかで使い分けていくのですが、後述する実際の出来を見るとそれまでのプロンプトによって変化の度合いが変わりそうです。
Versionは旧モデルの「1.0」と新モデルの「3.0」を選べます。
「2.0」もあったのですがアップデートで「3.0」へと引き継がれる形で今は選べなくなっています。
また、動画生成の際のクレジットも違うので注意です。
実際の完成動画
素材動画
もう恐縮過ぎるのですが私の弾き語り動画です。
普段の配信部屋で撮りました。
自分の表情やギターの雰囲気、後ろの文字等々がどのように変わるかが分かりやすいと思ったのでこちらで作っていきます。
その1
Photorealistic(プリセット)
Evolve=6 Model=Photorealistic
これが生成された時は笑いました。
後ろの文字や元動画の雰囲気はくみ取れなくなった印象です。
その2(Modelの比較)
Photorealistic(プリセット)
Evolve=6 Model=Animated
その1と比較してみたのは「Model」の違いですが、この動画だとあまり分かりませんでした。しかし、歌っている口の形はどちらもまぁまぁ再現できているように思います。
他にもいろいろ試してみたのですが、私という題材が悪いのかプロンプトの表現不足なのか、「Model」に関してこれといった違いがあまり見受けられませんでした。
ぜひ情報あれば教えてください。
その3(プリセット変更)
Claymation(プリセット)
Evolve=6 Model=Animated
今度はクレイモーションというプリセットで、プロンプトも追記してみました。
その4(プロンプト変更)
Entergalactic(プリセット)
Evolve=6 Model=Animated
日本人男性というプロンプトに変えてみるとそれっぽく変化しましたが「広い大聖堂」の部分はほとんど反映されませんでした。
やはり、元動画に引っ張られている感じがします。よく言えば似せてくれているというか…。
またModelはAnimatedで作ったのですが人間以外の部分は結構アニメっぽい質感になったように思います。
やはりプリセットとの相性があるようです。
その5(性別&Evolve変更)
Entergalactic(プリセット)
Evolve=8 Model=Photorealistic
いっそ性別も変えれるのかと思い試したら上手く出来ました。
Evolveを挙げてみると部屋の背景も大きく変わりました。
その分、唇の動きが歌と合わなくなった感じがします。
その6(性別&Evolve変更)
Claymation(プリセット)
Evolve=8 Model=Animated
リップシンクはもはや機能してませんが、音声を除外して動画単体で見ればなかなかいい出来だと思います。
プロンプトも先ほどよりも多少書き込んだので要素が増えました。
やはりプロンプトでの詳細な指示は必須ですね。
その7(Evolve最大)
Timeworn(プリセット)
Evolve=10 Model=Animated
何だかこれもかっこいいです。
元動画の雰囲気は全然残りませんが、動画生成の結果としてはおおむね満足いく結果です。
その8(その1Evolve低)
Photorealistic(プリセット)
Evolve=1 Model=Photorealistic
その1で使った設定でいっそEvolveを下げてみるとどうなるかと思いやってみました。
背景の雰囲気や後ろの文字は元動画に寄り添っていて、リアルっぽさが出ています。
元動画に近づけるか、大きくファンタジー色の強いものにするかの塩梅が難しいなと感じます。
気付きと注意点
動画のクオリティ
作っていく中で気付いたことは、本物と見間違うような精巧な動画というのはまだ作れないのかなと感じました。
動画のクオリティは確かに高いので、アニメーション調やMVなど創作物として作る分の可能性は非常に高いです。
一番大事な点ともいえる人間の表情や口の動きという部分は、完全にトレースするところまで至っていない感じがしたので、人物を登場させるのであれば人の部分だけ背景削除するなりして合成した方がMVには向いている気がします。
Evolveの適正値
この数値で良くも悪くも大きく動画の印象が変わります。
デフォルトは4に設定されていますが、6でもまだ中途半端な変化という気がするので前述したように自分の作りたい動画によって積極的に数値を変えていくのが良いと思います。
個人的には8以上のガラッと雰囲気が変わってしまう感じが好印象でした。
クレジット残量
あっという間になくなります…。
上記の動画は15秒で90クレジットを消費しています。
Proプランであれば月1000クレジット貰えるので11本作ればもうその月は新たに作れなくなってしまいます。
私もヒィヒィ言いながら制作していました。
プロンプト等を設定したらプレビュー表示されるのでいい雰囲気なのかどうかを確認するようにしましょう。
まとめ
いろいろ書きましたが、transform機能面白いです。
今回は弾き語りでしたが、動きのあるスポーツやダンスなどのtransformは結構良いのではないかと推察します。
前述したように、作るにはクレジットがかかるので少しでも無駄にしたくない気持ちがめちゃくちゃ分かります。
この記事が参考になれば幸いです。
良かったら他の記事も見てみてください。