生成系AI

【AI動画変換】アップデートされた動画生成AI「Kaiber」のTransform3.0機能を試してみた!MVに使えるのか徹底検証!

あばん
あばん
オシャレな動画を作りたいんだけど…

もーだん
もーだん
何から始めたらいいものか…

話題の動画生成AI「Kaiber」についてはこのブログでも記事にしてきました。

今回は既存のビデオのスタイルを変える「Transform」という機能をご紹介します。

その中で無駄なクレジットを消費しないためにも数値やプリセットごとにいろいろ試してきましたのでこの記事が参考になれば幸いです。

内容は、
各パラメーターと作り方
8つの完成動画レビュー
となっています。

各パラメーターと作り方

上記の画面から一番右端の「transform」を選択します。

実際のサイトではサンプルが表示されており、背景や人物の雰囲気がガラッと変わっているのがよくわかります。

あばん
あばん
町中の風景だったのに…

もーだん
もーだん
夕日の感じがなんともエモくて素敵だね

Exploreプランだと最長1分までの動画を変換できますが、Pro&Artistプランだと最長4分の動画を高画質で変換することが出来ます。

プロンプト入力画面

Kaiberではお馴染みの画面ですね。

紫の部分にどのような動画にしたいか
緑の部分に動画のスタイル
を入力します。
それぞれ、自分で独自の説明を書いてもいいですし、おすすめのプリセットが用意されているのでそれを使用しても構いません。

触っている中で気付いたのですが、スタイルのプリセットが拡張されていました。

「8bit」「Claymation」「Cosmic Neon」などが追加されており、ここから選ぶだけでもいい動画が作れそうです。

セッティング画面

Evolve=変化の度合い

Modelは「Animated」と「Photorealistic」が追加されています。
アニメーション的にするか写実的にするかで使い分けていくのですが、後述する実際の出来を見るとそれまでのプロンプトによって変化の度合いが変わりそうです。

Versionは旧モデルの「1.0」と新モデルの「3.0」を選べます。
「2.0」もあったのですがアップデートで「3.0」へと引き継がれる形で今は選べなくなっています。
また、動画生成の際のクレジットも違うので注意です。

「1.0」→1秒に付き5クレジット
「3.0」→1秒に付き6クレジット

スポンサーリンク

実際の完成動画

素材動画

もう恐縮過ぎるのですが私の弾き語り動画です。
普段の配信部屋で撮りました。

自分の表情やギターの雰囲気、後ろの文字等々がどのように変わるかが分かりやすいと思ったのでこちらで作っていきます。

その1

ギターを弾いて歌っている男性。
Photorealistic(プリセット)
Evolve=6 Model=Photorealistic

あばん
あばん
うおお?!誰だこの人…?
もーだん
もーだん
写ってるのは日本人のはずなんですがねぇ…

これが生成された時は笑いました。
後ろの文字元動画の雰囲気はくみ取れなくなった印象です。

その2(Modelの比較)

ギターを弾いて歌っている男性。
Photorealistic(プリセット)
Evolve=6 Model=Animated

その1と比較してみたのは「Model」の違いですが、この動画だとあまり分かりませんでした。しかし、歌っている口の形はどちらもまぁまぁ再現できているように思います。

他にもいろいろ試してみたのですが、私という題材が悪いのかプロンプトの表現不足なのか、「Model」に関してこれといった違いがあまり見受けられませんでした。
ぜひ情報あれば教えてください。

その3(プリセット変更)

ギターを弾いて歌っている男性。背景は花畑。
Claymation(プリセット)
Evolve=6 Model=Animated

今度はクレイモーションというプリセットで、プロンプトも追記してみました。

あばん
あばん
花畑の感じは出てると思うけれど…
もーだん
もーだん
奥行とかは出てこないね…

その4(プロンプト変更)

ギターを弾いて歌っている日本人男性。広い大聖堂で歌っている。
Entergalactic(プリセット)
Evolve=6 Model=Animated

日本人男性というプロンプトに変えてみるとそれっぽく変化しましたが「広い大聖堂」の部分はほとんど反映されませんでした。
やはり、元動画に引っ張られている感じがします。よく言えば似せてくれているというか…。

またModelはAnimatedで作ったのですが人間以外の部分は結構アニメっぽい質感になったように思います。
やはりプリセットとの相性があるようです。

その5(性別&Evolve変更)

ギターを弾いて歌っている女性。ライブハウスでたくさんの人に囲まれている。
Entergalactic(プリセット)
Evolve=8 Model=Photorealistic

いっそ性別も変えれるのかと思い試したら上手く出来ました。
Evolveを挙げてみると部屋の背景も大きく変わりました。
その分、唇の動きが歌と合わなくなった感じがします。

その6(性別&Evolve変更)

ギターを弾いて歌っているおじいさん。背景は真っ黒な部屋で何もない。孤独な雰囲気。
Claymation(プリセット)
Evolve=8 Model=Animated

あばん
あばん
うおお!これはいいんじゃない?!
もーだん
もーだん
雰囲気がガラッと変わったね!

リップシンクはもはや機能してませんが、音声を除外して動画単体で見ればなかなかいい出来だと思います。
プロンプトも先ほどよりも多少書き込んだので要素が増えました。
やはりプロンプトでの詳細な指示は必須ですね。

その7(Evolve最大)

Ancient Forest(プリセット)
Timeworn(プリセット)
Evolve=10 Model=Animated

何だかこれもかっこいいです。
元動画の雰囲気は全然残りませんが、動画生成の結果としてはおおむね満足いく結果です。

その8(その1Evolve低)

ギターを弾いて歌っている男性。
Photorealistic(プリセット)
Evolve=1 Model=Photorealistic

その1で使った設定でいっそEvolveを下げてみるとどうなるかと思いやってみました。
背景の雰囲気や後ろの文字は元動画に寄り添っていて、リアルっぽさが出ています。

元動画に近づけるか、大きくファンタジー色の強いものにするかの塩梅が難しいなと感じます。

スポンサーリンク

気付きと注意点

動画のクオリティ

作っていく中で気付いたことは、本物と見間違うような精巧な動画というのはまだ作れないのかなと感じました。

動画のクオリティは確かに高いので、アニメーション調やMVなど創作物として作る分の可能性は非常に高いです。

一番大事な点ともいえる人間の表情や口の動きという部分は、完全にトレースするところまで至っていない感じがしたので、人物を登場させるのであれば人の部分だけ背景削除するなりして合成した方がMVには向いている気がします。

Evolveの適正値

この数値で良くも悪くも大きく動画の印象が変わります。

デフォルトは4に設定されていますが、6でもまだ中途半端な変化という気がするので前述したように自分の作りたい動画によって積極的に数値を変えていくのが良いと思います。

個人的には8以上のガラッと雰囲気が変わってしまう感じが好印象でした。

クレジット残量

あっという間になくなります…。

上記の動画は15秒で90クレジットを消費しています。
Proプランであれば月1000クレジット貰えるので11本作ればもうその月は新たに作れなくなってしまいます。

私もヒィヒィ言いながら制作していました。
プロンプト等を設定したらプレビュー表示されるのでいい雰囲気なのかどうかを確認するようにしましょう。

スポンサーリンク

まとめ

いろいろ書きましたが、transform機能面白いです。
今回は弾き語りでしたが、動きのあるスポーツやダンスなどのtransformは結構良いのではないかと推察します。

前述したように、作るにはクレジットがかかるので少しでも無駄にしたくない気持ちがめちゃくちゃ分かります。
この記事が参考になれば幸いです。

良かったら他の記事も見てみてください。

ABOUT ME
池田 耕平
夫婦アコースティックデュオ「アバンdeモーダン」のメンバー。 作詞作曲とDTMを使った編曲やミキシングを担当。 メイン楽器はアコギとハーモニカ。 DAWはStudioOne。 ・音楽制作(BGM・ボカロ) ・夫婦ライバー ・YouTube運営(カバー・DTM解説) ・当ブログ運営
こちらもおすすめ
生成系AI

【完全解説】MIDI出力も出来る!DTMerのための音楽生成AI「AIVA」がやばすぎる!作れるジャンルが幅広過ぎて音楽人生壊されそう…!

2023年12月9日
アコギとDTMと
いいえ。やめません。本当に衝撃を受けました。サービスのリリース自体はちょっと前なのですがAIの進化と共にクオリティも上がってきてい …