共有

2024 年 12 月 11 日

Gemini 2.0 Flash で動画作成を再考する

Vishal Dharmadhikari

プロダクト ソリューション エンジニア

Hang Chu

Viggle

Viggle のショーケースのヒーロー

Gemini API はアプリを強化するだけでなく、クリエイティブな表現に革命を起こしています。Viggle は、写真を魅力的なアニメーションに変換できる AI 動画のセンセーションを巻き起こし、この革命の最前線に立っています。現在試験運用版プレビューでのみ利用可能な Gemini 2.0 Flash のマルチモーダル マジック(特に、Imagen 3 による画像生成と並行して、高度な動画理解と音声出力の機能)を試すことで、Viggle は、ユーザーがこれまでになく簡単に、最も奇抜な想像力を形にできる機能を構築しています。

Viggle の内部: Gemini 2.0 Flash と Imagen 3 による AI 動画作成の強化

Viggle は、静止画像を全身の動きのあるアニメーション動画に簡単に変換できる機能で、すでに数百万人のユーザーを魅了しており、ソーシャル メディア プラットフォーム全体でバイラル コンテンツを生み出しています。ミームとダンス コンテンツに特化した Viggle は、モバイルアプリ(iOS と Android)とウェブ プラットフォーム(viggle.ai)を提供しています。顔の入れ替え、ダンスの動きを使った写真のアニメーション化、映画のシーンへのユーザーの挿入などの機能は、Viggle のユーザーベースですでに人気を集めており、現在、創造性を次のレベルに引き上げるための新しい方法が検討されています。

Viggle は現在、Gemini 2.0 Flash と Imagen 3 の機能を活用した 2 つの機能をプロトタイピングしています。


  • 画像から仮想動画キャラクターへ: Viggle は、画像生成に Imagen 3 を使用して、AI を活用したキャラクター作成ツールを開発しています。ユーザーは「光る目で踊るロボット」や「ふわふわの虹色のドラゴン」などのシンプルなテキスト プロンプトを入力するだけで、動画に登場する独自の仮想キャラクターを生成できます。これらのキャラクターは Viggle のアニメーション エンジンにシームレスに統合され、パーソナライズされたストーリーテリングの可能性が広がります。想像力から生まれたキャラクターを主役にしたアニメーション ショートフィルムを自分で監督する。Viggle と Imagen 3 は、そんな力をあなたに与えます。

  • 動的な AI ナレーション: Viggle は、Gemini 2.0 Flash の音声生成機能と動画の深い理解を活用して、コンテキストに沿ったリッチなボイスオーバーをあらゆる動画に追加する機能を開発しています。これは、スクリプトを読み上げる単調な音声ではありません。動画のコンテンツを分析し、重要な瞬間、アクション、感情を特定して、映像を完璧に補完するナレーションを生成する AI ストーリーテラーです。ダンス動画のユーモラスな解説や、ファンタジー シーンの壮大な説明など、AI ナレーターはエンゲージメントにまったく新しい次元を追加します。

創造性とエンゲージメントを新たなレベルに引き上げる

生成 AI の統合により、Viggle のエクスペリエンスはいくつかの重要な点で強化される予定です。


  • キャラクター作成の簡素化: Imagen 3 の画像生成により、動画のキャラクターの作成とカスタマイズのプロセスが効率化されます。ユーザーはアイデアに基づいて独自のキャラクターを生成できるようになり、高度なデザインスキルや限られたプリセット オプションに頼る必要がなくなりました。このワークフローの簡素化により、より多くのユーザーがクリエイティブなビジョンを実現できるようになります。

  • よりパーソナライズされたコンテンツ: Gemini 2.0 Flash を使用すると、ユーザーは高度にパーソナライズされた動画ナレーションを作成できます。カスタム デザインのキャラクターと動的な AI ナレーションを組み合わせることで、クリエイターと視聴者のつながりを強化する独自のストーリーテリングが可能になります。

  • クリエイティブの可能性の拡大: バーチャル キャラクターと AI ナレーションを組み合わせることで、Viggle のショート動画のクリエイティブの可能性が広がります。従来の動画フォーマットにとらわれず、新しい形のストーリーテリングを試すことができます。

今後

Viggle は、Gemini 2.0 と画像生成モデルの可能性をさらに探求してプラットフォームを改善することに期待を寄せています。また、AI がクリエイティブ プロセスのあらゆるステップにシームレスに統合され、誰もが動画クリエイターになれる未来を思い描いています。

「Viggle では、誰もがクリエイターです。ミームを作成したり、次世代のプロジェクトでモーション キャプチャを試したり、独自のマルチバースを構築したりしています。Gemini 2.0 Flash のリアルな音声ナレーション機能により、ユーザーは新たな可能性を切り開き、これまでにない方法でストーリーテリングを制作できるようになると考えています。」

- Viggle 創業者、Hang Chu 氏

Viggle が Gemini 2.0 Flash と Imagen 3 を活用したことで、AI が動画制作を変革し、自己表現のための新しいツールをユーザーに提供する可能性が示されました。このコラボレーションは、AI を活用したストーリーテリングの未来に向けた一歩となります。Gemini を使用した構築の詳細については、Gemini API ドキュメントをご覧ください。また、画像生成の最新の進歩については、Imagen 3 をご覧ください。