Google Cloudが、最新のAIモデルである動画生成モデル「Google Veo」と、高品質な画像生成モデル「Imagen 3」をGoogle CloudのユーザーにVertex AI上で提供開始したことを発表した。
Vertex AI上で現在プライベートプレビュー中のVeoは、企業が簡単なテキストや画像のプロンプトから高品質な動画を容易に生成できるようにする。画像から動画を生成するモデルを提供する初のハイパースケーラーとして、企業が既存のクリエイティブアセットをダイナミックな映像へ変換することを支援する。この画期的なテクノロジーにより、クリエイティブな表現の新たな可能性を広げ、動画制作のワークフローを効率化する。
Imagen 3は、来週からすべてのVertex AIのユーザーが利用可能になる。Imagen 3は、シンプルなテキストプロンプトから最も写実的で高品質の画像を生成し、細部、照明、アーティファクトの削減において従来のバージョンのImagenを凌駕する。企業は、マーケティング、広告、製品デザインに使用できる独自のブランドスタイルやロゴを反映した高品質な画像をシームレスに作成できる。
Vertex AIは、これらのモデルのカスタマイズ、パフォーマンスの評価、主要なインフラストラクチャ上でのデプロイを容易にする統合プラットフォームを提供する。GoogleのAI原則に沿って、Vertex AI上でのVeoとImagen 3の開発とデプロイには、電子透かし、安全性フィルタ、データガバナンスなどの予防措置が組み込まれ、安全性と責任が優先されている。
Veo: 最も高性能な動画生成モデルがVertex AIで利用可能に
Google DeepMindが開発したVeoは、テキストまたは画像のプロンプトに基づいて、さまざまな映画的や視覚的スタイルで高品質かつ高解像度の動画を非常に高速に生成する。自然言語と視覚的セマンティクスの高度な理解により、プロンプトに密接に合致する動画を生成する。Vertex AIのVeoは、人物、動画、オブジェクトが映像全体を通じて自然に動く、一貫性のある映像を作成する。
Vertex AIのVeoで、画像から動画を生成する機能の例は以下の通り。
画像から動画へ
Veoは、既存のAI生成画像から動画を生成する。以下は、VeoがImagen 3を使用して生成した画像(上2枚)と実際の画像(下2枚)を使用して短い動画クリップを作成する例。
テキストから動画へ
以下は、Veoがテキストを使用して短い動画クリップを作成する例。
Vertex AIのVeoにより、企業は簡単なテキストや画像のプロンプトから高品質の動画を容易に生成できる。これにより、制作時間の短縮、コスト削減、動画コンテンツの迅速なプロトタイプ作成と改善が可能になる。Veoのテクノロジーは人間の創造性を支援する良きパートナーとして、クリエイターが動画制作の面倒な反復作業をAIに任せ、より高いレベルの創造的なタスクに集中できるようにする。
Agodaなどのユーザーは、Veo、Gemini、ImagenなどのAIモデルを活用して制作時間を大幅に短縮および効率化している。マーケターが魅力的なソーシャルメディア投稿を作成する場合でも、営業チームが説得力のあるプレゼンテーションを作成する場合でも、制作チームが新しいコンセプトを探求する場合でも、Veoはワークフローを効率化し、ビジュアルストーリーテリングの新たな可能性を解き放つとしている。
Imagen 3:最高品質の画像生成モデルをVertex AI上で一般提供開始
Imagen 3は、テキストから画像を生成できる、Googleの最高品質の画像変換モデルだという。従来のモデルと比べて視覚的なアーティファクトが大幅に少なく、かつてないほど詳細かつ写実的で生き生きとした画像を生成する。
来週から、すべてのGoogle CloudのユーザーがVertex AI上でImagen 3にアクセスできるようになる。Vertex AIのImagen 3を使用することで、簡単なテキストプロンプトから高解像度の画像や動画を生成できる。
さらに、許可リストに登録されたユーザーには、画像編集やカスタマイズの機能も一般提供する。
Imagen 3 はテキスト入力で簡単に写真編集ができるツールを提供。例えば、背景の更新や一部編集(マスクベースの編集)、画像の解像度アップスケールが可能。以下は編集機能の例だ。
また、ブランドやスタイル、製品の特徴を取り入れたカスタム画像生成も可能。これにより広告やマーケティングの制作プロセスが効率化され、クリエイティブな可能性が広がるとしている。
エンタープライズの安全性とセキュリティ
- 電子透かし
Google DeepMind の SynthID を使い、生成画像や動画に目に見えない透かしを埋め込み、誤情報のリスクを軽減。 - 安全性フィルター
有害なコンテンツ生成を防ぐ保護機能を搭載。Google の AI 原則を遵守し、新しい技術への投資を続ける。 - データ ガバナンス
顧客データはトレーニングに使用されず、顧客の指示に従ってのみ処理される。 - 著作権補償
業界初のアプローチで、生成 AI サービスに関する著作権リスクを軽減。