2008年11月に発表となったAdobe Creative Suite 4。映像制作ツールのPremiere ProAfter Effectsも合わせて、12月19日に新バージョンがついにリリースとなりました。新製品のPremiere Pro CS4の新機能としてまず挙げられるのは、AVCHDやREDデジタルシネマカメラをはじめとするテープレスフォーマット(ファイルベースワークフロー)への対応強化です。このファイルベースワークフローで重要となるのが「メタデータ」です。

PCの機能・性能向上とともに、映像制作ツールはこの1、2年で大幅に進化しました。「映像制作」だけに焦点を置いてみればほぼ完成の領域に入っており、どのソフトウェアを使用しても、できることはあまり変わらなくなってきました。アドビ システムズでは、これからの映像制作で欠かせないものとなるメタデータへの対応を強化し、放送やDVD、Blu-rayといったこれまでどおりの分野はもちろん、Webを中心とした分野へもFlashとあわせて映像製品を強化していっています。

今後の映像制作ツールではメタデータが重要

映像制作の世界では、従来のVTRベース編集システムに搭載された機能の延長線上で、これまで「エフェクト」「HD映像対応」「リアルタイム性」がノンリニア編集の評価基準とされてきました。最終的にビデオテープ(映像信号)として出力する業務であれば、これらは非常に重要なファクターであったことも事実です。しかし、これからの映像制作業務においては、ファイルでの出力やWebへの対応も重要となります。

CS4_picture1.jpg

テレビ放送では番組表を使って視聴したい番組を選択しますが、動画共有サイトでは「検索」によって目的の動画を探すことができます。これは、動画に「タグ」と呼ばれるキーワードが追加されていることで可能となります。この「タグ」もメタデータであり、Web動画ではメタデータ次第で視聴数が大きく変わってくるというわけです。つまり、今後はメタデータの取り扱いが、映像制作ツールの重要な鍵となってきます。

これまでの編集ツールで入力されたメタデータは、入力が煩雑だったり、その編集ツール外部での利用ができなかったりしました。今回のPremiere Pro CS4では、オリジナルの項目入力にも対応し、多様なメタデータを効率よく入力する「メタデータ」パネル(右図)を搭載しました。そのメタデータを、XMP形式(eXtensible Metadata Platform:XMLをベースとしたメタデータ記述形式)で管理するため、素材だけでなく最終出力ファイルまで一貫した管理が可能となりました。さらに、画期的な新機能「スピーチ検索」を使うことで、メタデータの可能性を広げています。このスピーチ検索は、映像に含まれる音声を認識し、テキストデータを書き起こすものです。

タイムコード情報と音声情報を組みにしたスピーチ検索

ここでスピーチ検索の手順を紹介しておきましょう。

  1. Premiere Pro CS4のプロジェクトパネルでクリップを選択します。
  2. 「メタデータ」パネルにある「スピーチの書き起こし」で「書き起こし」ボタンをクリックします。
  3. CS4_picture2.jpg
  4. 書き起こしのオプションを指定します。
    言語の種類(12種類の言語を選択できます)と、認識精度および複数話者の識別についてオプションを指定できます。
  5. CS4_picture3.jpg
  6. [OK]をクリックするとAdobe Media Encoder CS4が起動します。
    Adobe Media Encoderは、MPEG-2やFLVなどへのエンコードを行うツールですが、CS4では、スピーチの書き起こしでの音声認識処理も担当します。CS3でのAdobe Media Encoderは、Premiere Pro CS3に組み込まれていたため、MPEG-2などのエンコードを行うと、編集作業を同時に実行できませんでしたが、CS4では独立したアプリケーションとなったため、Premiere Pro CS4での編集作業を妨げることがなくなりました。
  7. CS4_picture4.jpg
  8. Adobe Media Encoder CS4で、「キューを開始」ボタンをクリックします。
     音声認識処理が始まり、Premiere Pro CS4のメタデータパネルでは、作業の進行状況が表示されます。
  9. 作業が完了すると、メタデータパネルに書き起こされたテキストが表示されます。
  10. CS4_picture5.jpg
  11. 誤って認識された単語は、その場で修正も可能です。
    自動認識ですので、100%の精度ではありませんが、ニュース音声などでは90%以上の単語が正しく認識されます。
CS4_picture6.jpg

このようにして書き起こされたテキストデータは、Premiere Pro CS4のプロジェクト内で検索対象として利用できるほか、認識された単語1つ1つにタイムコードの情報が埋め込まれています。これを利用することで、たとえば1時間の素材の中から特定の単語が話されたポイントを瞬時に検索、頭出しするといった、これまでにない編集作業を可能にしているわけです。

素材検索以外の利用が可能なスピーチ検索

CS4_picture7.jpg CS4_picture8.jpg

スピーチ検索書き起こされたメタデータは、素材検索以外にもさまざまな利用が考えられます。まず、メタデータパネルに書き起こされたテキストは、クリップボードへのコピーができるので、テロップ制作時にペーストして活用することも可能です。After Effects CS4では、スピーチ書き起こしデータがXMPで埋め込まれた素材を読み込めば、タイムライン上に単語が表示されます。(上図)

さらに、Premiere Pro CS4またはAfter Effects CS4からFlash Videoを出力する時には、特定の単語のポイントでキューポイントを指定することもできます。スピーチ検索で書き起こされたXMPのデータ自体はテキスト情報であるので、Bridge CS4でも確認することができます。

これまでの固定的なメタ情報だけでなく、クリップの中に含まれる音声を解析することで得られる自由度の高いメタ情報が、メタデータの新たな可能性を広げるものとなりそうです。

古田正剛(アドビ システムズ)