SIGGRAPH論文、今年の傾向は?

siggraph2014_02_paper1

初日に開催される論文紹介イベントPapers Fast Forwardから ©SIGGRAPH 2014

派手なCG映像が注目されるSIGGRAPH。コンピュータグラフィックスとインタラクティブ技術の学会であり、その本分は論文発表にある。今年の論文は、世界中から集まった550本の投稿の中から、173本の発表論文が選出された。分野は昨年以上に多岐に渡っており、音やゲーム技術に関する研究、3Dプリンタの応用技術など、最近の傾向を強く反映したものとなっている。「自分は研究者では無いから、論文は関係無い」と思うことなかれ。論文発表された新しい技術が、数ヶ月のうちに市販のツールの新機能として取り込まれたり、最近では、論文発表と同時にその新技術が試せるツールが公開されたりするからだ。

今年からSIGGRAPH参加者への論文発表資料の配布方法が変わり、従来配布されていたDVDや、追加購入可能であった分厚い論文集(書籍)が無くなり、オンラインでのPDFデータの配布となった。論文の概要を把握しやすい、最初の1ページは通年無料で公開される。ほとんどの論文1ページ目には、その研究の特長となる画像が使われており、アブストラクトと呼ばれる身近い概要が書かれているため、全体像を知るには大変役に立つ。論文全ページは、SIGGRAPH開催期間中と、その後1週間は会員や登録無しでも、無料で公開されるとのこと(※ご覧になる時期によっては、ページが閉じられている可能性があります)。

今年のSIGGRAPH論文の傾向は、以下のとおり。

  1. 研究分野がCGに限らず多岐にわたっている。研究ジャンルも細分化している
  2. 実用化や、利便性を意識した研究が多い(ハリウッド映画のVFX制作で培われた技術など)
  3. 3Dプリンタや、3Dスキャンに関連した基礎技術、応用技術の広がり
  4. 機械学習とクラウドソーシング(Amazon Mechanical Turk)を用いた研究
    従来も似たようなことが出来たが、圧倒的なスピードと品質を実現するなど
  5. サンプルとなるリファレンス実装のソースコードや実動ツールを配布する論文が多い
  6. 普通に考えると思いもしなかった逆転の発想的な研究もあり

4つ目にある「機械学習とクラウドソーシング」とは、従来は最適なルールやアルゴリズム、仕組みを考えて研究していたが、同じテーマや目的であっても、大量の動画素材や、モーションデータ、撮影素材などをもとに安価に大量のデータを扱えるようになってきたコンピューティングパワーを活用し、機械学習によって大量のデータからある法則や、ルールを見いだすというアプローチだ。

また、研究テーマに必要な大量の調査や、アンケートのようなものも、Amazon Mechanical Turkなどの数セント(数円)で世界中の「人」から意見を吸い上げたり、軽い作業をしてもらったりした結果から、研究の指針を見いだすという方法だ。

なお、SIGGRAPH 2014論文集のビデオプレビュー(ダイジェスト)が公開されており、約3分のこの動画をご覧になると、短時間で全体の雰囲気がよくわかるだろう。

今回ここで紹介した新技術は、まだまだ現場で利用するだけの耐久性や、速度、品質に達していないかもしれない。しかし、それらの障害はいずれ解決していくであろう事項だ。今後ともSIGGRAPHの見据える、新しい映像技術を応援し、現場で活用できる日に期待しよう。

論文紹介

■Inverse-Foley Animation: Synchronizing rigid-body motions to sound

録音された落下音から逆算して、その音を出すような剛体シミュレーションを行うもの。カランコロンという音に合わせて、カランコロンと音の発生する缶が落ちる動きのCGを作成できる。旧来、CG映像の落下音に合わせて、効果音を生成することは行われていたが、それとは逆の発想。ゲーム中の効果音などで実際の物音を録音したものを用い、その音に合わせたCGが必要な場合などに重宝する手法。応用例として、ダンス音楽を入力として、それっぽいアニメーションが生成されるなども。事前に計算した大量の動きをデータベースとして持っていて、その中から抽出して利用している。
http://www.cs.cornell.edu/Projects/Sound/ifa/

■Eyeglasses-free Display:Towards Correcting Visual Aberrations with Computational Light Field Displays

近視や老眼など、目の悪い人でもピントの合う映像が映し出されるディスプレイの研究。MATLIBという数値演算ライブラリ用のサンプル実装が公開されている。現在はRetinaディスプレイ搭載のiPod touchで試作を進めているとのこと。
http://graphics.berkeley.edu/papers/Huang-EFD-2014-08/index.html

■3D Object Manipulation in a Single Image using Stock 3D Models

風景写真の中の物体を切り取って補間し、三次元的に動かす技術。写真の中の椅子を取り出して、自由な方向に再配置できる。写真の中のライティングを推定し3Dモデルを動きに応じて再度照明を計算して描画している。サンプル実装のソースコードも公開。従来手法よりも、リアルで、移動や回転の際の自由度が高く、合成後の違和感も無い。にわかに信じがたいかもしれないが、実際に動作するMac OS X用のアプリとソースコードが公開されている。
http://www.cs.cmu.edu/~nkholgad/om3d.html

■Exposing Photo Manipulation from Shading and Shadows
siggraph2014_02_ExposingPhoto-02

写真の陰影から本物か合成写真かを見分ける技術。屋外(日光)の写真にのみ適応できる。
http://graphics.berkeley.edu/papers/Kee-EPM-2014-XX/index.html


■Painting-to-3D Model Alignment Via Discriminative Visual Elements

ある絵画に描かれている風景や建築物などから、その絵がどこでどの方向から描かれたのか、ロケ地を正確に割り出す技術。事前情報を大量に入力し、機械学習することで、絵画の描画場所を識別。ソースコード公開あり。
http://www.di.ens.fr/willow/research/painting_to_3d/

■Simulating and compensating changes in appearance between day and night vision

スマートフォンなど、暗い部屋で液晶画面を見ている時と、明るい部屋で液晶画面を見ている時の色合いが正確に見えるよう、最適なコントラストに自動調整する技術。20代の人と、80代の人とで目の良さが異なる部分の調整も行う。
http://luminance-retargeting.bangor.ac.uk/

■Style Transfer for Headshot Portraits

ポートレート写真を、雰囲気のある写真に修正。他者のポートレート写真を入力写真とし、自分のポートレート写真の画質や雰囲気を入力写真に合わせて自動修正することができる。例えばオバマ大統領風の写真、Facebookのザッカーバーグ風の写真などの修正ができる技術。ソースコードとサンプルとして使えるポートレート写真データが公開されている。
http://people.csail.mit.edu/yichangshih/portrait_web/

■Transient Attributes for High-Level Understanding and Editing of Outdoor Scenes

特定のある風景シーンに対して、様々な季節の風景を自動生成する技術。ネット上にある風景写真を機械学習し利用している。春風の色合い、冬風色合いなど、実際にはその季節の風景を撮影していないところでも、ピクセルの色変換を自動計算し、四季の写真、独特のライティングの写真が自由自在に作成できる。Web上で実際に試してみることのできるサービスが公開されている。
http://transattr.cs.brown.edu/

txt: 安藤幸央 構成:編集部


Vol.01 [SIGGRAPH 2014] Vol.03