映像クリエイターが知るべき録音術

YouTubeなどで収益化を図る上で、結局のところは何を喋っているのかがアクセス数に大きく影響する。

今回はスイッチャーを使った自宅収録における音のクオリティー向上のテクニックを解説する。

今回の内容に則したYouTube動画。実際の音声などをお聞きいただきたい

この連載の開始と同時期に「桜風涼の映像録音テクニック」というチャンネルを立ち上げたが、7ヶ月半でやっと再生時間が4000時間をクリアし、そして登録者数がもう少しで1000人となる。

このチャンネルだが、メイン機材はローランドのV-1HD+である。これはクロマ合成のできるビデオスイッチャーで、音響メーカーのローランドの製品らしく、音の機能が非常に優れているのが特徴だ。Blackmagic DesignのATEMはUSBでパソコンなどに繋ぐだけで様々な配信ができる配信スイッチャーであるのに比べて、V-1HD+は純粋なビデオスイッチャー(出力がHDMI)である。配信に使うには、別途にUSBビデオキャプチャーユニット等が必要になるが、市価で2000円程度の製品で十分なので、配信にこの製品を使うことももちろん可能である。

さて、今回は、このV-1HD+を例にして、配信やYouTubeでの最適でかつ高音質な声について解説する。V-1HD+で解説するのだが、ATEMや他の配信機器やアプリでも考え方は同じなので、適宜ご自分の機材に読み替えていただければ幸いだ。

最適な音量はどう設定するのか?

まず、自宅やオフィスから配信する場合の音の設定の基本を解説したい。最初に音量とオーディオメーターについてを説明しよう。

配信に限らず、ビデオ収録でも音量をどの程度にするのか、プロのカメラマンでもよく分からないという声を多く耳にする。テレビ局の技術者であって、なんとなく、そのくらいという人も少なくない。

まず、レベルメーターの読み方だが、レベルメーターは大きく分けてVUメーターとピークメーターがある。VUメーターは平均音圧(音量)を測るメーターで、スタジオや放送局では、このメーターを使うことが多い。しかし、デジタル機器では、このVUではなくピークメーター(最大音量メーター)というものが使われることが主流だ。特に、デジタルデータ(MP4や配信データ)は平均音圧よりもピークレベルを重視するので、こちらのピークメーターを使うのがベターなのだ。

それゆえに、YouTubeでもその他のライブ配信でも、基本的にはピークメーターを使ってレベル調整を行うことになる。また、Premiereなどの編集アプリの音声波形は、このピークメーターの値をグラフにしている。

それゆえ、基本的にはピークメーターの読み方さえ分かれば、綺麗に音が録れる。ところが、YouTubeでも音が大きい人もいれば小さい人もいる。実はピークメーターでは、大きな音で音が壊れることを回避することはできるが、聞きやすい音をメーターから読み取るのは難しいので、なかなか適正音量を作り出しにくいのだ。

ちなみに、VUメーターは平均音圧を示すので、このメーターを使うと聞きやすい音が作り出しやすい。ただ、いずれにせよ、VUメーターを搭載している機器はほとんどないので、ここではピークメーターを使って音量を調整する方法を解説したい。

配信・YouTubeは-6dBを目指せ!

ピークメーターは最大値が0dBで、音が小さくなるほどマイナスの値が大きくなる。なぜ、最大値が0dBになるのかわかりにくいかもしれない。細かい解説は省くが、音割れする境界線が0dBで、それよりもどれだけ小さな音かを示すのがピークメーターだと思っていただくといい。

ちなみに、人間の耳で聞いて、ちょっと音量が下がったかな、と思えるのが3dB程度。はっきり音が小さくなったと思えるのがその2倍の6dB程度。さらに12dB違うと、大声と小声くらいの差に感じる。

さて、YouTubeなどのネット用の映像で録音する場合、ピークメーターが-6dB前後にメーターが振れるようにボリュームを調整する。これが基本だ。メーターに数値が書いてない場合には、基準のライン(-12dB)よりちょっと上に出る程度だ。

右下の小さなメーターが音量メーター。他の製品やアプリでも同様なメーターがある。常に黄色が点灯する程度にボリューム調整を行う

ここで、V-1HD+の画面で見てみよう。V-1HD+のコントール画面には音量メーターが表示される。プログラム画面(出力映像)の横に、最終的な音量メーターがあり、色分けされている。緑・黄・赤の三段だ。

さて、実際の調整だが、黄色がいつも見えている程度に合わせる(ネット配信向け)。ちなみに、色分けは、-12dB以下が緑、-12dB~-3dBが黄色、それ以上が赤で表示される。これはほぼ業界標準なので、カメラやミキサーでも同じ色分けだ。

この色分けには意味があって、-12dBというのがテレビなどの放送基準のピークだ。かつての放送基準では-12dBを超えると事故になる危険性があったので、-12dBを超えると警告として黄色にしているようだ。ただし、前述したが、ピークメーターは適正な音量を示すのが苦手なので、絶対に黄色になってはいけないとか、赤になってはいけないというものでもない。黄色の警告色を見て、危ないと思って音を下げすぎてしまう人も多い。ただ。前述のように-12dBは放送基準であり、ネット用ではちょっと音が小さい。ネットでは、放送よりも6dB大きい-6dBを基準に調整する。こうすることで、配信した時に、相手に丁度いい音の大きさで聞こえる。

ライブ配信では、その場で音の最適化を行わなければならない

メーターの見方がわかったところで、実際にライブ配信する場合の音質調整についてを解説したい。

ライブ配信の場合、持っている機器の音質調整を完璧に行わなければならない。音質調整の方法は2種類あって、スイッチャーかミキサーの音質調整機能で最適化するケースと、OBS(パソコン用の多機能配信アプリ)などを介してパソコンで音質を整える方法がある。後者は非常に柔軟性がある一方で、パソコンのパワーに依存してしまう。配信と音質調整(必要なら画質調整や合成)まで同時に行わせると、配信が途中で止まってしまうなど、デメリットもある。

筆者の場合、いろいろなことができるという多機能であることよりも、安定して高音質・高画質で配信(もしくは収録)することに重きを置いているので、前述したようにローランドのV-1HD+で画質調整から音質調整まで行っている。

音質調整の前にマイク選びとセッティングの確認

音質調整には、いくつかのポイントがある。まず、マイク選びとマイクセッティングだ。理屈やノウハウは筆者の連載を参照していただくのがいいのだが、簡単にまとめると、出演者がトークする形式の配信や収録では、基本的にはダイナミックマイクの使用をお勧めしたい。コンデンサーマイクは高感度すぎて周囲の環境音の影響が大きくなるからだ。ダイナミックマイクは、人の声を収録することに特化した設計になっているものがあり、それを使うべきなのだ。

ダイナミックマイクも大きく分けて2種類あって、1つは広いエリアの音を取れる無指向性、もう1つはカーディオイド方式などの単一指向性マイクだ。無指向性マイクの代表はインタビューマイクで、SHUREのSM63Lだ。記者会見などで突き出される銀色のマイクである。

「SHURE SM63L」。インタビューの定番マイク。周囲がうるさくても良好な声を録れる。低音が少ないため軽い声になるが、非常に聞き取りやすい声になるのが特徴だ

もう1つ紹介すると、トーク番組で使いやすくて比較的安価なのがSHUREのSM58(ボーカルマイク)。カーディオイド方式の単一指向性で、背後の音を拾いにくい構造になっている。ラジオなどで対面してトークする場合に威力を発揮する。

「SHURESM58」。定番のボーカルマイクだが、FMラジオなどでも使用されている。ナレーションのような高品質な声も録れる。非常に扱いやすいマイクだ

自宅収録であれば、このSM58を持っていると、非常に楽にいい声が得られるだろう。使い方も簡単で、マイクから10cm以上離れないようにして喋ればいい。最適な距離は5cm程度だ。ただし、画面にマイクが映り込む。マイクの写り込みが嫌な場合には、ショットガンタイプのコンデンサーマイクを使う必要が出てくるが、環境音や残響に悩まされるので、筆者としてはお勧めしない。

さて、もう1つが狭指向性ダイナミックマイクで、エアコンや生活音が邪魔な部屋で使うのに適したものだ。1つはSHURE BETA58Aボーカルマイクだ。先程のSM58の兄弟マイクで、こちらはより狭い指向性を持っていて、テレビなどが点いている部屋でも人の声を大きく録れる優れたマイクだ。どんな部屋でもスタジオのような声になるので、お勧めしたい。ただし、マイクの真正面以外は急激に音が小さく遠く聞こえるので、喋り方が難しくなる。顔を動かすと音質が変わってしまうのだ。

「SHURE BETA58A」。SM58の兄弟マイクで、指向性が非常に狭い特性を持っている。残響や環境ノイズに強い。ただし、口の正面5cm程度がベストで、ちょっとでも外れると音質が変わってしまう。ベストポジションの時の声は、数十万円のナレーションマイクと間違われるほど高音質だ

もう1つ、高価なショットガンマイクだがゼンハイザーのMKE600を使うのも手段の1つだ。ただし、ショットガンマイクは環境音や残響の影響を強く受ける。ボリュームを絞っておボーカルマイクのように口の前5cm程度で喋ればかなり周囲の音は消えるが、低音が強くなったりとなかなか難しい。画面の外から録音する場合には、スタンドを使って頭上から下に向けて使うのがベターだが、面倒くさいことは事実なので、筆者は、前述のダイナムックマイクをお勧めする。

音質調整のポイントはここ

さて、マイク選びとセッティングがうまくいっているとして、次に音質調整を行う。ポイントは、使うマイクに応じた「ゲイン(トリム)調整」、喋りに応じた微調整のための「フェーダー調整」、環境音を積極的にカットする「ノイズゲートの活用」だ。この3つは必ずやった方がいい。

マイクゲイン(V-1HD+ではAnalog Gain)は、マイク感度に合わせて調整する。ダイナミックマイクの場合には、-50dB~-60dB程度、コンデンサーマイクの場合は-25dB~-36dB程度になる。マイクごとに異なる。 この時、フェーダー(V-1HD+ではInput Gain)を0dBにして、メーターと耳で確認しながら調整しよう。普通に喋って-6dB程度になるように調整する(ネット配信の場合)。

まずゲイン調整だが、これはマイクの製品ごとに調整値が異なる。マイクの性能表を見ると感度というのがある。色々な書き方があるのだが、多くの場合「-28dB」と書いてある。これは基準の音量(0dB)をマイクに与えた場合に、出力される音量がいくつになるかという数値だ。レンズの開放絞り値と同じで、この数値が小さいほど感度が高い。コンデンサーマイクの場合は-30dB前後。ダイナミックマイクの場合には-60dB前後になる。

さて、実際の調整方法を解説する。まず、ゲインを調整する前に、フェーダー(出力ボリューム:V-1HD+ではINPUT GAIN)を最大から8分目あたりにある「0dB」に合わせておく。詳細は後に解説する。

そして、ゲインは先程のマイク感度に応じて設定する。例えばダイナミックマイクを使った場合には、ゲインを60dBにすると普通の声(0dB程度)が音量メーターで0dB付近になる。つまり、ゲインはマイク感度の低さ分を元に戻す機能なのだ。ここで思い出して欲しいのは、適正音量はネット向けの場合には-6dBを目指す。ということは、ダイナミックマイクの場合にはゲインを50dB~54dB程度にすると、普通の喋りが-6dB程度になるはずだ。

さて、一般的な解説では、このゲイン(トリム)は音割れするちょっと前に設定すれば良い、と書かれていることが多い。音割れする直前というのは、実は-6dB程度になるようにする、ということと同じ意味なのだ。しかし、ちゃんとした音量メーターがあるなら、そんな適当な合わせ方ではなく、マイク感度に応じてゲインを調整した方が、結果的には良い音になるというか、ちょうどいいゲインにしてそれに応じた喋り方をする方が綺麗な音になる、と考えるべきだ。

次にフェーダー調整だが、これは出力(配信)音量の調整だ。実は、先程のトリム(マイクボリューム)が正しく調整されていれば、フェーダーは最大から8分目あたりにある「0dB」にする。つまり、出力時のボリュームはゼロで、増幅も減衰もさせないのが理想だ。このフェーダーは、本番での微調整やミュート用だ。つまり、ゲインが最適になっていれば、フェーダー0dBでちょうど良い音量になるはずだ。しかし、実際には出演者が乗ってくると声が大きくなるし、自信のない話題では声が小さくなる。

トリムとフェーダーになぜ分かれているのかというのかは、実はミキサーでの内部処理に関わる話なので割愛することにするが、トリムが適正に調整されていれば、複数のマイクを使った時に、全てのフェーダーが0dbに並ぶ。仮に、一度フェーダーを最小にして(ミュートして)、元に戻す時には0dbにすればいいだけだが、もしトリムで同じことをやろうとしたら、マイクそれぞれの設定値を覚えておいて、そこに戻さなければならなくなる。これは面倒だし事故のもとだ。

ノイズゲートを使いこなせ

ノイズゲートは、環境ノイズが聞こえなく値(SHRESHOLD)を見つけるのコツ。通常は-40dB程度になるだろう。RELEASEは、誰かに喋ってもらい、言葉の語尾がぶつ切れにならない最小値に設定する。通常は50ms~200ms程度だろう

さて、トリムとフェーダーが調整できたら、ノイズゲートの調整をしよう。今回紹介しているのはローランドのV-1HD+なのだが、他社のスイッチャーでもノイズゲートがあれば活用してみてほしい。

ノイズゲートとは、入ってきた音が、ある設定値より低い場合にはボリュームを遮断し、設定値を超えたら音を通すフィルターのことだ。V-1HD+の調整項目は「THRESHOLD(閾値)」「RELEASE(開放時間)」で、THRESHOLDが先程の音を通すか通さないかの音量で、これは環境音に合わせて調整する。マイクをセッティングし、前述のようにゲインとフェーダーを調整したのち、何もしゃべらない状態でTHRESHOLDを下げていく。THRESHOLDが環境音の音量と同じになると環境音が聞こえてくる。そこからTHRESHOLDを3~6dBほど上げる。THRESHOLDを上げると環境音が消えるはずだ。

次にRELEASEだが、これはノイズゲートを使った時の違和感を減らすための機能で、声の余韻に大きく影響する。RELEASEを短くすると声の語尾がぶつ切れになって違和感が生じる。逆に長すぎると、語尾の後ろに環境音が混じって音質が悪く聞こえる。環境音が小さければRELEASEは長めでも違和感がないが、環境音が大きいと、言葉の後ろに環境音が聞こえてしまう。そこで、実際には聴きながらなるべく小さな値に調整する。V-1HD+の場合、RELEASEは50~200ms程度が良いようだ。

詳しくは、YouTubeでサンプル音声付きで解説しているのでご参照いただきたい。

まとめ

配信やYouTubeの録画の場合、音はその場で完成した音量と音質にしたい。そのためには、配信機器の音声機能をうまく使うべきだ。きちんと調整できてしまうと、ライブ配信はもちろん、編集して公開するYouTubeは作業時間を圧倒的に短くすることができるし、最適な音量と音質は登録者数(フォロワー)を増やす原動力になる

詳しくは、筆者(筆名:桜風涼)のYouTubeでサンプル付きで解説しているので、参照いただければ幸いだ。

WRITER PROFILE

渡辺健一

渡辺健一

録音技師・テクニカルライター。元週刊誌記者から、現在は映画の録音やMAを生業。撮影や録音技術をわかりやすく解説。近著は「録音ハンドブック(玄光社)」。ペンネームに桜風涼も。