クリアな音質で録音するためにできること7選

記事
音声・音楽
いつもお世話になっております。
もしくはこれからお世話になります。

私は「元作曲家」というアドバンテージを活かし、
「聞き取りづらい音声でも対応可能」という触れ込みで
文字起こしを承っております。

しかし、たとえ高額な補正ソフトを複数所持していたとしても
すべての音声を綺麗に復元できるわけではありません。
90%のノイズから10%の音声を抽出することは至難の業です。
最初から綺麗に録音できるのなら、それに越したことはありません。

そこで今日は、約1000件の文字起こし実績がある私が、
その経験をもとに、最適な録音方法を分析・考察してみました。
一部、非常に高度な内容も含まれておりますが
なるべく明日からすぐに使えるよう噛み砕いておりますので
ぜひ参考にしてみてください。

【基本編】 

まずは基本編が4つです。
たとえ専門知識がなくても、ちょっとの工夫でできることなので、
ぜひ意識して取り入れてみてください!

①レコーダーは発言者の近くに置く

「それができりゃ苦労しねぇわ」という声が聞こえてきそうですが
これさえ解決すれば以下の内容すべて読まなくてもいいレベルなので
とりあえず最初に書かせてもらいました。

距離が離れると、当然ですが音量が小さくなります。
「じゃあ文字起こしするときに音量を上げればいいのでは?」
と思われがちですが、実はそんな単純な問題ではないのです。

単に音量が下がるだけではなく、以下のような現象が発生します。
・声の大きさ対して、ノイズや反響音の比率が相対的に高くなる
・高い周波数から減衰していくため、言葉の子音が失わる
・くぐもった声になるため、発言者の特定がしづらくなる

とは言え、やはりレコーダーを近くに置けない事情はあると思います。
訴訟用の証拠音声のため、録音していることを悟られたくない場合。
あるいは多人数の議事録・座談会などでは、置き場所に困りますよね。
その場合は、以下の内容を熟読して、可能な限り環境を整えていきましょう!

②空調などの電子機器などは停止させる

ノイズの代表的な原因の一つが、空調などの電子機器です。
ずっと一定音量で「ブーーー」とか「サーーー」とか鳴っていますよね。
レコーダーは、こういう音をよく拾います。

空調機の他にも、冷蔵庫などの家電製品や
パソコン内部のファンの音なども含まれます。
これらを止めるのが難しい場合は、なるべく距離を取ってください。

とは言え、この手のノイズは音質補正で処理がしやすいです!
多少のレベルでしたら無料で対応いたしますので、ぜひご相談ください。

③録音に不向きな場所は避ける

録音に向いてない場所は、だいたい以下の3パターンに分類されます。
・音が反響しやすい場所(体育館、ホールなど)
・多くの人が会話している場所(喫茶店、人混みなど)
・不規則な雑音が入る場所(路上、工場の中、テレビの近くなど)

レコーダーというのは「空間の音」をよく拾います。
反響音、他人の会話、エンジン音など、すべからく録音の邪魔になります。
そういった「空間の音」をなるべく排除した場所を選ぶのがポイントです。

インタビューや打ち合わせでは喫茶店が選ばれがちですが
他のお客さんの話し声や、店内BGMを拾ってしまうため、
文字起こしという観点から言えばだいぶ悪手です。
これらの音はノイズ処理が非常に難しく、
思うような結果にならないことがほとんどです。

なので、なるべく音が反射せず、人がいない場所を選ぶようにしましょう。
吸音材が敷き詰められていて、あまり広すぎない部屋が理想的です。
もし可能であれば、音楽練習用のスタジオで、
備え付けのマイクを使うのが最高だと思っています(値段も安い)

④遮蔽物を無くす(マスクを外す/ポッケに入れない)

音が物体にぶつかると、まず高周波数の音から減衰していくため、
「ボーボー」とした低音部分だけが残ってしまいます。
そうすると、「音」は聞こえても「言葉」が聞き取れなくなってしまいます。

特にカ行、サ行、タ行の主な周波数帯は5000~8000Hzと高いので
遮蔽物が多いほど、子音がどんどん削られてしまいます。

具体的なシチュエーションとしては、
「カバンやポッケにレコーダーを入れてしまう」
「マスクをかけたまま会話してしまう」などがこれにあたります。

ただ、マスクに関しては、ご時世的にはまだ外しにくいと思いますので
例えばインタビュイーの1名に絞って外すとか、
オンライン会議にするなどでうまく工夫してみてください!


【上級者編】

正直かなり高度な内容ですが、
一度覚えてしまえばあらゆる録音の機会で活用できるので
ぜひ押さえておきたいポイントです!

⑤ステレオで録音しよう!モノラルはNG

ステレオとは、左右の位置関係をそのまま録音するものです。
モノラルとは、左右の音量を均一にして真ん中にしてしまうものです。
これ、結構重要です。

モノラルの何がいけないかというと、声も、反射音も、ノイズも、
何もかも全部ごっちゃになってしまうことです。

例えば、部屋の左端にいる人が発言した場合を考えてみましょう。
真ん中に置いてあるレコーダーには、以下の順番で音声が届きます。
①最初にその人の声が届きます。
②わずかに遅れて左側の壁からの反射音が届きます。
③そのあと、右側からの反射音が入ります。

このように、声→反射音の順番で録音されるのですが
モノラルの場合、全部いっしょくたに真ん中にされてしまいます。
通常、このような音の聞こえ方は自然界には存在しないので、
聞き取る方も非常に苦労します。

さらに、位置関係がなくなることで、発言者の特定が非常に難しくなります。
もし声質の似ている人がいたとしても、ステレオ録音ならば
「左に居る人」「右に居る人」というように位置関係で把握できます。
しかし、モノラルだと判別はほぼ不可能になります。

⑥レコーダーの「指向性」を理解しよう!

指向性とは「音を拾いやすい方向」を意味します。
大きく分けて「単一指向性」「全指向性」の2つに分類されます。

・単一指向性
マイクを向けている方の音をメインに拾うようにできています。
インタビューなどで特定の1名だけをクリアに拾いたい場合にオススメです。
しかし、反対方向や、距離が遠い人の声は聞き取りづらくなるのが難点です。
・全指向性(無指向性)
全ての方角からの音を均等に拾うようにできています。
会議や座談会など、多人数の録音に向いていますが、
その分ノイズも全方向から拾ってしまうのが難点です。

このように、音の拾い方がまったく異なるので、
レコーダーの指向性を意識したうえで、
置き場所や方向を調整してみてください。

例えば、「多人数の会議を録音したいのに単一指向性しか持っていない」
という場合は、レコーダーを部屋の真ん中に置くのではなく、
参加者全員がマイク側に入るような角度で置いてください。
逆に、無指向性のマイクであれば真ん中で大丈夫です。

⑦サンプリング周波数44,100Hz以上 ビットレート128kbps以上

めちゃくちゃ難しい話ですみません。
サンプリング周波数とは、1秒間に記録(録音)する回数、
ビットレートとは、1秒間に処理できるデータの総量を表しています。

少々ややこしいのですが、
「mp3(m4a)」「wav」で表記方法が変わります。

mp3(m4a)の場合は、タイトルにあるように
44,100Hz、128kbps以上という数字を覚えておいてください。
wavの場合は、44,100Hz、16bit以上、
もしくは1411kbpsという数字を覚えておいてください。

よくわかんなーいっていう人は
とりあえず数字をデカくしておけば音質が良くなります。
私も正直、原理を深くは理解しておらず、数字で覚えちゃっています。

ちなみに、数字がデカいほどファイル容量も大きくなるので、
残り容量には気を付けてください。
まあ1~2時間程度の録音で容量不足になることはまずないと思いますが、
もし気になるなら、wavよりmp3のほうが軽いのでオススメです。

mp3は人間の耳にとって不必要な部分をカットして軽くしているので、
超厳密に言えば音質は低いですが、
人間の耳で聞く分にはまったく問題ありません。

あとがき

以上、長々と書いてしまいましたが、
これらすべてをいきなり取り入れるのはだいぶ難しいと思います。
でも、どれか一つだけでも意識すれば、だいぶ変わります。

私の主観では「反響しない場所」と「ステレオ録音」を守っていれば
多少のノイズが乗っていても大体対処できます。

もし、それでも、
「録音に失敗してしまった」
「聞き取りづらい環境でセッティングしてしまった」
そんなときでも私はあなたの味方です。
できる限り手を尽くして文字起こしさせていただきますので、
ぜひご相談いただければ幸いです。

※なお、この記事は「文字起こしをする立場」の者がまとめています。
実際にレコーダーを使って録音実験をしたわけではなく、
あくまで1000件近くの文字起こしをした実績と、
作曲家時代に培った知識を総動員して執筆しているに過ぎません。
もし間違ったことを言っていたら、こっそり教えてください。


サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す