• ベストアンサー

ボーカロイドのサンプリングの精度について

はじめまして。 初音ミクなどのボーカロイドについて質問いたします。 ああいうものは、どれくらいのサンプルをとっているか、ご存じの方は教えて下さい。 50音などの音を、ある一定の音程でサンプリングして、長音や音程は加工しているのでしょうか。 DTMなどでも、ソフトの要領を軽くするために、サンプリングの精度は低いと聞きます。 長音はループで、音程は周波数を変化させることで対応していると聞いてます。 ミクなどのボーカロイドも同じなのでしょうか。 初歩的な質問ですみません。 ご存じの方、よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • bardfish
  • ベストアンサー率28% (5029/17766)
回答No.2

VOCALOIDはヤマハが開発した技術です。 初音ミクは声優さんがアニメに声を当てるように用意された原稿を読み上げて録音したそうです。原稿は当日スタジオで渡されたそうで、スタジオでの録音は数時間程度。 その後、VOCALOIDデータベースへの登録作業で数週間かかっているようです。コレは鏡音リン・レンのリリース直前のニュース記事で知りました。 声優さんの肉声は基本的には母音と子音で、その他VOCALOIDの特徴でもあるブレスなどエフェクトに関する部分もサンプリングしていると思います。その為短い文章や意味のない単語の羅列を発声していたらしい…データベース構築のためには必要な羅列なのでしょうけど、その部分はノウハウと言うことで。 そしてVSTi DLLで指定された音階に合わせて周波数変調したりエフェクト指定を合成しているのでしょう。 この部分がYAMAHAが開発したコア技術だと思います。 ベース技術はFM音源ではなくPCM音源でしょう。 最近のパソコンの処理能力はデジタルPCM音源シンセサイザー以上ですから編集画面でのリアルタイム再生も可能になっています。

その他の回答 (1)

  • SAYKA
  • ベストアンサー率34% (944/2776)
回答No.1

およそ その認識で大丈夫だよ ただvocaloidエンジン自体は仕様がすぐ見あたらないからそこの部分は企業秘密の技術なんじゃないかな。 実際には50の音では ない筈だけど その辺りもナイショの仕掛けだろうね。 発音原理としてはシンセサイザと同じような感じでアタックだけサンプリングで残りはFM波でそれっぽく伸ばす、というのをやっているんだけど vocaloidも近い事をしている可能性があるね。 例えば「らー」というのを「r」あるいは「l」の音(シンセのサンプル音に相当)で開始して「あー」という基本(母音と呼ばれるアレ)の音(ループ可能な調整をしておく)を出して「らー」に聞こえさせる という仕掛け なんかが考えられるね。 勿論、より綺麗に聞こえるようにするための仕掛けがいくつかあるけれど、そここそがエンジンの肝だから詳しくは多分調べても出てこないかもしれない。 考えつく仕掛けを書いてあるだけだから、実際全く違うって可能性もないわけじゃない

関連するQ&A