スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

HTS-demoによる自作音響モデルの作り方 その1

MMDAgentは音響モデル以外はmeiをミクさんに変えて背景の色を変えただけなので、シナリオは初期設定のままです。

上の動画の詳しい解説みたいなもの
HTS-demo_NIT-ATR503-M001が動くことが前提です。
動かん人は前の記事見るなりぐぐってください。
ちなみにOSはlinuxのFedora15を使ってます。
あと音声データ収録にはwindows vistaを使ってます。

ではHTS-demo_NIT-ATR503-M001でデモ音響モデルができた人は、自作音響モデルを構築する準備をします。

1-1.音声データ
 音声データを準備します。大切なのは録音の内容とデータの形式です。HTS-demo_NIT-ATR503-M001ではATR503という503個の決められた文が用いられているため、それを使います。また、ATR503には1文ずつ番号がついているため、その番号をそのまま音声データ名に指定しています。(例:a01,a02,,,b01,,,j50)
データの形式はHTS-demo_NIT-ATR503-M001で読み取ることができるようにしなければならないので、48000Hzのモノラル(1ch)の16bitで録音します。

   ここでは動画で使用した音声データの手順を説明します。
   ①フリーの歌声合成ツールUTAUに喋りのプラグイン「花篭」を導入し、
     ATR503の文を入力してそこからVSQファイルを生成する。
   ②生成したVSQファイルをVOCALOID2 初音ミクに読み込ませて48000Hzでmonoなwavファイルを生成する。
   ③VOCALOID2から生成されたwavファイルは、はじめの無音区間が長いのでSoundEngine Freeを使って頭の無音区間だけを短くします。
   ④音声データの完成

  自分の声を使うんだったらSoundEngine Freeを使って48000Hz,16bit,1chで録音すればそれで終わります。

次はラベルデータの作成手順になります。
スポンサーサイト

コメントの投稿

非公開コメント

花篭によるVSQファイル生成について

こちらでは初めまして、ブリスターと申します。

花篭導入には成功したのですが、VSQ書き出し方法がわからないです。よろしかったら教えて頂けませんか?

Re:花篭によるVSQファイル生成について

わぁい。
コメントありがとうございます。返信が遅くなってしまってすみません。

UTAUのVSQファイルの書き出しですが、ファイル(F)のエクスポート(E)からファイルの種類をVSQ形式に変更することで出力できます。UTAU音源の音響データを構築する場合は、プロジェクト(P)のwavファイルを生成(G)から直接wavファイルを生成できます。
(作業量的な意味で)がんばってください。
検索フォーム
Twitter
@akihiro01051のツイート
リンク
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。