今日わかったこと
文章{
呼気段落{
アクセント句{
アクセント型
疑問計であるか?
mora{
品詞ID
活用形ID
活用型ID
音素[]
}[]
}[]
}[]
}
という構造のデータ(ちなみに[]は配列を意味する)どうにかして作る。
という作業のぶぶんがすげーコード的にいけてない。
ちなみに、このデータは、音素列とそれに不可するアクセントの系列と
おもってもらえればいい。
でこの系列データをのうちの一つの音素をつくるときには、
まずその音素を中心にしてトライグラムデータを作る
次に、話者モデルとして与えられているデータのうちtree*.infというファイル
をみて、自分のトライグラムがあてはまるかYes/No形式のゲームブックみたいなのを
たどって、音響モデルIDをひろってくる
ちなみに、音響モデルは、音素継続長、とかメルケプストラム係数とか、f0周波数の
平均と分散がはいっている。
その音響モデル(HMM)から最尤なパスを推定して、平均と分散にすぎなかったもでるから
一本連続値となったケプストラムとかピッチの系列をGETする
でF0にケプストラムからつくられるMLSAフィルタにとおすと音ができあがり。
0 件のコメント:
コメントを投稿