2005年2月3日木曜日

gtalkについて



今日わかったこと



文章{
呼気段落{
アクセント句{
アクセント型
疑問計であるか?
mora{
品詞ID
活用形ID
活用型ID
音素[]
}[]
}[]
}[]
}

という構造のデータ(ちなみに[]は配列を意味する)どうにかして作る。


という作業のぶぶんがすげーコード的にいけてない。


ちなみに、このデータは、音素列とそれに不可するアクセントの系列と


おもってもらえればいい。


でこの系列データをのうちの一つの音素をつくるときには、


まずその音素を中心にしてトライグラムデータを作る


次に、話者モデルとして与えられているデータのうちtree*.infというファイル


をみて、自分のトライグラムがあてはまるかYes/No形式のゲームブックみたいなのを


たどって、音響モデルIDをひろってくる





ちなみに、音響モデルは、音素継続長、とかメルケプストラム係数とか、f0周波数の


平均と分散がはいっている。


その音響モデル(HMM)から最尤なパスを推定して、平均と分散にすぎなかったもでるから


一本連続値となったケプストラムとかピッチの系列をGETする


でF0にケプストラムからつくられるMLSAフィルタにとおすと音ができあがり。





0 件のコメント:

コメントを投稿