akira_youの私見: gtalkについて

2005年2月3日木曜日

今日わかったこと


文章{
呼気段落{
アクセント句{
アクセント型
疑問計であるか？
mora{
品詞ID
活用形ID
活用型ID
音素[]
}[]
}[]
}[]
}

という構造のデータ（ちなみに［］は配列を意味する）どうにかして作る。

という作業のぶぶんがすげーコード的にいけてない。

ちなみに、このデータは、音素列とそれに不可するアクセントの系列と

おもってもらえればいい。

でこの系列データをのうちの一つの音素をつくるときには、

まずその音素を中心にしてトライグラムデータを作る

次に、話者モデルとして与えられているデータのうちtree*.infというファイル

をみて、自分のトライグラムがあてはまるかYes/No形式のゲームブックみたいなのを

たどって、音響モデルIDをひろってくる

ちなみに、音響モデルは、音素継続長、とかメルケプストラム係数とか、f0周波数の

平均と分散がはいっている。

その音響モデル(HMM)から最尤なパスを推定して、平均と分散にすぎなかったもでるから

一本連続値となったケプストラムとかピッチの系列をGETする

でF0にケプストラムからつくられるMLSAフィルタにとおすと音ができあがり。

akira_youの私見