以下のアルゴリズムにいたく感心したので、取り合えずみんなで実験できるように実装してみた。
http://www.kurims.kyoto-u.ac.jp/~kyodo/kokyuroku/contents/pdf/0920-13.pdf
ソースは以下からダウンロードしてください。gcc4.2.1 @ FreeBSDでしか確認してないけれども、最近の標準C++なら実行できるはずです。
http://wiki.nicotech.jp/~akira/deconv_bin.tar.gz
実装してあるものは、近似多項式の割り算とGCD(最大公約数)演算です。最大公約数を求める問題や、多項式の除算は実は離散信号処理に重要な処理なのはわかるよね。
わかる人には。
P.S.
自分が今おもいつきで試行しようとしている実験の結果と共に公開かなーとも思ったけれども。諸般の事情で邪魔が入るかもしれないので、道具だけでも公開っす。
思いつきというのは、人間には発話内容に大して不変のフィルタが存在している可能性があるのではないかという仮説です。それがわかって何になるというのはあるかもしれませんが、その発話内容に依存しない個人特有のフィルタ部分を標準形に変換すれば、多少なりとも音声認識時などの情報量を落とせるだろうし、情報を落とせるということは圧縮にもつながる、逆に個性の色つけ程度にはならないかという甘い期待。
もちろん、誰かがそんな事は調べてる気もするんだよね。ただ、ちょっと自分の手で調べてみたいなぁと。
0 件のコメント:
コメントを投稿