氏名: 清沢尚玄 (l0251624)

論文題目: PNDMを用いた話者認識


論文概要

ベクトル量子化(VQ)は音声符号化の分野でよく用いられているが、これを話者認識に用いた場合においても高い認識率が得られることが今までの多くの研究で知られている。認識系において重要なことの一つに距離尺度の問題があり、VQを用いた話者認識ではケプストラムの各次数毎に、その次数のケプストラムの統計的な分散の逆数を掛けて適切な重みづけを施した重みつけ距離がよく用いられている。しかしながら、もし特徴空間内の各パーティションに対しケプストラムがそれぞれ違ったばらつきをしていれば、上記のような全てのパーティションに対し同じ分散を用いるのは適切でなく、各パーティション毎にそれぞれ異なった重みつけを施す必要がある。この重みつけ距離尺度はPNDM(Partition-Normalized Distance Measure)と呼ばれる。今回は、PNDMを用いた話者認識実験を行い、VQの仕組み・話者毎またはパーティション毎の特徴パラメータのばらつきの違い・距離尺度が認識率に及ぼす影響について学習した。
目次に戻る