音声認識
レトリバのリサーチャーが非技術者向けに音声認識について解説します。
音響学会2022年春季研究発表会で気になった音声認識分野の発表を紹介します
End-to-End音声認識で用いられるCTC誤差関数について解説する記事の後編です。
レトリバのリサーチャーが、先日オンラインで開催された音響学会の研究発表会の参加報告と一部の発表の紹介をします。
End-to-End音声認識で用いられるCTC誤差関数について解説する記事の前編です。
ESPnetを用いて音声認識の学習と評価を試します。評価結果の見方についても解説します。
微分可能重み付き有限状態トランスデューサー(Differentiable Weighted Finite-State Transducers)の紹介をします。
ESPnet Model Zoo を利用して、学習済みを用いて音声認識をやってみる記事です。
ESPnet上のCTC Segmentationについて紹介します。
レトリバのリサーチャーが、先日オンラインで開催された音響学会の研究発表会の参加報告と一部の発表の紹介をします。
OpenFSTというライブラリにおけるN-shortest path 探索アルゴリズムを紹介します
レトリバに2020年度入社した社員の修士論文について簡単に解説します。 音声信号処理を用いて発話訓練のための音素認識を行う研究の紹介です。
今回は、音声分析ソフトウェアのPraatと、Praatで読み込んだり保存できる音声のアノテーションフォーマットTextGrid形式について紹介したいと思います。おまけとして、TextGrid形式のファイルを読み書きするライブラリ [textgrid.hpp](https://github.com/ei…