音声認識
ESPnet Model Zoo を利用して、学習済みを用いて音声認識をやってみる記事です。
ESPnet上のCTC Segmentationについて紹介します。
レトリバのリサーチャーが、先日オンラインで開催された音響学会の研究発表会の参加報告と一部の発表の紹介をします。
OpenFSTというライブラリにおけるN-shortest path 探索アルゴリズムを紹介します
レトリバに2020年度入社した社員の修士論文について簡単に解説します。 音声信号処理を用いて発話訓練のための音素認識を行う研究の紹介です。
今回は、音声分析ソフトウェアのPraatと、Praatで読み込んだり保存できる音声のアノテーションフォーマットTextGrid形式について紹介したいと思います。おまけとして、TextGrid形式のファイルを読み書きするライブラリ [textgrid.hpp](https://github.com/ei…