音声認識チームのソフトウェアエンジニアの西岡 @ysk24ok です。
弊社では音声認識エンジンを開発しており、これまでChainerを使って音声認識モデルの訓練・精度評価をおこなってきましたが、Chainer v7を最後に開発がストップすることが発表されたため、今回ChainerからPyTorchへの移行をおこないました。
本記事では、移行にあたってぶつかった問題や工夫した点について紹介します。
- 音声認識エンジンのシステム構成
- PyTorch移行にあたってぶつかった問題
- 問題1: LSTMが受け取る入力の仕様の違い
- 問題2: PyTorchではモデルをhdf5形式で保存できない
- 問題3: LSTMのパラメータの持ち方がChainerとPyTorchで異なる
- まとめ