2022-12-01から1日間の記事一覧

DeepSpeed Compressionを使ってtask-specific BERTを蒸留してみた

ニューラルネットワークモデルの軽量化や推論高速化手法として、蒸留を利用した小さいモデル作成が挙げられます。 今回はtask-specific BERTの蒸留をDeepSpeed Compressionで試してみようと思います。