2022-04-06から1日間の記事一覧

Transformerモデルの高速化

ONNX Runtimeのニューラルネットワークの推論をTensorRTやOpenVINOなどのライブラリを通じて高速化できるか実験しています。