事前学習モデルBARTを使って日本語文書要約をやってみた

こんにちは。 カスタマーサクセス部リサーチャーの勝又です。 私はレトリバで自然言語処理、とくに要約や文法誤り訂正に関する研究の最新動向の調査・キャッチアップなどを行っております。

今回の記事では、事前学習モデルであるBARTを使って日本語文書要約を行った話を紹介します。

続きを読む

ベロシティー導入までの道のりと効果

こんにちは、YOSHINA分析チームエンジニア兼スクラムマスターの野本です。分析AI「YOSHINA」の開発・運用を担当しているこのチームでは、生産性を維持・向上するために日々さまざまな取り組みを行っています。その取り組みの一つに「ベロシティーの導入」があり、最近良い効果が実感できてきたのでご紹介いたします。

続きを読む

日本語話し言葉BERTを作成、公開します!

こんにちは。 カスタマーサクセス部リサーチャーの勝又です。 私はレトリバで自然言語処理、とくに要約や文法誤り訂正に関する研究の最新動向の調査・キャッチアップなどを行っております。

今回の記事では、国立国語研究所様との共同研究で作成した日本語話し言葉BERTとその利用方法について紹介します。

続きを読む

ESPnet による音声認識入門 ~AN4データセットによる学習・評価~

こんにちは、製品企画部リサーチャーの古谷(@kk_fry_)です。 レトリバでは、主に音声認識の研究開発を行っています。

前回に引き続き、音声認識が実行できるオープンソースのツールキット ESPnet を触ってみる記事を書いていこうと思います。

前回は ESPnet Model Zoo を用いて、学習済みモデルを用いての推論を行いましたが、今回は ESPnet 本体を用いて音声認識の学習と評価をしてみたいと思います。

前回の最後に「学習済みモデルを用いた推論」と書きましたが、せっかくなので学習もやってみます。

続きを読む

検索の評価指標 その3

検索の評価指標

こんにちは。レトリバの飯田(@meshidenn)です。カスタマーサクセス部 研究チームのリーダーをしており、マネジメントや論文調査、受託のPOCを行なっています。

前回は、検索結果にグレードをつけられる場合の検索エンジンの評価についてご紹介しました。今回は、未評価データがある場合等の修正方法についてご紹介します。なお、以下の内容は酒井先生の書籍こちらの論文に記載されておりますので、詳細が気になる方は、こちらも読んでみてください。

続きを読む

AACL-IJCNLP2020で発表してきました

こんにちは。 カスタマーサクセス部リサーチャーの勝又です。

レトリバでは、研究動向・業界動向の把握のため、積極的に学会参加をしています。 先日開催された AACL-IJCNLP2020 にも参加、私が学生時代に行った研究について発表しました。 今回の記事ではAACL-IJCNLP2020での参加、発表報告をします。

続きを読む

ESPnet による音声認識入門 ~ESPnet Model Zoo 編~

こんにちは、製品企画部リサーチャーの古谷(@kk_fry_)です。 レトリバでは、主に音声認識の研究開発を行っています。

今回から、音声認識が実行できるオープンソースのツールキット ESPnet を触ってみる記事を書いていこうと思います。 私も初めて触ります。

初回は手始めに、学習済みモデルを用いた音声認識が手軽にできる ESPnet Model Zoo を試してみたいと思います。

OS は Ubuntu 18.04 、cuda バージョンは 11.0 で実行しています。

続きを読む

IBIS2020に参加しました

こんにちは。レトリバのリサーチャーの木村@big_wingです。 レトリバでは、研究動向・業界動向の把握のため、リサーチャーは積極的に国内学会に参加しています。 今回は第23回情報論的学習理論ワークショップ (IBIS2020)に参加しました。

概要

情報理論的学習理論ワークショップ (IBIS)は機械学習分野の国内最大規模の学会であり、毎年秋頃開催されています。 IBISは機械学習に関わる全般的なトピックを扱っており、学会の名前にあるような学習理論から実世界における応用的なものまでその発表内容は多岐にわたります。 また様々な分野の方が参加されるため人材交流にも力を入れており、特にプログラム委員長の「IBISの主役は学生さんです。」という言葉が印象に残っています。

今年はつくば国際会議場で開催予定でしたが、COVID-19の影響で完全オンライン形式での開催となりました。 すべての一般発表と一部の講演は事前に発表者が録画したものが期間中公開されており、セッション中は録画動画を流し、Slack上で質疑応答を行うという形式でした。 私はこのような形式のオンライン学会は初めてでしたが、聴講者の立場から多くの利点を感じました。 私が感じた最大の利点は録画動画による発表のため、発表中においても質疑応答が可能であるという点です。発表中に質問が投稿され、それに対し発表者が直ちに回答できることから多くの質疑応答が行われ、むしろオフライン形式よりも多くの情報が得られたと感じるほどでした。プログラム委員の方々は学会中を通して気軽に質問できるような雰囲気生成に尽力されており、学会中のSlack上では非常に活発な議論が行われていました。

以下に気になった講演、発表を紹介します。

続きを読む