NLP若手の会(YANS2020)で発表してきました

今回の記事では、先日参加したYANS2020での参加、発表報告をしています。

CTC Segmentationの紹介

ESPnet上のCTC Segmentationについて紹介します。

簡潔データ構造第2.5回: ビットベクトルに対する簡潔データ構造 (select編)

こんにちは。レトリバのリサーチャーの木村@big_wingです。 前回の2回目の記事ではビットベクトルに対するrank演算を実現する簡潔データ構造を紹介しましたが、今回はselect演算を実現する簡潔データ構造を紹介します。 1回目の記事はこちらです。 2回目の記…

音響学会2020年秋季研究発表会に参加しました

レトリバのリサーチャーが、先日オンラインで開催された音響学会の研究発表会の参加報告と一部の発表の紹介をします。

BERTを利用した日本語文書要約をやってみた

今回の記事では、前回作成した日本語要約データに対してBERTを用いた要約手法を試しました。

検索の評価指標

皆さんは、検索エンジンの評価をどのように行なっていますか?検索エンジンの評価は、実はユーザが求めていることによって変わってきます。今回は、ユーザが求めていること=ユーザモデルと検索評価指標の関係について、書いていきます。なお、以下の内容は[…

音声認識エンジンの深層学習フレームワークをChainerからPyTorchに移行しました

音声認識チームのソフトウェアエンジニアの西岡 @ysk24ok です。 弊社では音声認識エンジンを開発しており、これまでChainerを使って音声認識モデルの訓練・精度評価をおこなってきましたが、Chainer v7を最後に開発がストップすることが発表されたため、今…

OpenFST における N-shortest path アルゴリズムの紹介

OpenFSTというライブラリにおけるN-shortest path 探索アルゴリズムを紹介します

簡潔データ構造第2回: ビットベクトルに対する簡潔データ構造

こんにちは。レトリバのリサーチャーの木村@big_wingです。COVID-19の影響でテレワークが推進されていますが、現在私も奈良県の生駒市からフルリモートで業務を行っています。 今回は簡潔データ構造について2回目の記事で、あらゆる簡潔データ構造の基本とな…

MLFlowと他ツールの組み合わせ

研究チームの成果を迅速にPoC環境で試すための基盤作りを行っています。今回は、実験管理ツールMLFlowと他のツールの組み合わせについてご紹介します。

ACL2020に参加しました

今回の記事では、先日オンラインで開催されたACL2020の参加報告をしています。

wikiHowから日本語要約データを作成してみた

今回の記事では、とある英語要約データセットを参考に、日本語要約のデータセットを作成した話をしています。

2020年度 人工知能学会全国大会(第34回)に参加しました

こんにちは。カスタマーサクセス部研究チーム リサーチャーの坂田です。 レトリバでは、研究動向・業界動向の把握のため、積極的に学会参加をしています。6/9~12にオンラインで開催された 第34回人工知能学会全国大会にも、リサーチャー5名が聴講参加しまし…

社Dへの道 ~社会人博士課程に入学しました~

社Dへの道 -社会人博士課程に入学しました- こんにちは。レトリバの飯田です。カスタマーサクセス部 研究チームのリーダーをしており、マネジメントや論文調査、受託のPOCを行なっています。 この4月から、東京工業大学(東工大)の岡崎研究室に社会人博士課程…

文字列アルゴリズムは世界を救う?Suffix Array と Longest Common Substrings

COVID-19の遺伝子配列をターゲットに、Suffix Arrayを使ってLongest Common Substringsを求めてみました。また、そのアルゴリズムを解説します。

文字列検索の話(その1): ナーイブ検索と KMP法 BM法

2018/10/02の文字列検索についてのセミナーのフォローアップ記事、連載の一回目です。初回はインデックスを使わない検索、ナイーブな実装や、KMP法とBM法について書いています。

とある新入社員の 1 ヶ月

2020年度に新卒でレトリバにエンジニアとして入社した野本が、入社から 1 ヶ月でどんなことをしているのかについてご紹介します。

とある新入社員の修論解説 〜音素認識〜

レトリバに2020年度入社した社員の修士論文について簡単に解説します。 音声信号処理を用いて発話訓練のための音素認識を行う研究の紹介です。

とある新入社員の修論解説 〜文法誤り訂正〜

レトリバに2020年度入社した社員の修士論文について簡単に解説します。 自然言語処理、特に文法誤り訂正に関する記事です。

簡潔データ構造ってなに?

今回から簡潔データ構造という高速でメモリ効率のよいデータ構造について紹介していきます! 初回の今回は簡潔データ構造の定義について紹介します ∪・ω・∪

言語処理学会 第26回年次大会(NLP2020)に参加しました

こんにちは。レトリバのChief Research Officerの西鳥羽です。 レトリバでは、研究動向・業界動向の把握のため、研究グループの人間は積極的に国内学会に参加しており、今回は、自然言語処理国内最大級のカンファレンスである言語処理年次大会に参加しました…

論文共有会を開催しました 2020年2月

こんにちは。 レトリバでは、月1回論文共有会を行っており、主に研究グループのメンバが論文を各自1本ずつ紹介するという形式をとっています。 2月は以下の論文を紹介しました。

TopicModelの最終形態? Structured Topic Modelのご紹介

こんにちは。レトリバの飯田です。カスタマーサクセス部 研究チームに所属しており、論文調査やそのアルゴリズムを実行するスクリプトの実装などを行なっています。 今回は、Bag of Words(BoW)表現に於いて、これがTopicModelの最終形態ではないか?と私が思…

レトリバセミナーで関数型(Elixir)でConvolutional Neural Networkを実装した話をしました

1/15に行われたレトリバセミナーで「Functional Convolutional Neural Network in Elixir」というタイトルでCNNを関数型言語(Elixir)で実装したお話をしました。本記事はそのフォローアップ記事です。主にConvolution2D, MaxPooling2Dに関して、セミナーでの…

論文共有会を開催しました

こんにちは。 レトリバでは、月一回論文共有会を行っており、主にリサーチャーのメンバが論文を一本ずつ紹介するという形式をとっています。 そこで紹介された論文三本を以下で紹介します

PrometheusでサーバPCや自前アプリを監視してみた

こんちには。レトリバ製品開発部の高田 (twitter: @t-tkd3a)です。 この記事は 12/18 に行ったセミナーのフォローアップ記事です。 当日は動画の配信も行っていたのですが、音声が配信されたなかったトラブルが後から分かったため、スライドとキャプション…

TF2.0 tf.keras.Model 用 CRFレイヤーを試してみた

はじめに こんにちは。 リサーチャーの坂田です。 レトリバでは、 主に文書分類とNERに取り組んでいます。 tensorflow 2.0 では、 1系のときに"tf.contrib"以下にあったcrfが、 "tensorflow_addons"として分離されました。 現在、 tf.kerasのレイヤーとして…

スクラムガイドから経験的プロセス制御を学ぶ

この記事は Retrieva Engineer Casual Talk vol.4 のフォローアップ記事です。

音声分析ソフトウェアPraatとアノテーションフォーマットTextGrid形式について

今回は、音声分析ソフトウェアのPraatと、Praatで読み込んだり保存できる音声のアノテーションフォーマットTextGrid形式について紹介したいと思います。おまけとして、TextGrid形式のファイルを読み書きするライブラリ [textgrid.hpp](https://github.com/ei…

Random Features~Shift invariant kernelからGraph kernelまで~

こんにちは。レトリバのリサーチャーの木村です。10/16(水)のRetrieva Engineer Casual TalkでRandom Featuresについて発表しました。これはそのフォローアップ記事になります。 動画はこちらです。 Random Features 〜Shift invariant kernelからGraph kern…