著者
高橋 諒 蓑田 和麻 舛田 明寛 石川 信行
出版者
人工知能学会
雑誌
2019年度 人工知能学会全国大会(第33回)
巻号頁・発行日
2019-04-08

カスタマーとクライアントのマッチングビジネスを展開するリクルートでは、クライアントの情報をカスタマーに伝達するために日々大量の原稿が作成されている。本論文では、機械学習を用いてそれらの原稿の誤字脱字を検出する方法を提案する。このシステムは主に2つのパートで成り立っている。1つは複数のBidirectional LSTMを用いて各文字に対して誤りがないかの確率を算出するパート。もう一つはそれらの出力値を入力として、文全体で誤りがあるかないかを判定するランダムフォレストアルゴリズムである。この方法の有効性を示すために人工で作成した文と我々のサービスで持つ実データを用いて検証を行った。
著者
高橋 諒 蓑田 和麻 舛田 明寛 石川 信行
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3C4J903, 2019 (Released:2019-06-01)

カスタマーとクライアントのマッチングビジネスを展開するリクルートでは、クライアントの情報をカスタマーに伝達するために日々大量の原稿が作成されている。本論文では、機械学習を用いてそれらの原稿の誤字脱字を検出する方法を提案する。このシステムは主に2つのパートで成り立っている。1つは複数のBidirectional LSTMを用いて各文字に対して誤りがないかの確率を算出するパート。もう一つはそれらの出力値を入力として、文全体で誤りがあるかないかを判定するランダムフォレストアルゴリズムである。この方法の有効性を示すために人工で作成した文と我々のサービスで持つ実データを用いて検証を行った。