著者
小田 悠介 Philip Arthur Graham Neubig 吉野 幸一郎 中村 哲
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.2, pp.167-199, 2018-03-15 (Released:2018-06-15)
参考文献数
41

本論文では,ニューラル翻訳モデルで問題となる出力層の時間・空間計算量を,二値符号を用いた予測法により大幅に削減する手法を提案する.提案手法では従来のソフトマックスのように各単語のスコアを直接求めるのではなく,各単語に対応付けられたビット列を予測することにより,間接的に出力単語の確率を求める.これにより,最も効率的な場合で従来法の対数程度まで出力層の計算量を削減可能である.このようなモデルはソフトマックスよりも推定が難しく,単体で適用した場合には翻訳精度の低下を招く.このため,本研究では提案手法の性能を補償するために,従来法との混合モデル,および二値符号に対する誤り訂正手法の適用という 2 点の改良も提案する.日英・英日翻訳タスクを用いた評価実験により,提案法が従来法と比較して同等程度の BLEU を達成可能であるとともに,出力層に要するメモリを数十分の 1 に削減し,CPU での実行速度を 5 倍から 10 倍程度に向上可能であることを示す.
著者
小田悠介 ニュービッググラム サクティサクリアニ 戸田智基 中村哲
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2014-NL-216, no.22, pp.1-8, 2014-05-15

プログラミングは人手による作業が主であり,最終的なソースコードそのものを生成する自動プログラミングシステムは実用化されていない.このような自動プログラミングシステムを学習,評価するためには,実際のプログラミングに関するタスクを切り出したコーパスの収集が必要である.我々はタスクとして 「自然言語による仕様文が与えられたとき,その仕様に対応する関数を出力する」 という問題を考え,仕様文・ソースコード例からなるパラレルコーパスを人手により収集した.また,得られたコーパスから自動プログラミングのために必要な言語処理の技術を考察した.
著者
小田 悠介 札場 寛之 ニュービッグ グラム サクティ サクリアニ 戸田 智基 中村 哲
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2014-NL-219, no.12, pp.1-9, 2014-12-09

プログラミング初学者にとって,与えられたソースコードがどのような処理内容なのかを把握するのは容易ではない.そこでソースコード読解支援のために,与えられたソースコードから処理内容を示すコメントを自動的に生成し,ソースコードと共に提示することで読解を促すシステムが考えられる.本研究ではコメント生成のために Tree-to-String 統計翻訳の枠組みを使用し,プログラミング言語の構文木とコメントに対して翻訳器を学習することで,ソースコードから統計的にコメントを生成するシステムを提案する.