著者
今村 賢治 越前谷 博 江原 暉将 後藤 功雄 須藤 克仁 園尾 聡 綱川 隆司 中澤 敏明 二宮 崇 王 向莉
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.29, no.3, pp.925-985, 2022 (Released:2022-09-15)
参考文献数
203

本解説論文では,特許を対象とした機械翻訳における種々の課題に対する関連技術の解説を行う.特許に対する機械翻訳は実用的にも学術的にも長い歴史を持つが,ニューラル機械翻訳の登場で新たな段階に進んできたと言える.そうした動向を踏まえ,訳抜け・過剰訳への対策,用語訳の統一,長文対策,低リソース言語対対策,評価,翻訳の高速化・省メモリ化,の6項目に分けて近年の関連技術を紹介し,今後の方向性を論じる.
著者
田中 駿 矢野 裕一郎 二宮 崇 高村 大也
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本研究はBBS(電子掲示板)要約の問題を整数線形計画問題として解く手法を提案する。BBS要約は文章要約の一種であり、BBSの記事から重要な投稿だけを抽出することにより要約が生成される。一般の文章要約では字数制限を整数線形計画問題の制約とすることができるが、BBS要約には字数制限がないため、一般の文章要約の手法はそのままでは適用できない。本研究では記事に応じて投稿数の制限を与える手法を提案する。
著者
鈴木 陽也 秋山 和輝 梶原 智之 二宮 崇 武村 紀子 中島 悠太 長原 一
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.4D3GS604, 2022 (Released:2022-07-11)

感情分析とは,テキストから人間の感情強度を予測する自然言語処理タスクである.従来の感情分析モデルは,テキストの書き手の感情(主観感情)の推定性能が十分でないことが知られている.そこで本研究では,感情分析モデルの入力として書き手の性格情報を加え,主観感情の推定に特化させる.本研究で使用する書き手の性格情報は,テキストの書き手に対する性格診断の結果である.プルチックの基本8感情の強度推定に関する評価実験の結果,提案手法による主観感情の推定の性能改善を確認した.
著者
井川 朋樹 梶原 智之 二宮 崇
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2B5GS603, 2022 (Released:2022-07-11)

テキスト平易化とは,文の意味を保持しながら,難解な文を平易な文に変換する自然言語処理タスクである.テキスト平易化により,言語障害を持つ人,子ども,言語学習者などが恩恵を受けることができる.これらの読み手の能力には差があり,その能力に応じた難易度調整が必要であるため,難易度制御可能なテキスト平易化手法が提案されている.しかし,従来手法は単語レベルの難易度に基づいており,文レベルの難易度が考慮されていないという問題点がある.そこで本研究では,文の難易度推定モデルを用いた深層強化学習によるテキスト平易化を提案する.実験の結果,提案手法において,テキスト平易化の評価指標SARIが向上することを確認した.
著者
友利 涼 二宮 崇 森 信介
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.24, no.5, pp.655-668, 2017-12-15 (Released:2018-03-15)
参考文献数
22

本稿では,将棋の解説文に対する固有表現を題材として,テキスト情報に加えて実世界情報を参照する固有表現認識を提案する.この題材での実世界情報は,固有表現認識の対象となる解説文が言及している将棋の局面である.局面は,盤面上の駒の配置と持ち駒であり,すべての可能な盤面状態がこれによって記述できる.提案手法では,まず各局面の情報をディープニューラルネットワークの学習方法の 1 つである stacked auto-encoder を用いて事前学習を行う.次に,事前学習の結果をテキスト情報と組み合わせて固有表現認識モデルを学習する.提案手法を評価するために,条件付き確率場による方法等との比較実験を行った.実験の結果,提案手法は他の手法よりも高い精度を示し,実世界情報を用いることにより固有表現認識の精度向上が可能であることが示された.
著者
渡邊 大貴 田村 晃裕 二宮 崇 Teguh Bharata Adji
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.26, no.1, pp.207-230, 2019-03-15 (Released:2019-06-15)
参考文献数
40

本論文では,ニューラル機械翻訳 (NMT) の性能を改善するため,CKY アルゴリズムから着想を得た,畳み込みニューラルネットワーク (CNN) に基づく新しいアテンション構造を提案する.提案のアテンション構造は,CKY テーブルを模倣した CNN を使って,原言語文中の隣接する単語/句の全ての可能な組み合わせを表現する.提案のアテンション構造を組み込んだ NMT は,CKY テーブルの各セルに対応する CNN の隠れ状態に対するアテンションスコア(言い換えると,原言語文中の単語の組み合わせに対するアテンションスコア)に基づき目的言語の文を生成する.従来の文構造に基づく NMT は予め構文解析器で解析した文構造を活用するが,提案のアテンション構造を用いる NMT は,原言語文の構文解析を予め行うことなく,原言語の文に潜む構造に対するアライメントを考慮した翻訳を行うことができる.Asian Scientific Paper Excerpt Corpus (ASPEC) 英日翻訳タスクの評価実験により,提案のアテンション構造を用いることで,従来のアテンション構造付きのエンコーダデコーダモデルと比較して,1.43 ポイント BLEU スコアが上昇することを示す.さらに,FBIS コーパスにおける中英翻訳タスクにおいて,提案手法は,従来のアテンション構造付きのエンコーダデコーダモデルと同等かそれ以上の精度を達成できることを示す.

1 0 0 0 OA R. B. について

著者
二宮 崇
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.4, pp.936-937, 2021 (Released:2021-12-15)
著者
二宮 崇
出版者
愛媛大学
雑誌
基盤研究(C)
巻号頁・発行日
2010-04-01

自然言語処理における識別モデルの素性関数は人手による試行錯誤で設計されているが、数十万から数百万に及ぶ素性関数を人手で発見・制御することは非常に困難な作業となっている。本研究は、素性関数を自動的に選択・構築しつつ目的関数を最適化するオンライン・ グラフティングの効率化およびアンサンブル学習による高精度化の研究を行う。本研究の提案手法はL1正則化ロジスティック回帰の近似手法となっているが、実験により、従来法の精度を低下させることなく、学習の高速化を実現することを経験的に示した。また、確率的アルゴリズムを用いたアンサンブル学習によりオンライン・グラフティングの精度が向上することも確認した。