著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
中村 哲 佐々木 裕 菊井 玄一郎 清水 徹
出版者
社団法人情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.55, no.8, pp.345-350, 2005-08-01
被引用文献数
2

音声翻訳は, 日本語を喋ると英語やその他の外国語に翻訳して喋ってくれる, あるいは外国語を喋ると日本語に翻訳して喋ってくれるという技術である。音声翻訳を実際の生活のあらゆる場面で使えるものにするためにはまだ多くの課題が山積している。個別の技術で言えば, 音声認識, 翻訳, 音声合成といった要素技術を, 話し言葉を対象にいかにしてロバストで高精度にするか, そして, それらをいかに効果的に統合するかという音声翻訳特有の課題の解決が不可欠である。そこで, 本稿では, ATRが現在研究開発を進めている旅行会話を対象とした音声翻訳システムの解説を中心に, 音声翻訳研究の現状を紹介する。
著者
菊井 玄一郎 門内 健太 高橋 寛幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.112, no.196, pp.31-36, 2012-08-23

検索サービスに入力される検索語のうち入力頻度が急上昇したものを「検索ホットワード」(バースト語)と呼ぶ。本稿では、これらの語が検索エンジンやブログ、twitterで経時的にどのような頻度で言及されているかを分析するとともに、検索頻度が急上昇した要因となる事象がこれらの書き込みから推定可能かを検討した。その結果、twitterでの言及のバーストが検索クエリ頻度上昇の先行すること、バーストの時間がその契機となった事象(例えば、TV番組での指示対象事物の露出など)にかなり即応的であることなどがわかった。また、急上昇ワードの「由来」や急上昇となった「要因」がtwitterの分析によって70%程度推定可能であることなどが分かった。
著者
長谷川 隆明 西川 仁 今村 賢治 菊井 玄一郎 奥村 学
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.1, pp.133-143, 2010 (Released:2010-01-06)
参考文献数
16
被引用文献数
2

Recently, web pages for mobile devices are widely spread on the Internet and a lot of people can access web pages through search engines by mobile devices as well as personal computers. A summary of a retrieved web page is important because the people judge whether or not the page would be relevant to their information need according to the summary. In particular, the summary must be not only compact but also grammatical and meaningful when the users retrieve information using a mobile phone with a small screen. Most search engines seem to produce a snippet based on the keyword-in-context (KWIC) method. However, this simple method could not generate a refined summary suitable for mobile phones because of low grammaticality and content overlap with the page title. We propose a more suitable method to generate a snippet for mobile devices using sentence extraction and sentence compression methods. First, sentences are biased based on whether they include the query terms from the users or words that are relevant to the queries, as well as whether they do not overlap with the page title based on maximal marginal relevance (MMR). Second, the selected sentences are compressed based on their phrase coverage, which is measured by the scores of words, and their phrase connection probability measured based on the language model, according to the dependency structure converted from the sentence. The experimental results reveal the proposed method outperformed the KWIC method in terms of relevance judgment, grammaticality, non-redundancy and content coverage.
著者
河田 尚孝 磯崎 秀樹 菊井 玄一郎
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

パラメータの最適化は、統計的機械翻訳のパフォーマンスを向上させるために不可欠です。 MERTは標準的な目的関数としてBLEUを使用する最適化ツールです。 しかし、日本語と英語のように語順が非常に異なる言語間の翻訳では、BLEUは人間の判断との相関が非常に低いです。したがって、BLEUの代わりにRIBESのような人手相関の高い評価関数を最適化プロセスの目的関数として使用する方がよい。 本稿では、MERTの目的関数として用いたRIBESの効果を調べ、SMTが原文とは大きく異なる語順を決定する際に、RIBESがBLEUよりも優れていることを見出した。
著者
中村 哲 佐々木 裕 菊井 玄一郎 清水 徹
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.55, no.8, pp.345-350, 2005-08-01 (Released:2017-05-25)

音声翻訳は, 日本語を喋ると英語やその他の外国語に翻訳して喋ってくれる, あるいは外国語を喋ると日本語に翻訳して喋ってくれるという技術である。音声翻訳を実際の生活のあらゆる場面で使えるものにするためにはまだ多くの課題が山積している。個別の技術で言えば, 音声認識, 翻訳, 音声合成といった要素技術を, 話し言葉を対象にいかにしてロバストで高精度にするか, そして, それらをいかに効果的に統合するかという音声翻訳特有の課題の解決が不可欠である。そこで, 本稿では, ATRが現在研究開発を進めている旅行会話を対象とした音声翻訳システムの解説を中心に, 音声翻訳研究の現状を紹介する。
著者
持橋 大地 菊井 玄一郎
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2006, no.36(2006-NL-172), pp.47-53, 2006-03-27

文書があるトピックの持つ確率分布から生成されたと仮定し その確率分布パラメータと文書のトピックへの帰属確率を求めるモデルに ナイーブベイズ法を Polya 分布を用いてベイズ的に精密にとらえ直した混合ディリクレモデル(DM)があるが この方法はトピック数を事前に与える必要があるという欠点があった.これに対し 本論文では可算無限個の混合比にディリクレ過程事前分布を与えることにより データの複雑さに合わせて混合数を自動推定するディリクレ過程混合モデルによる方法を検討する. モデル選択により混合数を決定する方法と異なり この方法は混合数の事後分布をパラメータと同時に推定し 期待値を取ることで予測を行うことができる. 実験の結果 必要な混合数の上限を推測することができ 特に小規模データに対しては性能がさらに上昇することがわかった.
著者
田頭 幸三 但馬 康宏 菊井 玄一郎
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2015-GI-34, no.9, pp.1-6, 2015-06-27

コンピュータによるゲームの思考アルゴリズムの研究は囲碁,将棋などのボードゲームに限らず,トランプゲームに対しても行われている.特に大貧民については,毎年,電気通信大学が UEC コンピュータ大貧民大会を開催している.この大会は,大貧民をプレイするクライアントプログラム同士を対戦させ,最も強いクライアントを決める大会であり,機械学習を用いた無差別級とヒューリスティックな戦略を用いたライト級の 2 つの部門がある.本研究では,コンピュータ大貧民大会ライト級のヒューリスティック部門に向けて製作し,優勝したプログラムから,戦略の一部分を変更した場合の強さの変化を比較することで,勝利するのに有効な戦略について分析を行った.その結果,勝利するには,しばりを発生させる場合は強いカードを持っている場合に優先する戦略,同じ枚数の組が多いカードを提出し,次の自分の番にカードを減らしやすくする戦略,勝てる可能性が高ければ強いカードから出す戦略の有効性が高いと判断できた.
著者
伊藤 祥平 但馬 康宏 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.4, pp.1-3, 2013-12-04
被引用文献数
1

UEC コンピュータ大貧民大会ではモンテカルロ法を用いたクライアントが優勝している.そこでプレイアウト中の相手着手を実際の着手に近づけることでモンテカルロ法によるクライアントの強化を考える.本研究ではゲーム中の実際の相手着手を学習する方法としてナイーブベイズを用いる.これにより高速な相手のモデル化を行う.さらに、学習素性の工夫により精度の向上を行った.この結果,作成されたモデルの精度は過去の優勝クライアント snowl に対し,4 割程度の近似ができた.Monte-Carlo method is also useful for DAIHNMIN and the client using this method has won the UEC computer DAIHINMIN tournament. We try to accelerate the strength of Monte-Carlo method by making effective opponent models which are close to the real opponents' moves. Stronger opponent models, more effective playouts our client has. We use Naive Bayes as the learning method to modeling the opponents. This method is one of the fastest algorithm for learning and classification. In addition, its accuracy is enough to modeling the opponents. In this paper, we show two modeling by Naive Bayes. The first method is the simple modeling, and the second is improved the move data structure. The accuracy is approximately 40% by our improved method to model snowl which is the champion client in 2010.
著者
伊藤 祥平 但馬 康宏 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.4, pp.1-3, 2013-12-04

UEC コンピュータ大貧民大会ではモンテカルロ法を用いたクライアントが優勝している.そこでプレイアウト中の相手着手を実際の着手に近づけることでモンテカルロ法によるクライアントの強化を考える.本研究ではゲーム中の実際の相手着手を学習する方法としてナイーブベイズを用いる.これにより高速な相手のモデル化を行う.さらに、学習素性の工夫により精度の向上を行った.この結果,作成されたモデルの精度は過去の優勝クライアント snowl に対し,4 割程度の近似ができた.Monte-Carlo method is also useful for DAIHNMIN and the client using this method has won the UEC computer DAIHINMIN tournament. We try to accelerate the strength of Monte-Carlo method by making effective opponent models which are close to the real opponents' moves. Stronger opponent models, more effective playouts our client has. We use Naive Bayes as the learning method to modeling the opponents. This method is one of the fastest algorithm for learning and classification. In addition, its accuracy is enough to modeling the opponents. In this paper, we show two modeling by Naive Bayes. The first method is the simple modeling, and the second is improved the move data structure. The accuracy is approximately 40% by our improved method to model snowl which is the champion client in 2010.
著者
持橋 大地 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.36, pp.47-53, 2006-03-27
被引用文献数
2

文書があるトピックの持つ確率分布から生成されたと仮定し その確率分布パラメータと文書のトピックへの帰属確率を求めるモデルに ナイーブベイズ法を Polya 分布を用いてベイズ的に精密にとらえ直した混合ディリクレモデル(DM)があるが この方法はトピック数を事前に与える必要があるという欠点があった.これに対し 本論文では可算無限個の混合比にディリクレ過程事前分布を与えることにより データの複雑さに合わせて混合数を自動推定するディリクレ過程混合モデルによる方法を検討する. モデル選択により混合数を決定する方法と異なり この方法は混合数の事後分布をパラメータと同時に推定し 期待値を取ることで予測を行うことができる. 実験の結果 必要な混合数の上限を推測することができ 特に小規模データに対しては性能がさらに上昇することがわかった.This paper proposes a Dirichlet process mixture modeling approach to Dirichlet Mixtures (DM). Endowing a prior distribution on an infinite number of mixture components, this approach yields an appropriate number of components as well as their parameters at the same time. Experimental results on amino acid distributions and text corpora confirmed this effect and show comparative performance on large datasets and better performance on small datasets avoiding overfitting.