著者
成松 宏美 杉山 弘晃 菊井 玄一郎 平 博順 的場 成紀 東中 竜一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3C4J901, 2019 (Released:2019-06-01)

我々は,「ロボットは東大に入れるか?」プロジェクトにおいて英語問題に取り組んでいる.本稿では,不要文除去問題に着目し,本問題に対して,近年あらゆるタスクで最高スコアを達成したBERTを適用する.BERTをどのように解法に適用するかを紹介し,ベースラインを超えて最高スコアに到達したことを示す.さらに,エラー分析により,BERTでできていないことを明らかにする.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.2H21, 2017 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
鐘ケ江 弘美 松下 景 林 武司 川島 秀一 後藤 明俊 竹崎 あかね 矢野 昌裕 菊井 玄一郎 米丸 淳一
出版者
日本育種学会
雑誌
育種学研究 (ISSN:13447629)
巻号頁・発行日
vol.24, no.2, pp.115-123, 2022-12-01 (Released:2022-12-22)
参考文献数
30

作物の系譜情報は育種を行う上で必要不可欠であり,特に交配親の選定において極めて重要である.しかし,系譜情報の分析基盤や可視化ツールは少なく,育種家は範囲が限定された系譜図を使用せざるを得ない.本研究では,育種や作物データの解析に系譜情報を広く活用するため,系譜情報グラフデータベース「Pedigree Finder」(https://pedigree.db.naro.go.jp/)を構築した.系譜情報を整備するために語彙やデータフォーマットの統一を行うとともに,品種・系統の標準化されたIDを利用することにより,関連するゲノム情報および形質情報との紐づけを可能にした.系譜情報の整備にはデータモデルとしてリソース・ディスクリプション・フレームワーク(Resource Description Framework, RDF)を採用し,共通性と永続性を高めた上で,グラフデータベースを構築した.グラフデータベースの利用により,系譜情報をわかりやすく可視化し,セマンティック・ウエブ(Semantic Web)技術による外部データベースとの情報統合や高度な検索が可能である.本システムにより系譜情報を収集・可視化することで,系統の育成過程をたどり,遺伝的な近縁性を考慮した交配親の選定や系譜と特性との関係の把握など,品種育成や遺伝研究の意思決定における育種データの統合利用が可能になると期待される.
著者
中村 哲 佐々木 裕 菊井 玄一郎 清水 徹
出版者
社団法人情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.55, no.8, pp.345-350, 2005-08-01
被引用文献数
2

音声翻訳は, 日本語を喋ると英語やその他の外国語に翻訳して喋ってくれる, あるいは外国語を喋ると日本語に翻訳して喋ってくれるという技術である。音声翻訳を実際の生活のあらゆる場面で使えるものにするためにはまだ多くの課題が山積している。個別の技術で言えば, 音声認識, 翻訳, 音声合成といった要素技術を, 話し言葉を対象にいかにしてロバストで高精度にするか, そして, それらをいかに効果的に統合するかという音声翻訳特有の課題の解決が不可欠である。そこで, 本稿では, ATRが現在研究開発を進めている旅行会話を対象とした音声翻訳システムの解説を中心に, 音声翻訳研究の現状を紹介する。
著者
中村 哲 佐々木 裕 菊井 玄一郎 清水 徹
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.55, no.8, pp.345-350, 2005
参考文献数
8
被引用文献数
2

音声翻訳は, 日本語を喋ると英語やその他の外国語に翻訳して喋ってくれる, あるいは外国語を喋ると日本語に翻訳して喋ってくれるという技術である。音声翻訳を実際の生活のあらゆる場面で使えるものにするためにはまだ多くの課題が山積している。個別の技術で言えば, 音声認識, 翻訳, 音声合成といった要素技術を, 話し言葉を対象にいかにしてロバストで高精度にするか, そして, それらをいかに効果的に統合するかという音声翻訳特有の課題の解決が不可欠である。そこで, 本稿では, ATRが現在研究開発を進めている旅行会話を対象とした音声翻訳システムの解説を中心に, 音声翻訳研究の現状を紹介する。
著者
菊井 玄一郎 門内 健太 高橋 寛幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.112, no.196, pp.31-36, 2012-08-23

検索サービスに入力される検索語のうち入力頻度が急上昇したものを「検索ホットワード」(バースト語)と呼ぶ。本稿では、これらの語が検索エンジンやブログ、twitterで経時的にどのような頻度で言及されているかを分析するとともに、検索頻度が急上昇した要因となる事象がこれらの書き込みから推定可能かを検討した。その結果、twitterでの言及のバーストが検索クエリ頻度上昇の先行すること、バーストの時間がその契機となった事象(例えば、TV番組での指示対象事物の露出など)にかなり即応的であることなどがわかった。また、急上昇ワードの「由来」や急上昇となった「要因」がtwitterの分析によって70%程度推定可能であることなどが分かった。
著者
長谷川 隆明 西川 仁 今村 賢治 菊井 玄一郎 奥村 学
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.1, pp.133-143, 2010 (Released:2010-01-06)
参考文献数
16
被引用文献数
2

Recently, web pages for mobile devices are widely spread on the Internet and a lot of people can access web pages through search engines by mobile devices as well as personal computers. A summary of a retrieved web page is important because the people judge whether or not the page would be relevant to their information need according to the summary. In particular, the summary must be not only compact but also grammatical and meaningful when the users retrieve information using a mobile phone with a small screen. Most search engines seem to produce a snippet based on the keyword-in-context (KWIC) method. However, this simple method could not generate a refined summary suitable for mobile phones because of low grammaticality and content overlap with the page title. We propose a more suitable method to generate a snippet for mobile devices using sentence extraction and sentence compression methods. First, sentences are biased based on whether they include the query terms from the users or words that are relevant to the queries, as well as whether they do not overlap with the page title based on maximal marginal relevance (MMR). Second, the selected sentences are compressed based on their phrase coverage, which is measured by the scores of words, and their phrase connection probability measured based on the language model, according to the dependency structure converted from the sentence. The experimental results reveal the proposed method outperformed the KWIC method in terms of relevance judgment, grammaticality, non-redundancy and content coverage.
著者
森元 逞 田代 敏久 竹澤 寿幸 永田 昌明 谷戸 文廣 浦谷則好 鈴木 雅実 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.9, pp.1726-1735, 1996-09-15
参考文献数
21
被引用文献数
5

日本語から英語へ翻訳可能な音声翻訳実験システム(ASURA)を開発した. ASURAでは 分野間の移植性を確保できるよう 一般的な日本語話し言葉の表現を網羅するとともに 音声認識と言語翻訳のコンポーネントのいずれも 名詞や動詞などの分野に依存する辞書項目を容易に入れ替え可能な構成としている. また 音声認識や言語翻訳にともなって発生する暖昧さ(複数の候補)に対処するため 正しい候補を効率良く選択できるようにコンポーネント間 サブコンポーネント間で機能分担を行い また候補の探索メカニズムを組み込んでいる. 本論文では このようなASURAのシステム構成について述べ また システムの性能評価を行い このシステム構成の有効性を示す.We have developed the experimental speech translation system ASURA, which translates from Japanese to English. In order to keep high portability to various domains, most of the common expressions in spoken Japanese are covered, and both the speech recognition and language translation components are constructed so that domain-dependent lexical items such as nouns and verbs are easy to replace. Furthermore, all of the components and sub-components in the system share functionalities so that they can effectively reduce ambiguities created in the course of speech recognition and language translation processing. The candidate search mechanisms are also incorporated for the same purpose. This paper describes the configuration and performance evaluation of the system, and demonstrates the effectiveness of the configuration.
著者
河田 尚孝 磯崎 秀樹 菊井 玄一郎
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

パラメータの最適化は、統計的機械翻訳のパフォーマンスを向上させるために不可欠です。 MERTは標準的な目的関数としてBLEUを使用する最適化ツールです。 しかし、日本語と英語のように語順が非常に異なる言語間の翻訳では、BLEUは人間の判断との相関が非常に低いです。したがって、BLEUの代わりにRIBESのような人手相関の高い評価関数を最適化プロセスの目的関数として使用する方がよい。 本稿では、MERTの目的関数として用いたRIBESの効果を調べ、SMTが原文とは大きく異なる語順を決定する際に、RIBESがBLEUよりも優れていることを見出した。
著者
中村 哲 佐々木 裕 菊井 玄一郎 清水 徹
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.55, no.8, pp.345-350, 2005-08-01 (Released:2017-05-25)

音声翻訳は, 日本語を喋ると英語やその他の外国語に翻訳して喋ってくれる, あるいは外国語を喋ると日本語に翻訳して喋ってくれるという技術である。音声翻訳を実際の生活のあらゆる場面で使えるものにするためにはまだ多くの課題が山積している。個別の技術で言えば, 音声認識, 翻訳, 音声合成といった要素技術を, 話し言葉を対象にいかにしてロバストで高精度にするか, そして, それらをいかに効果的に統合するかという音声翻訳特有の課題の解決が不可欠である。そこで, 本稿では, ATRが現在研究開発を進めている旅行会話を対象とした音声翻訳システムの解説を中心に, 音声翻訳研究の現状を紹介する。
著者
持橋 大地 菊井 玄一郎
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2006, no.36(2006-NL-172), pp.47-53, 2006-03-27

文書があるトピックの持つ確率分布から生成されたと仮定し その確率分布パラメータと文書のトピックへの帰属確率を求めるモデルに ナイーブベイズ法を Polya 分布を用いてベイズ的に精密にとらえ直した混合ディリクレモデル(DM)があるが この方法はトピック数を事前に与える必要があるという欠点があった.これに対し 本論文では可算無限個の混合比にディリクレ過程事前分布を与えることにより データの複雑さに合わせて混合数を自動推定するディリクレ過程混合モデルによる方法を検討する. モデル選択により混合数を決定する方法と異なり この方法は混合数の事後分布をパラメータと同時に推定し 期待値を取ることで予測を行うことができる. 実験の結果 必要な混合数の上限を推測することができ 特に小規模データに対しては性能がさらに上昇することがわかった.
著者
田頭 幸三 但馬 康宏 菊井 玄一郎
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2015-GI-34, no.9, pp.1-6, 2015-06-27

コンピュータによるゲームの思考アルゴリズムの研究は囲碁,将棋などのボードゲームに限らず,トランプゲームに対しても行われている.特に大貧民については,毎年,電気通信大学が UEC コンピュータ大貧民大会を開催している.この大会は,大貧民をプレイするクライアントプログラム同士を対戦させ,最も強いクライアントを決める大会であり,機械学習を用いた無差別級とヒューリスティックな戦略を用いたライト級の 2 つの部門がある.本研究では,コンピュータ大貧民大会ライト級のヒューリスティック部門に向けて製作し,優勝したプログラムから,戦略の一部分を変更した場合の強さの変化を比較することで,勝利するのに有効な戦略について分析を行った.その結果,勝利するには,しばりを発生させる場合は強いカードを持っている場合に優先する戦略,同じ枚数の組が多いカードを提出し,次の自分の番にカードを減らしやすくする戦略,勝てる可能性が高ければ強いカードから出す戦略の有効性が高いと判断できた.
著者
伊藤 祥平 但馬 康宏 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.4, pp.1-3, 2013-12-04
被引用文献数
1

UEC コンピュータ大貧民大会ではモンテカルロ法を用いたクライアントが優勝している.そこでプレイアウト中の相手着手を実際の着手に近づけることでモンテカルロ法によるクライアントの強化を考える.本研究ではゲーム中の実際の相手着手を学習する方法としてナイーブベイズを用いる.これにより高速な相手のモデル化を行う.さらに、学習素性の工夫により精度の向上を行った.この結果,作成されたモデルの精度は過去の優勝クライアント snowl に対し,4 割程度の近似ができた.Monte-Carlo method is also useful for DAIHNMIN and the client using this method has won the UEC computer DAIHINMIN tournament. We try to accelerate the strength of Monte-Carlo method by making effective opponent models which are close to the real opponents' moves. Stronger opponent models, more effective playouts our client has. We use Naive Bayes as the learning method to modeling the opponents. This method is one of the fastest algorithm for learning and classification. In addition, its accuracy is enough to modeling the opponents. In this paper, we show two modeling by Naive Bayes. The first method is the simple modeling, and the second is improved the move data structure. The accuracy is approximately 40% by our improved method to model snowl which is the champion client in 2010.
著者
伊藤 祥平 但馬 康宏 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.4, pp.1-3, 2013-12-04

UEC コンピュータ大貧民大会ではモンテカルロ法を用いたクライアントが優勝している.そこでプレイアウト中の相手着手を実際の着手に近づけることでモンテカルロ法によるクライアントの強化を考える.本研究ではゲーム中の実際の相手着手を学習する方法としてナイーブベイズを用いる.これにより高速な相手のモデル化を行う.さらに、学習素性の工夫により精度の向上を行った.この結果,作成されたモデルの精度は過去の優勝クライアント snowl に対し,4 割程度の近似ができた.Monte-Carlo method is also useful for DAIHNMIN and the client using this method has won the UEC computer DAIHINMIN tournament. We try to accelerate the strength of Monte-Carlo method by making effective opponent models which are close to the real opponents' moves. Stronger opponent models, more effective playouts our client has. We use Naive Bayes as the learning method to modeling the opponents. This method is one of the fastest algorithm for learning and classification. In addition, its accuracy is enough to modeling the opponents. In this paper, we show two modeling by Naive Bayes. The first method is the simple modeling, and the second is improved the move data structure. The accuracy is approximately 40% by our improved method to model snowl which is the champion client in 2010.