著者
新井 庭子 分寺 杏介 松崎 拓也 影浦 峡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2017-CH-114, no.5, pp.1-8, 2017-05-06

テキストの難しさの研究として,既存の研究ではテキストか人間の認知の仕組みかどちらかしか研究対象にされてこなかった.本研究は,この 2 つの視点の両方を持ちつつ,主に知識構成を支える言語表現の形式に焦点を当て,小 ・ 中の理科教科書を材料にこの問題への接近を試みる.我々は,読みを困難にするテキストのパラメーターを予測し,小 ・ 中教科書テキストの間にそのパラメーターで表現できるギャップがあることを示したが,その研究はまた,表層的な特徴に加え,質的な観点から言語表現を検討する必要性を示した.本研究では,質的な関連から言語表現を特徴付けるカテゴリーとして,定義表現と分類の表現に着目し,計量的な分析を行った.
著者
岩根 秀直 松崎 拓也 穴井 宏和 新井 紀子
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

数式処理は浮動小数点計算を用いる数値計算とは異なり 計算機上で誤差の生じない代数計算を実現する. 数式処理により入試数学問題を正確に解くことが実現できる. 本稿では, 入試問題の解法のための数式処理手法の紹介と 言語処理との接合における定式化や計算量などの課題について述べる.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
植松 すみれ 松崎 拓也 花岡 洋輝 宮尾 祐介 美馬 秀樹
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

語彙化文法に基づいた日本語の構文・意味解析器を実現するために、コーパスを基に大規模な日本語文法を開発する手法を示す。日本語の構文情報付きコーパスは係り受け形式が多くそのまま語彙化文法開発には適用できないが、本手法では京大コーパス並びに関連するコーパスの情報を統合、再解釈して語彙化文法に基づく構文コーパスを構成し、日本語文法を獲得する。また実際に獲得した文法を解析に用いた際の精度により評価を行う。
著者
加納 隼人 佐藤 理史 松崎 拓也
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2015-NL-220, no.8, pp.1-7, 2015-01-12

本年度新たに実装した,大学入試センター試験 『国語』 評論傍線部問題を解くソルバーについて報告する.実装したソルバーは,傍線部問題の本文と選択肢に対して節境界検出による節分割を行い,その結果を用いて類似度計算を行うことで,解答を選択する.本ソルバーをセンター試験の過去問 40 問に適用したところ,昨年度のソルバーを上回る最大 28 問の正解数を示した.
著者
松崎 拓也 岩根 秀直 穴井 宏和 相澤 彰子 新井 紀子
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

「ロボットは東大に入れるか」プロジェクトにおける数学問題への取り組みについて報告する。開発中の解答システムは、問題文の論理表現を接点として、統語・意味理論に基づく言語解析と数式処理システムによる推論とを直接結合したものである。本稿では、システムの概要および実際の試験問題を用いた実験について述べるとともに、さらに多様な解答システムの開発へ向けた基礎資源となる数学問題対訳コーパスについて紹介する。
著者
加納 隼人 佐藤 理史 松崎 拓也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.32, no.1, pp.C-G61_1-11, 2017-01-06 (Released:2017-01-13)
参考文献数
20

This paper reports progress from 2014 to 2015 on development of solvers of Japanese comprehension questions in university entrance exam. Target questions are the multiple-choice questions in the essay section (Question No.1) in Japanese Language (Kokugo) of National Center Test. In 2014, we introduced a new scoring function using clause boundaries, which are automatically detected by our newly developed tool. The score of a choice is calculated as the average clause-similarity between the choice and a selected part of text body. In 2015, we developed a machinelearning based method, which uses seventeen features to determine the answer. They includes surface-similarity based features, clause-similarity based features, and choice-discriminative features. In addtion to the first formal run of Torobo Project in 2013, we participated in the two formal runs in 2014 and 2015; We were only a participant who submitted the result in Contemporary Japanese Language until now. After the 2015 formal run, we conducted an experiment using 276 questions to compare all developed solvers with various parameters. The best performance was obtained by a 2015 solver, which produced 117 (42%) correct answers. For the subset of 56 previous official questions in National Center Test, a 2014 solver was the best, which produced 32 (57%) correct answers. However, there is no statistical significance between the best 2015 solver and our first solver developed in 2013.
著者
吉田 達平 松崎 拓也 佐藤 理史
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2016-NL-225, no.2, pp.1-9, 2016-01-15

高校化学の計算問題の自動解答システムの開発を行った.システムではまず問題文に対する言語処理を行い,問題の意味を表す中間表現を生成したのち,計算処理を行い解答を導出する.本稿では特に前半の言語処理に関して,係り受け解析誤りの修正と,ゼロ代名詞のような省略された要素の検出について報告する.これらは非文法的なパターンを検出するヒューリスティクスと,高校化学分野に対する簡易的なオントロジーに基づき選択制限を記述した格フレーム辞書を用いて行う.
著者
松崎 拓也 横野 光 宮尾 祐介
雑誌
情報処理
巻号頁・発行日
vol.57, no.1, pp.34-35, 2015-12-15

「ロボットは東大に入れるか」(以下,東ロボ)は国立情報学研究所を中心とする研究プロジェクトである.「東ロボ」では,大学入試試験問題を自動的に解くソフトウェアの開発を行っている.その狙いは,言語処理および人工知能関連技術を総ざらえし,統合的な知的処理課題をベンチマークとして今後10年の言語処理・AI関連技術の伸びしろと限界を見極めることにある.プロジェクトの公式目標は2016年度にセンター試験で高得点を獲得し,2021年度に東大合格レベルに到達することである.本稿では,物理および歴史の解答システムの結果を中心に,代々木ゼミナール主催のセンター模試を用いた解答システムの評価結果とその分析を紹介する.
著者
川添 愛 宮尾 祐介 松崎 拓也 横野 光 新井 紀子
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

コンピュータによる世界史問題への解答、特に自然言語文の選択肢の真偽を判断する問題への解答を支援する世界史オントロジーを紹介する。このオントロジーでは、イベントの成立に関わる諸条件を記述することにより、、高校レベルの世界史の知識と常識的な判断能力を持つ人間ならば必ず「ありえない」と判断するようなイベントを記述した偽文を、コンピュータが「偽」と判定できるようにすることを目指す。
著者
辻井 潤一 米澤 明憲 田浦 健次朗 宮尾 祐介 松崎 拓也 狩野 芳伸 大田 朋子 SAETRE Rune 柴田 剛志 三輪 誠 PYYSALO SAMPO Mikael 金 進東 SAGAE Kenji SAGAE T. Alicia 王 向莉 綱川 隆司 原 忠義
巻号頁・発行日
2006 (Released:2006-04-01)

本研究は、文解析研究で成功してきた手法、すなわち、巨大な文書集合を使った機械学習技術と記号処理アルゴリズムとを融合する手法を、意味・文脈・知識処理に適用することで、言語処理技術にブレークスルーをもたらすことを目標として研究を遂行した。この結果、(1)言語理論に基づく深い文解析の高速で高耐性なシステムの開発、(2)意味・知識処理のための大規模付記コーパス(GENIAコーパス)の構築と公開、(3)深い文解析の結果を用いた固有名、事象認識などの意味・知識処理手法の開発、(4)大規模なテキスト集合の意味・知識処理を行うためのクラウド処理用ソフトウェアシステムの開発、において世界水準の成果を上げた。(2)で構築されたGENIAコーパスは、生命科学分野でのテキストマイニング研究のための標準データ(Gold Standard)として、国際コンペティション(BioNLP09、BioNLP11)の訓練・テスト用のデータとして、採用された。また、(1)の研究成果と機械学習とを組み合わせた(3)の成果は、これらのコンペティションで高い成績を収めている。また、(1)と(4)の成果により、Medlineの論文抄録データベース(2千万件、2億超の文)からの事象認識と固有名認識を数日で完了できることを実証した。その成果は、意味処理に基づく知的な文献検索システム(MEDIE)として公開されている。
著者
松崎 拓也 増田 勝也
出版者
国立情報学研究所
雑誌
基盤研究(C)
巻号頁・発行日
2009 (Released:2009-04-01)

構文解析など基本的な言語処理を施した大量のテキストデータを用いて、そこから必要な情報を動的に抽出することで種々の言語処理技術を高精度化することを目指し研究を行った。具体的な成果として、大規模半構造化データベースに対する高速な検索システムを開発し、それを応用した知的テキスト検索システムを実現した。また、大量テキストデータから動的に抽出した統計量を従来の解析モデルに統合する枠組みに関する基礎研究を、構文解析および共参照・照応解析を対象として行い、それぞれについて高精度な解析システムを実現するとともにテキストベースとの統合へ向けての知見を得た。