著者
新井 紀子 影浦 峡 菅原 真悟 松崎 拓也 犬塚 美輪 尾崎 幸謙 登藤 直弥 藤田 彬
出版者
国立情報学研究所
雑誌
基盤研究(A)
巻号頁・発行日
2016-04-01

科目や分野によらない汎用的な読解力を短時間かつ高い精度で推定するリーディングスキルテストについて引き続き研究開発を続けている。リーディングスキルテストβ版については、そのアイデア等を論文や口頭発表、書籍等で公開した上で、一般社団法人「教育のための科学研究所」に移転し、リーディングスキルテストとして社会実装された。令和元年度末までで(リーディングスキルテストβ版と合わせて)のべ20万人以上が本テストを受検した。これまでの知見を2冊の書籍として出版した。少ないサンプルで問題の難易度を推定する方法や、より少ない問題数で高い精度で汎用的読解力を推定する方法等について、テスト理論の観点から尾崎・登藤らが検討を行った。板橋区および戸田市と連携し、汎用的読解力を児童・生徒に身に着けさせるための授業や学習支援についての検討を行っている。特に板橋区においては、「読み解く力の育成」として、板橋第一中学校に入学する小学校を含めた「学びのエリア」を指定し、その中で、学年進行に応じて、どのような汎用的読解力をどのような授業や支援で身に着けさせるかについての検討を行っている。板橋区と連携して行った研究授業および研究会は計5回である。加えて、検定教科書に関する計量国語学的観点からの分析を進め、小学校と中学校の教科書において記述方法にこれまで発見されていなかった量的なギャップがあることを発見し、査読付き論文および国際会議プロシーディングスで発表した。
著者
新井 庭子 分寺 杏介 松崎 拓也 影浦 峡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2017-CH-114, no.5, pp.1-8, 2017-05-06

テキストの難しさの研究として,既存の研究ではテキストか人間の認知の仕組みかどちらかしか研究対象にされてこなかった.本研究は,この 2 つの視点の両方を持ちつつ,主に知識構成を支える言語表現の形式に焦点を当て,小 ・ 中の理科教科書を材料にこの問題への接近を試みる.我々は,読みを困難にするテキストのパラメーターを予測し,小 ・ 中教科書テキストの間にそのパラメーターで表現できるギャップがあることを示したが,その研究はまた,表層的な特徴に加え,質的な観点から言語表現を検討する必要性を示した.本研究では,質的な関連から言語表現を特徴付けるカテゴリーとして,定義表現と分類の表現に着目し,計量的な分析を行った.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
岩根 秀直 松崎 拓也 穴井 宏和 新井 紀子
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

数式処理は浮動小数点計算を用いる数値計算とは異なり 計算機上で誤差の生じない代数計算を実現する. 数式処理により入試数学問題を正確に解くことが実現できる. 本稿では, 入試問題の解法のための数式処理手法の紹介と 言語処理との接合における定式化や計算量などの課題について述べる.
著者
加納 隼人 佐藤 理史 松崎 拓也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.32, no.1, pp.C-G61_1-11, 2017-01-06 (Released:2017-01-13)
参考文献数
20

This paper reports progress from 2014 to 2015 on development of solvers of Japanese comprehension questions in university entrance exam. Target questions are the multiple-choice questions in the essay section (Question No.1) in Japanese Language (Kokugo) of National Center Test. In 2014, we introduced a new scoring function using clause boundaries, which are automatically detected by our newly developed tool. The score of a choice is calculated as the average clause-similarity between the choice and a selected part of text body. In 2015, we developed a machinelearning based method, which uses seventeen features to determine the answer. They includes surface-similarity based features, clause-similarity based features, and choice-discriminative features. In addtion to the first formal run of Torobo Project in 2013, we participated in the two formal runs in 2014 and 2015; We were only a participant who submitted the result in Contemporary Japanese Language until now. After the 2015 formal run, we conducted an experiment using 276 questions to compare all developed solvers with various parameters. The best performance was obtained by a 2015 solver, which produced 117 (42%) correct answers. For the subset of 56 previous official questions in National Center Test, a 2014 solver was the best, which produced 32 (57%) correct answers. However, there is no statistical significance between the best 2015 solver and our first solver developed in 2013.
著者
高木 大生 佐藤 理史 松崎 拓也
雑誌
第77回全国大会講演論文集
巻号頁・発行日
vol.2015, no.1, pp.171-172, 2015-03-17

われわれは、コンピュータにショートショートを自動生成させることを目指している。ショートショートの自動生成には、プロットやキャラクター、時間、場所、文法知識など様々な背景知識が必要になる。われわれは、プロットとそれらの背景知識を持ち、ショートショートを自動生成するシステムを実装した。このシステムは、プロットを穴埋め式のテンプレートとして保持し、背景知識を用いてこの穴を埋め、物語を生成する。さらにこの時、一つ穴を埋める要素を変更することで、連鎖的に他の穴を埋める要素も変わり、一つのプロットから複数の物語を生成できる。
著者
松崎 拓也 岩根 秀直 穴井 宏和 相澤 彰子 新井 紀子
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

「ロボットは東大に入れるか」プロジェクトにおける数学問題への取り組みについて報告する。開発中の解答システムは、問題文の論理表現を接点として、統語・意味理論に基づく言語解析と数式処理システムによる推論とを直接結合したものである。本稿では、システムの概要および実際の試験問題を用いた実験について述べるとともに、さらに多様な解答システムの開発へ向けた基礎資源となる数学問題対訳コーパスについて紹介する。
著者
宇田川 忠朋 久保 大亮 松崎 拓也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2021, pp.3J4GS6c03, 2021

<p>本論文では、日本語係り受け解析にBERTを用いることで、既存手法と比較してどういった誤りが改善されるのかを調べた。BERTは、文章を入力し、その中の各単語について文脈に依存した埋め込みベクトルを得る手法である。本論文ではBERTを用いる手法として、係り受け候補に対応するBERTの出力ベクトルを順伝播型ニューラルネットワークに入力する方法と、双線形関数に入力する方法の2つを従来法と比較する。実験を行ったところ、BERTを用いる手法はどちらも従来法の精度を上回った。この差を係り受けペアの品詞の組み合わせや文節間距離などの観点から分析し主な精度向上の要因を探った。</p>
著者
岩根 秀直 松崎 拓也 穴井 宏和 新井 紀子
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第27回全国大会(2013)
巻号頁・発行日
pp.2A42, 2013 (Released:2018-07-30)

数式処理は浮動小数点計算を用いる数値計算とは異なり 計算機上で誤差の生じない代数計算を実現する. 数式処理により入試数学問題を正確に解くことが実現できる. 本稿では, 入試問題の解法のための数式処理手法の紹介と 言語処理との接合における定式化や計算量などの課題について述べる.
著者
豊辻 宏旨 松崎 拓也 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.3G11, 2017 (Released:2018-07-30)

センター試験「化学」の正誤問題に対する自動解答システムを開発した。選択肢に対し意味解析を行い、生成された中間表現に基づき正誤判定を行う。まず、化学物質の知識と状態や操作を表す用言に関する知識をオントロジーとしてまとめた。さらに、並列や連体修飾など分野に非依存な言語現象を処理するため形式文法を実装した。形式文法にオントロジーに基づく意味表示を組み込むことで、誤った解析を防ぎつつ、意味解析を行える。
著者
加納 隼人 佐藤 理史 松崎 拓也
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2015, no.8, pp.1-7, 2015-01-12

本年度新たに実装した,大学入試センター試験 『国語』 評論傍線部問題を解くソルバーについて報告する.実装したソルバーは,傍線部問題の本文と選択肢に対して節境界検出による節分割を行い,その結果を用いて類似度計算を行うことで,解答を選択する.本ソルバーをセンター試験の過去問 40 問に適用したところ,昨年度のソルバーを上回る最大 28 問の正解数を示した.This paper describes a new solver that solves comprehension questions in Contemporary Japanese of the National Center Test. A target question consists of a text body, a question sentence, and five choices. Our solver divides the text body and the choices into clauses by using clause-boundary detection and selects a choice based on clause similarity. Our solver correctly solved 28 questions in 40 previous questions of the National Center Test.
著者
植松 すみれ 松崎 拓也 花岡 洋輝 宮尾 祐介 美馬 秀樹
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

語彙化文法に基づいた日本語の構文・意味解析器を実現するために、コーパスを基に大規模な日本語文法を開発する手法を示す。日本語の構文情報付きコーパスは係り受け形式が多くそのまま語彙化文法開発には適用できないが、本手法では京大コーパス並びに関連するコーパスの情報を統合、再解釈して語彙化文法に基づく構文コーパスを構成し、日本語文法を獲得する。また実際に獲得した文法を解析に用いた際の精度により評価を行う。
著者
加納 隼人 佐藤 理史 松崎 拓也
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2015-NL-220, no.8, pp.1-7, 2015-01-12

本年度新たに実装した,大学入試センター試験 『国語』 評論傍線部問題を解くソルバーについて報告する.実装したソルバーは,傍線部問題の本文と選択肢に対して節境界検出による節分割を行い,その結果を用いて類似度計算を行うことで,解答を選択する.本ソルバーをセンター試験の過去問 40 問に適用したところ,昨年度のソルバーを上回る最大 28 問の正解数を示した.
著者
松崎 拓也 横野 光 宮尾 祐介
雑誌
情報処理
巻号頁・発行日
vol.57, no.1, pp.34-35, 2015-12-15

「ロボットは東大に入れるか」(以下,東ロボ)は国立情報学研究所を中心とする研究プロジェクトである.「東ロボ」では,大学入試試験問題を自動的に解くソフトウェアの開発を行っている.その狙いは,言語処理および人工知能関連技術を総ざらえし,統合的な知的処理課題をベンチマークとして今後10年の言語処理・AI関連技術の伸びしろと限界を見極めることにある.プロジェクトの公式目標は2016年度にセンター試験で高得点を獲得し,2021年度に東大合格レベルに到達することである.本稿では,物理および歴史の解答システムの結果を中心に,代々木ゼミナール主催のセンター模試を用いた解答システムの評価結果とその分析を紹介する.
著者
新井 庭子 分寺 杏介 石原 侑樹 松崎 拓也 影浦 峡
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.2, pp.144-159, 2017-09-20 (Released:2019-01-11)
参考文献数
38

本研究では,小学校と中学校の理科教科書を対象に,語彙と構文の観点からテキストの複雑さを構成するパラメータを予測し,小・中間でそのパラメータで表現できるギャップがあることを示す.中学校に適応できないいわゆる小・中ギャップは,生活面と学習面から研究されてきたが,教科書等の教材のテキストの相違がもたらすギャップに着目した研究はない.本研究はこの点を背景に,テキストの表現形式に具体的にどのような差があるのかを,小・中ギャップに関連する段階の教科書を対象に明らかにするものである.分析の結果,小・中の教科書には特に係り受け関係の複雑さに顕著な差があることが明らかになった.
著者
松崎 拓也
出版者
The Philosophy of Science Society, Japan
雑誌
科学哲学 (ISSN:02893428)
巻号頁・発行日
vol.50, pp.35-49, 2017-12-20 (Released:2019-05-02)
参考文献数
11

This paper describes a computer system for solving pre-university mathematical problems written in Japanese. At the core of its language processing mechanism is a formal grammar, with which a semantic representation is derived from a sentence. The development process of the grammar is explained in detail. Finally, several observations are provided regarding the current research field of artificial intelligence and language processing.