著者
狩野 芳伸
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.59, no.10, pp.658-665, 2017-01-01 (Released:2017-01-01)
参考文献数
9

対話システムの利用は近年産業界でも注目を浴びており,一般ユーザーが利用可能な対話システムも数多く提供されている。本稿では対話システムの概要について,実際のいくつかの対話システムの動作結果や対話システムの仕組みの概略,関連するタスクの内容を通じて,専門外の読者にもわかりやすく紹介する。そのうえで,一研究者の視点から,対話システムの現状と将来について議論する。
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
佐藤 健 市瀬 龍太郎 宮尾 祐介 狩野 芳伸
出版者
国立情報学研究所
雑誌
基盤研究(B)
巻号頁・発行日
2014-04-01

計画の当初において、手動によってPROLEGにより短答式問題を解けることを確認した。しかし、そこで作った、自然言語文から得られる述語とPROLEGの述語をつなぐ橋渡しルールについては、問題適用範囲が狭く、新しい問題に対応できないことが分かった。そこで、橋渡しルールとは別の手法を検討したが、うまくいかなかったため、自然言語で書かれた短答式問題に対して、述語の質問を行い、その述語の変数に対応する値を答えるという質問応答システムを使うことを考案し、初期的な実験を行った結果、ある程度の値の代入を得られることが分かったが実用性にはまだ検討が必要であることがわかった。
著者
﨑下 雅仁 小川 ちひろ 土屋 賢治 岩渕 俊樹 岸本 泰士郎 狩野 芳伸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.3, pp.B-J45_1-11, 2020-05-01 (Released:2020-05-01)
参考文献数
28

In recent years, population with autism spectrum disorder (ASD) are growing explosively, and diagnosis of ASD is difficult due to difference of interviewers and environments, etc. We show relations between utterance features and ASD severity scores, which were manually given by a clinical psychologist. These scores are of the Autism Diagnostic Observation Schedule (ADOS), which is one of the standard metrics for symptom evaluation for subjects who are suspected as ASD. We built our original corpus where we transcribed voice records of our ADOS evaluation experiment movies. Our corpus is the world largest as speech/dialog of ASD subjects, and there has been no such ADOS corpus available in Japanese language as far as we know. We investigated relationships between ADOS scores (severity) and utterance features we defined. Our system automatically estimated their scores using support vector regression (SVR). Our average estimation errors were around error rates that human ADOS experts are required not to exceed. Because our detailed analysis for each part of the ADOS test (“puzzle toy assembly + story telling” part and the “depiction of a picture” part) shows different error rates, effectiveness of our features would depend on the contents of the records. By comparing an ADOS score prediction result of adults and adults with that of children, we showed common features of ADOS scores between children and adults. Our entire results suggest a new automatic way to assist humans’ diagnosis, which could help supporting language rehabilitation for patients with ASD in future.
著者
伊藤 詩乃 田中 佑岳 狩野 芳伸 榊原 康文
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.6, pp.AI30-G_1-9, 2016-11-01 (Released:2016-11-22)
参考文献数
22

In recent years, the digitization of medical and health data including clinical data, health diagnostic data, medication log data have been made rapidly. One potential application using electronic medical and health information is to develop a system to make a medical diagnosis according to the contents recorded in the electronic medical data and the appropriate patient information. The task of understanding the condition of the patient and making precisely the diagnosis is hard to be automated and requires the high degree of expertise. Toward a final goal to construct a medical diagnostic support system, as its pilot study, we attempt to build a question-answering program that automatically answers the medical licensing examination. The national medical licensing examination is the form of multiple-choice test and contains a wide variety of problems. There is a type of problems to answer the appropriate disease name among multiple choices given the patient information and test results as a problem statement. We aimed to develop the program to answer this type of questions. By the development of such question-answering program that automatically answers the medical licensing examination, we revealed the fundamental issues and essential difficulties in the information processing of the medical data, and finally constructed the foundation for conducting disease diagnosis support with patient information. In this paper, we developed a question-answering program and actually performed the answering for some problems in 107th and 108th out of national medical licensing examination. We carefully examined and analyzed the results and problems that could be answered correctly and problems that were given incorrect answers, and proposed the improvements to build a more accurate program.
著者
榊原 康文 伊藤 詩乃 田中 佑岳 佐藤 健吾 洪 繁 狩野 芳伸 Yasubumi Sakakibara Shino Ito Yugaku Tanaka Kengo Sato Shigeru Ko Yoshinobu Kano
雑誌
SIG-AIMED = SIG-AIMED
巻号頁・発行日
vol.001, 2015-09-29

Toward a final goal to construct a medical diagnostic support system, as its pilot study, we attempt to build a question-answering program that automatically answers the medical licensing examination.
著者
グプタ ビィシュウ 中村 亮裕 福田 治輝 綱川 隆司 狩野 芳伸 西田 昌史 西村 雅史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回 (2018)
巻号頁・発行日
pp.4Pin125, 2018 (Released:2018-07-30)

ニューラル機械翻訳モデルでは扱える語彙サイズに制約があり、この課題に対処する方法としてサブワード単位、文字単位、あるいはバイト単位で処理する方法が提案されている。一方、日本語においては文字単位に分割しても漢字のバリエーションが多いために語彙サイズは比較的大きくなる。本研究では日本語テキストに対して漢字分解を適用することで語彙サイズの低減と漢字情報の維持を両立させることを目指すニューラル機械翻訳手法を提案し、評価実験を行った。
著者
狩野 芳伸 神門 典子
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.23, no.2, pp.179-184, 2013-05-25 (Released:2013-07-25)
参考文献数
7

「ロボットは東大に入れるか」プロジェクトでは、最初の課題として大学入試センター試験の自動解答を目指している。本稿では、そのうち歴史系科目を対象とした解答器作成の試みを報告する。我が国の大学入試は、基本的に高校教科書の範囲内から出題されることになっている。しかし、人工知能が機械的に解くという観点でみると、範囲内というのは曖昧さがあるうえ、潜在的に人間の常識や知能を前提にしている。我々はあくまで教科書内の知識のみを用いるアプローチで、どこまで自動解答が可能かを試みた。歴史系科目とセンター試験の特性を鑑みて、解答にあたってはあえて論理的な構造や解析を排除し、教科書内の表現が肯定的であることを前提に単語を基本とする知識でどこまで解答可能かを探った。
著者
高須 遼 中村 啓信 岸本 泰士郎 狩野 芳伸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.1J4OS13a04, 2022 (Released:2022-07-11)

メンタルヘルスは社会的に重要な問題である。近年、メンタルヘルスの問題はインターネット上の活動と密接に関係している。そこで我々は、Twitterユーザーがメンタルヘルス問題を抱えているかどうかを分類するシステムを開発した。特定のパターンに合致するアカウントはメンタルヘルス問題を抱えている可能性が高いと仮定し、この仮定に基づいてポジティブな例とネガティブな例を100万件規模で収集した。また、キーワードに依存する先行研究とは異なり、メンタルヘルスに特化したキーワードを含まないユーザの発話を分類する可能性を検討するため、そのようなキーワードを含むツイートはデータセットから排除した。BERT、LSTM、SVMを学習させ、分類性能を比較した。BERTについては、大規模ツイートデータを用いた事前学習を行った。BERTが最も高い性能を示し、Accuracy 0.83, Recall 0.8, Precision 0.88,F1-score 0.84という実用レベルの高い分類性能を達成した。文脈情報の重要性とともに、一般的な発話からメンタルヘルス不調を推測しうることを示した。
著者
伊藤 詩乃 田中 佑岳 狩野 芳伸 榊原 康文
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.32, no.2, pp.F-AI30Ge_1-10, 2017-03-01 (Released:2017-03-01)
参考文献数
22

31 巻6 号AI30-G(2016 年)の論文において、本文引用箇所がすべて[?]として公開されているため、正しい情報を次ページより掲載します.
著者
狩野 芳伸
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

本稿では、多様な要素技術や国際標準を調和的に統合しつつ再利用性向上のためモジュール化設計したKachakoについて述べる。即座に実行可能な互換言語処理ツール群を加えて提供し、インストール・ワークフロー作成・大規模並列分散展開・視覚化・比較評価・配信共有までの徹底的な自動化サポートにより、専門知識がなくともエンドユーザから開発者まで誰でも効率的かつ容易にそれぞれのタスクを達成できるようにした。
著者
香月 祥 田中 宏和 中村 啓信 岸本 泰士郎 狩野 芳伸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
巻号頁・発行日
pp.4Xin150, 2023 (Released:2023-07-10)

我々はこれまで、診断や疾患評価、音声とその文字起こしや音声・言語学的アノテーションが付与されたUNDERPIN大規模精神疾患会話コーパスを構築してきた。このコーパスを用いて、うつ病患者の分類実験を行った。分類の際は、健常者・軽症患者・中等度以上の患者・うつ病と診断されたことがあるがテストの評価値で症状のない患者の4分類を設定し、4分類のすべてのペア6つそれぞれで2値分類を行った。結果、軽症・中等度以上の重症度に応じた分類ができること、また現在の症状にかかわらずうつ病になった性質で分類可能であることを確認した。分類に貢献した特徴量の分析では、重症度ごとに異なる特徴量や共通している特徴量を確認できた。今後は、新しい特徴量を追加しての学習や、特徴のもととなった人手のアノテーションを自動付与するシステムを構築したい。
著者
上山 彩夏 狩野 芳伸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.37, no.2, pp.G-L62_1-10, 2022-03-01 (Released:2022-03-01)
参考文献数
39

In recent years, there has been a lot of research on building dialogue systems using deep learning, which can generate relatively fluent response sentences to user utterances. Nevertheless, they tend to produce responses that are not diverse and which are less context-dependent. Assuming that the problem is caused by the Softmax Cross- Entropy (SCE) loss, which treats all words equally without considering the imbalance in the training data, a loss function Inverse Token Frequency (ITF) loss, which multiplies the SCE loss by a weight based on the inverse of the token frequency, was proposed and confirmed the improvement of dialogue diversity. However, in the diversity of sentences, it is necessary to consider not only the information of independent tokens, but also the frequency of incorporating a sequence of tokens. Using frequencies that incorporate a sequence of tokens to compute weights that dynamically change depending on the context, we can better represent the diversity we seek. Therefore, we propose a loss function, Inverse N-gram Frequency (INF) loss, which is weighted based on the inverse of the n-gram frequency of the tokens instead of the frequency of the tokens. In order to confirm the effectiveness of the proposed method on INF loss, we conducted metric-based and human evaluations of sentences automatically generated by models trained on the Japanese and English Twitter datasets. In the metric-based evaluation, Perplexity, BLEU, DIST-N, ROUGE, and length were used as evaluation indices. In the human evaluation, we assessed the coherence and diversity of the response sentences. In the metric-based evaluation, the proposed INF model achieved higher scores in Perplexity, DIST-N, and ROUGE than the previous methods. In the human evaluation, the INF model also showed superior values.
著者
箕輪 峻 狩野 芳伸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.DSI-F_1-13, 2020-01-01 (Released:2020-01-01)
参考文献数
17

Recently, end-to-end learning is frequently used to implement dialogue systems. However, existing systems still suffer from issues to handle complex dialogues. In this paper, we target on the conversation game “Mafia”, which requires players to make consistent and complex communications. We propose a middle language expression and a converter from natural language input. We implemented our dialogue system to play the Mafia game with humans and other automatic agents. Our evaluation on the play shows that our middle language increases conversion coverage.
著者
清田 直希 狩野 芳伸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.4E3OS7b02, 2019 (Released:2019-06-01)

法律文書は専門性が高いうえ、客観的な評価を求められるため、 自然言語処理の分野において非常に期待されている。 しかし、その文章は非常に複雑で多様な解析技術を要する。 そこで本論文では、まず司法試験自動解答を行うコンテスト型 ワークショップCOLIEE(Competition for Legal Information Extraction and Entailment)で配布されるテストデータを 要素ごとに手作業で分類し必要タスクごと(条件文抽出、否定形解釈) の概要をまとめた。そして特に人物関係に注目し、動詞や人物の役割を 基に法律文書の構造化の提案を行う。
著者
伊藤 詩乃 田中 佑岳 狩野 芳伸 榊原 康文
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌
巻号頁・発行日
vol.32, no.2, pp.F-AI30Ge_1-10, 2017

<p>31 巻6 号AI30-G(2016 年)の論文において、本文引用箇所がすべて[?]として公開されているため、正しい情報を次ページより掲載します.</p>
著者
狩野 芳伸 神門 典子
出版者
Japan Society of Information and Knowledge
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.23, no.2, pp.179-184, 2013-05-25
参考文献数
7

「ロボットは東大に入れるか」プロジェクトでは、最初の課題として大学入試センター試験の自動解答を目指している。本稿では、そのうち歴史系科目を対象とした解答器作成の試みを報告する。我が国の大学入試は、基本的に高校教科書の範囲内から出題されることになっている。しかし、人工知能が機械的に解くという観点でみると、範囲内というのは曖昧さがあるうえ、潜在的に人間の常識や知能を前提にしている。我々はあくまで教科書内の知識のみを用いるアプローチで、どこまで自動解答が可能かを試みた。歴史系科目とセンター試験の特性を鑑みて、解答にあたってはあえて論理的な構造や解析を排除し、教科書内の表現が肯定的であることを前提に単語を基本とする知識でどこまで解答可能かを探った。
著者
辻井 潤一 米澤 明憲 田浦 健次朗 宮尾 祐介 松崎 拓也 狩野 芳伸 大田 朋子 SAETRE Rune 柴田 剛志 三輪 誠 PYYSALO SAMPO Mikael 金 進東 SAGAE Kenji SAGAE T. Alicia 王 向莉 綱川 隆司 原 忠義
出版者
東京大学
雑誌
特別推進研究
巻号頁・発行日
2006

本研究は、文解析研究で成功してきた手法、すなわち、巨大な文書集合を使った機械学習技術と記号処理アルゴリズムとを融合する手法を、意味・文脈・知識処理に適用することで、言語処理技術にブレークスルーをもたらすことを目標として研究を遂行した。この結果、(1)言語理論に基づく深い文解析の高速で高耐性なシステムの開発、(2)意味・知識処理のための大規模付記コーパス(GENIAコーパス)の構築と公開、(3)深い文解析の結果を用いた固有名、事象認識などの意味・知識処理手法の開発、(4)大規模なテキスト集合の意味・知識処理を行うためのクラウド処理用ソフトウェアシステムの開発、において世界水準の成果を上げた。(2)で構築されたGENIAコーパスは、生命科学分野でのテキストマイニング研究のための標準データ(Gold Standard)として、国際コンペティション(BioNLP09、BioNLP11)の訓練・テスト用のデータとして、採用された。また、(1)の研究成果と機械学習とを組み合わせた(3)の成果は、これらのコンペティションで高い成績を収めている。また、(1)と(4)の成果により、Medlineの論文抄録データベース(2千万件、2億超の文)からの事象認識と固有名認識を数日で完了できることを実証した。その成果は、意味処理に基づく知的な文献検索システム(MEDIE)として公開されている。