著者
吉井 和輝 Eric Nichols 中野 幹生 青野 雅樹
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2015-SLP-106, no.4, pp.1-8, 2015-05-18

単語ベクトルは,統計的自然言語処理で利用しやすい分散意味表現として近年盛んに用いられるようになってきた.しかしながら,今まで主に英語で評価されてきたため,英語以外の言語での有効性は不明である.本研究では,単語の類推 (word analogy) と文完成 (sentence completion) の二つの評価タスクを用い,著名なオープンソースツールである word2vec (gensim の再実装) と GloVe を用いて構築した日本語単語ベクトルの評価を行った.単語の類推タスクでは,英語データで公表されている結果に近い結果を得たが,文完成のタスクでは,精度が大幅に減少した.本稿では,両タスクのエラー解析で明らかになった英語の単語ベクトルと日本語の単語ベクトルの性能差や,日本語特有の問題について調査した結果について述べる.
著者
中野 幹生
雑誌
情報処理
巻号頁・発行日
vol.62, no.10, pp.e1-e6, 2021-09-15

この10年,人間と自然言語で対話するシステム,すなわち,対話システムの技術を用いたさまざまなサービスや製品が提供・販売されるようになってきました.しかしながら,対話システムは,複数の分野の技術を総合してつくる必要があるため,全体像がつかみにくいのが現状である.本稿では,対話システムとは何か,および,対話システムの分類,一般的な構成,利点などを説明した後,今後の方向性について考察する.
著者
中野 幹生 駒谷 和範
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
巻号頁・発行日
pp.4A2GS604, 2023 (Released:2023-07-10)

対話システムの構築には様々な技術の統合が必要なため,情報技術教育の題材として有効であると考えられる.しかしながら,既存の対話システム構築フレームワークは情報技術教育を目的としたものではないため,必ずしも初学者が学習目的で使うのに適しているとは言えない.そこで我々は,拡張性の高いアーキテクチャを持ち,可読性の高いコードで書かれた対話システム構築フレームワークDialBBを開発している.DialBBは,ブロックと呼ぶモジュールを組み合わせることで対話システムを構築できる.システム開発者は,DialBB付属のブロックを用いることで簡単にシステムを構築できるが,自作のブロックを用いて高度なシステムを構築することもできる.DialBBを複数のシステムの構築に利用してもらい,対話システム構築フレームワークとしての有用性を確認した.
著者
吉井 和輝 Eric Nichols 中野 幹生 青野 雅樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.4, pp.1-8, 2015-05-18

単語ベクトルは,統計的自然言語処理で利用しやすい分散意味表現として近年盛んに用いられるようになってきた.しかしながら,今まで主に英語で評価されてきたため,英語以外の言語での有効性は不明である.本研究では,単語の類推 (word analogy) と文完成 (sentence completion) の二つの評価タスクを用い,著名なオープンソースツールである word2vec (gensim の再実装) と GloVe を用いて構築した日本語単語ベクトルの評価を行った.単語の類推タスクでは,英語データで公表されている結果に近い結果を得たが,文完成のタスクでは,精度が大幅に減少した.本稿では,両タスクのエラー解析で明らかになった英語の単語ベクトルと日本語の単語ベクトルの性能差や,日本語特有の問題について調査した結果について述べる.
著者
武田 龍 駒谷 和範 中島 圭祐 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.37, no.3, pp.IDS-B_1-9, 2022-05-01 (Released:2022-05-01)
参考文献数
24

Dialogue system development involves a variety of factors and requires multifaceted consideration, so design guidelines would be helpful. Although a neural-based approach can be used, it requires a vast amount of dialogue data and would take too much effort to collect them to develop a system for a specific and fixed-length dialogue. Furthermore, errors in automatic speech recognition and language understanding should be explicitly considered in the design because they are inevitable when the system talks with general users and would lower their impressions. We propose design guidelines for developing dialogue systems. Our systems developed with the aid of these guidelines took first place in two dialogue system competitions: the situation track of the second Dialogue System Live Competition and a pre-preliminary test of the Dialogue Robot Competition. Our proposed design guidelines are to (1) make the system take initiative, (2) avoid dialogue flows from relying too much on user utterances, and (3) include in system utterances that the system understands what the user said. We also show more details regarding the systems designed for each of the two competitions with examples, such as the dialogue examples in the two competitions and the scores of questionnaire by real users.
著者
石川 真也 船越 孝太郎 篠田 浩一 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第27回全国大会(2013)
巻号頁・発行日
pp.1K3OS17a5, 2013 (Released:2018-07-30)

複数人のユーザと同時に対話できるマルチモーダル対話システムの構築を目指して,3人1組のグループが1体の小型ロボットと簡単なゲームを行う対話データを収集した.本発表では収集したデータの概要と,いくつかの側面からの分析結果を報告する.対話データの収集はWizard-of-Oz形式で行い,3人の参加者は監督者からの簡単な指示を受けて対話の場に出入りを繰り返し,ロボットとゲームを行った.
著者
小松 孝徳 山田 誠二 小林 一樹 船越 孝太郎 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.6, pp.733-741, 2010 (Released:2010-09-14)
参考文献数
17
被引用文献数
3 2

We describe artificial subtle expressions (ASEs) as intuitive notification methodology for artificial agents especially in order to convey their internal states for users. We prepared two types of audio ASEs; one is a flat artificial sound (flat ASE), and the other is a decreasing sound (decreasing ASE). These two ASEs were played after a robot made a suggestion to the users. Specifically, we expected that the decreasing ASE will inform users of the robot's lower confidence about the suggestions. We then conducted a simple experiment to observe whether the participants accepted or rejected the robot's suggestion in terms of the ASEs. The result showed that they accepted the robot's suggestion when the flat ASE was used, while they rejected it when the decreasing ASE was used. Therefore, we found that the ASEs succeeded in conveying the robot's internal state to the users accurately and intuitively.
著者
杉山 貴昭 船越 孝太郎 中野 幹生 駒谷 和範
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.3, pp.C-FB2_1-9, 2016-05-01 (Released:2016-05-25)
参考文献数
18
被引用文献数
1

When a robot interacts with users in public spaces, it receives various sounds such as surrounding noises and users' voices. And furthermore, the robot needs to interact with multiple people at the same time. If the robot incorrectly determines whether it should respond to these sounds, it will erroneously respond to surrounding noises or ignore user utterances directed to the robot. In this paper, we present a machine learning-based method to estimate a response obligation, i.e., whether the robot should respond to an input sound. We address a problem setting that is more similar to interactions in public spaces than those assumed in previous studies. While previous studies assume only utterances directed to one of interlocutors as input sounds, we deal with not only those utterances but also noises and monologues. To deal with various sounds, our method uses the results of input sound classification and user behaviors both in an input sound interval and after the interval. In particular, the user behaviors after the interval are introduced as a key factor for improving the estimation accuracy of response obligation, such as a tendency that a user stands and keeps still after he/she talks to the robot. We demonstrate the new features significantly improved the estimation performance. We also investigate performances with various combinations of features and reveal that the results of input sound classification and the user behaviors after the interval are helpful for the estimation.
著者
小松 孝徳 小林 一樹 山田 誠二 船越 孝太郎 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.27, no.5, pp.263-270, 2012 (Released:2012-08-30)
参考文献数
16
被引用文献数
1

Expressing the confidence level of a system's suggestions by using speech sounds is an important cue to users of the system for perceiving how likely it is for the suggestions to be correct. We assume that expressing confidence levels by using human-like expressions would cause users to have a poorer impression of the systems than if artificial subtle expressions (ASEs) were used when the quality of the presented information does not match the expressed confidence level. We confirmed that this assumption was correct by conducting a psychological experiment.
著者
中野 幹生 駒谷 和範
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 第96回(2022.12) (ISSN:09185682)
巻号頁・発行日
pp.39, 2022-12-01 (Released:2022-12-01)

対話システムは,様々な技術を統合して構築されるため,情報技術教育の題材として有効であると考えられる.しかしながら,既存の対話システム構築フレームワークは,情報技術教育を目的としたものではないため,必ずしも初学者が学習目的で使うのに適しているとは言えない.そこで我々は,拡張性の高いアーキテクチャをもち,可読性の高いコードで書かれた対話システム構築フレームワークDialBBを開発している.DialBBは,ブロックと呼ぶモジュールを組み合わせることで対話システムを構築できるフレームワークである.システム開発者は,DialBB付属のブロックを用いることで簡単にシステムを構築できるが,自作のブロックを用いることで高度なシステムを構築することもできる.DialBBを対話ロボットコンペティション2022用のシステムの構築に利用してもらい,対話システム構築フレームワークとしての有用性を確認した.
著者
若林 啓 竹内 誉羽 平松 淳 中野 幹生
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.1N3J903, 2019 (Released:2019-06-01)

本論文では,音声言語理解の代表的な形式であるスロットフィリングタスクを,入力文の最適分割を求める問題として定式化するアプローチを提案する.この定式化を用いることで,系列ラベリングとして定式化して深層学習を適用する従来の手法に比べ,小さい計算資源で実行可能な言語モデルの学習に基づいた手法を導くことができる.提案手法は,モデルの学習をワンパスアルゴリズムによって高速に行い,最も確率の高い解釈の推定を動的計画法を用いて効率的に行う.実験により,提案手法は深層学習手法と同等の推定精度を達成しつつ,高速かつ省メモリに動作することを確認する.
著者
田口 亮 岩橋 直人 能勢 隆 船越 孝太郎 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第23回全国大会(2009)
巻号頁・発行日
pp.1F2OS72, 2009 (Released:2018-07-30)

本稿では,単語の知識を持たないロボットが,人の自由な発話から物や場所の名前を学習する手法を提案する.初期の単語候補は,学習データの音素認識結果から生成する.この単語候補を用いて単語認識と意味・文法の学習を行い,統計的モデル選択の基準を元に,音響的,文法的,意味的に不要な単語を削除・連結する.そして再び単語認識を行う.これを繰り返すことで,単語の正しい音素系列と意味が獲得される.
著者
大野 航平 武田 龍 中野 幹生 ニコルズ エリック 駒谷 和範
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

我々は,暗黙的確認により対話システムの知識にない単語(未知語)の獲得を行う手法の開発に取り組んできた.システムは未知語のクラスを含めた暗黙的確認要求をユーザに対して行い,ユーザの応答からその内容が正しいとわかった場合に,そのクラスを獲得する.本論文では,ユーザの応答などに基づいて正しい確認要求を抽出する手法と,同じ確認要求に対する複数の抽出結果を用いてより確実に知識を獲得する手法とについて述べる.
著者
中野 幹生 島津 明 小暮 潔
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.45-46, 1996-03-06
被引用文献数
2

話し言葉により人間と自然に会話できる計算機を作るためには,自然な対話文を解析して,意味を求める方法を構築する必要がある.そのためには,まず,対話文が書き言葉の文とどのように異なるかを調べる必要がある.そこで,問い合わせや仕事の依頼の電話対話,野球中継,ラジオ電話相談の書き起こしデータを分析し,対話文特有の現象の調査を行っている.これらの対話は,あらかじめ状況を設定して行われたものではなく,自然に行われた対話である.次に,発見された現象を分類整理し,個々の現象について対処法を考える必要がある.この時,どのように現象を分類するかが問題となる.現象の分類と対処法の構築は分離して行えるものではなく,処理の枠組をどうとるかに応じて分類が決まる.話し言葉には,一見規則がないように見えるが,よく観察すると,一定の規則性が見られる.我々は,書き言葉の文法を構築しなおすことによって話し言葉を扱う立場で分析を進めている.竹沢らは,状況を設定して行われた対話の調査を基にして,対話特有の現象を扱う音声認識用の文法を構築しているが,網羅的であるかどうか,また,どのように意味関係を求めるのか明かでない.本稿では,文法枠組として,統語構造と意味表現の関係が明確な単一化文法を用い,この観点からの対話文特有の現象の整理を試みる.文法の拡張法として,語彙項目の追加,素性制約の緩和,句構造規則の追加,文の概念の拡張の四つを考え,これらの拡張を書き言葉の文法に施すことにより対処できる現象について述べる.今までに調べられている現象は,これらの四つに分類が可能である.
著者
小林 一樹 船越 孝太郎 小松 孝徳 山田 誠二 中野 幹生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.4, pp.604-612, 2015-07-01 (Released:2015-05-21)
参考文献数
30
被引用文献数
2

In this paper, we describe an investigation into users' experiences of a simple talking robot with back-channel feedbacks that is designed based on an artificial subtle expression (ASE). In the experiments with participants, they are divided into six conditions based on an expression factor (three levels; human-like speech, blinking light, and beeping sound) and a timing decision method factor (two levels; a linguistic method and an acoustic method) for investigating participants' impressions on the dialogue experience. We developed an electric pedestal to show the blinking expression, on which a simple cubic robot was fixed. Participants engaged in a task of explaining a cooking procedure with a spoken dialogue system coupled with the robot on the pedestal. The robots responded to them by making the back-channel feedbacks in accordance with the expression factor. The results of questionnaire analyses suggested that the ASE-based expressions of back-channel feedback provide positive experiences for users.
著者
中野 幹生 能勢 隆 田口 亮 水谷 了 中村 友昭 船越 孝太郎 長谷川 雄二 鳥井 豊隆 岩橋 直人 長井 隆行
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

発話と画像情報を入力として,物の名前を覚えるロボットが研究されているが, 名前を覚えさせるモードをあらかじめ設定しておかなくてはならなかったり, 名前を覚えさせる発話のパタンが決まっていたりした.本稿では,さまざまな ドメインの対話を行うことができ,対話の途中で物の名前を教示する発話を聞 くと学習を行うことができるロボットのアーキテクチャとその実装について述 べる.
著者
田口 亮 岩橋 直人 船越 孝太郎 中野 幹生 能勢 隆 新田 恒雄
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.4, pp.549-559, 2010 (Released:2010-06-30)
参考文献数
18
被引用文献数
2 2

This paper proposes a method for the unsupervised learning of lexicons from pairs of a spoken utterance and an object as its meaning under the condition that any priori linguistic knowledge other than acoustic models of Japanese phonemes is not used. The main problems are the word segmentation of spoken utterances and the learning of the phoneme sequences of the words. To obtain a lexicon, a statistical model, which represents the joint probability of an utterance and an object, is learned based on the minimum description length (MDL) principle. The model consists of three parts: a word list in which each word is represented by a phoneme sequence, a word-bigram model, and a word-meaning model. Through alternate learning processes of these parts, acoustically, grammatically, and semantically appropriate units of phoneme sequences that cover all utterances are acquired as words. Experimental results show that our model can acquire phoneme sequences of object words with about 83.6% accuracy.