著者
勝見 久央 井上 昂治 中村 静 高梨 克也 河原 達也
雑誌
第79回全国大会講演論文集
巻号頁・発行日
vol.2017, no.1, pp.241-242, 2017-03-16

人との自然なインタラクションの実現を指向する自律型アンドロイドにおいて,人間どうしの対話でみられる自然なタイミングでの笑いの実現は重要な要素である.また,笑いの中でも,一方が笑うともう一方がつられて笑うshared laughterは対話の場を和ませたり,盛り上げたりするなどの効果があると考えらえる.本稿では,人間とアンドロイドERICAとの1対1対話において,アンドロイドはいかなる場合に人間につられて笑うべきかという観点で,言語および韻律特徴量を分析する.また分析結果に基づき人間が笑った場合にアンドロイドがつられて笑うべきか否かの予測を試みる.
著者
井上 昂治 ラーラー ディベッシュ 山本 賢太 中村 静 高梨 克也 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.36, no.5, pp.H-L51_1-12, 2021-09-01 (Released:2021-09-01)
参考文献数
29
被引用文献数
1

An attentive listening system for autonomous android ERICA is presented. Our goal is to realize a humanlike natural attentive listener for elderly people. The proposed system generates listener responses: backchannels, repeats, elaborating questions, assessments, and generic responses. The system incorporates speech processing using a microphone array and real-time dialogue processing including continuous backchannel prediction and turn-taking prediction. In this study, we conducted a dialogue experiment with elderly people. The system was compared with a WOZ system where a human operator played the listener role behind the robot. As a result, the system showed comparable scores in basic skills of attentive listening, such as easy to talk, seriously listening, focused on the talk, and actively listening. It was also found that there is still a gap between the system and the human (WOZ) for high-level attentive listening skills such as dialogue understanding, showing interest, and empathy towards the user.
著者
河原 達也
雑誌
情報処理
巻号頁・発行日
vol.63, no.2, pp.77-78, 2022-01-15

高等学校で「情報I」が2022年度から必修化されることとなり,さらにその3年後から大学入試共通テストに導入されることが決定された.その意義と期待について,入学者選抜の観点,大学の情報教育の観点,および初等中等情報教育充実の観点から述べる.
著者
河原 達也 筧 捷彦 和田 勉 久野 靖 辰己 丈夫
雑誌
情報処理
巻号頁・発行日
vol.57, no.3, pp.270-277, 2016-02-15

2015年8月末,本会の元会長であり,現在は日本学術振興会理事長である安西祐一郎先生へのインタビューが行われた.安西先生は,現在は文部科学省に設置された高大接続システム改革会議の座長である.本会からは,河原達也(教育担当理事/京都大学),筧捷彦(教育委員会委員長/早稲田大学),和田勉(初等中等教育委員長/長野大学),久野靖(会誌編集委員/筑波大学),辰己丈夫(会誌編集委員/放送大学),および事務局から後路が参加した.
著者
森 信介 中田 陽介 Neubig Graham 河原 達也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.18, no.4, pp.367-381, 2011 (Released:2011-12-28)
参考文献数
15
被引用文献数
3 6

本論文では,形態素解析の問題を単語分割と品詞推定に分解し,それぞれの処理で点予測を用いる手法を提案する.点予測とは,分類器の素性として,周囲の単語境界や品詞等の推定値を利用せずに,周囲の文字列の情報のみを利用する方法である.点予測を用いることで,柔軟に言語資源を利用することができる.特に分野適応において,低い人的コストで,高い分野適応性を実現できる.提案手法の評価として,言語資源が豊富な一般分野において,既存手法である条件付き確率場と形態素 n-gram モデルとの解析精度の比較を行い,同程度の精度を得た.さらに,提案手法の分野適応性を評価するための評価実験を行い,高い分野適応性を示す結果を得た.
著者
井上 昂治 Lala Divesh 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 93回 (2021/11) (ISSN:09185682)
巻号頁・発行日
pp.155-160, 2021-11-20 (Released:2021-11-20)

音声対話システムがユーザとの関係性を構築・維持するためには、ユーザに対して共感を示すことが重要である。共感を示すためのふるまいとして笑いに着目するが、適切なタイミングで適切な笑いを生成することは高度な対話理解を要する。そこで、本研究ではユーザが先行して笑った場面に限定し、そこでシステムも笑う「共有笑い」の生成に取り組む。提案システムは、(1)ユーザの笑いの検出、(2)システムによる共有笑いの有無の予測、(3)システムの笑いの種類の選択、これら3つのモジュールで構成される。各モジュールの入力は先行するユーザ発話の音響特徴である。著者らが収録したお見合い対話データを用いて各モジュールのモデルを学習した。特に、(2)共有笑いの有無の予測では、ベースライン(ランダム)よりも高い精度で予測できることを確認した。
著者
河原 達也 奥田 統己
出版者
京都大学
雑誌
挑戦的研究(萌芽)
巻号頁・発行日
2018-06-29

アイヌ民話(ウウェペケレ)の音声認識の研究に取り組んだ。2つの博物館から提供されたアイヌ語アーカイブのデータを元に、沙流方言を対象としたアイヌ語音声コーパスを構築した。このコーパスを用いてEnd-to-Endモデルに基づく音声認識システムを構成した。音素・音節・ワードピース・単語の4つの認識単位について検討し、音節単位が最もよいことを示した。音声認識精度が話者オープン条件において大幅に低下する問題に対して、CycleGANを用いた教師なし話者適応を提案した。さらに、日本語とアイヌ語が混合した音声に対して、音素認識と単語認識を組み合わせることで、アイヌ語の区間の検出(言語識別)を実現した。
著者
吉野 幸一郎 森 信介 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.1, pp.53-59, 2014-01-05 (Released:2014-01-07)
参考文献数
28

A novel text selection approach for training a language model (LM) with Web texts is proposed for automatic speech recognition (ASR) of spoken dialogue systems. Compared to the conventional approach based on perplexity criterion, the proposed approach introduces a semantic-level relevance measure with the back-end knowledge base used in the dialogue system. We focus on the predicate-argument (P-A) structure characteristic to the domain in order to filter semantically relevant sentences in the domain. Moreover, combination with the perplexity measure is investigated. Experimental evaluations in two different domains demonstrate the effectiveness and generality of the proposed approach. The combination method realizes significant improvement not only in ASR accuracy but also in semantic-level accuracy.
著者
山本 賢太 井上 昂治 中村 静 高梨 克也 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.33, no.5, pp.C-I37_1-9, 2018-09-01 (Released:2018-09-03)
参考文献数
20

This paper addresses character expression for humanoid robots that play a given social role such as a lab guide or a counselor via spoken dialogue so that the character matches to the social role. While most conventional methods of character expression aim to change the style of utterance texts, this study focuses on dialogue features that may affect the impression of spoken dialogue. Specifically, we use five features: utterance amount, backchannel frequency, backchannel variety, filler frequency, and switching pause length. We adopt three character traits of extroversion, emotional instability, and politeness for a character expression, and investigate the relationship with the dialogue features. A statistical analysis of subjective evaluations shows that the dialogue features except for the backchannel variety are related to either of the traits. By using the subjective evaluation scores on the relevant traits, we can train models to control the dialogue features and behaviors according to the desired character. An experimental evaluation demonstrates the feasibility of character expression with regard to the traits of extroversion and politeness.
著者
李 晃伸 河原 達也 堂下 修司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.1, pp.1-9, 1999-01-25
被引用文献数
80

大語彙連続音声認識のための効率の良い段階的 (2パス) 探索手法を提案する. 中間表現として従来広く用いられているN-best表現の一種である単語グラフ形式は, 単語単位で決定的に区分化するためにコンテクストに依存したマッチング長の変動を表現できず, 直前単語ごとに仮説を多重化する単語対近似に伴う処理量の増大が著しい. これに対して単語トレリスインデックスという形式を提案する. 仮説を多重化せずに, 第1パスのトレリスでビーム内に残った単語終端ノードのゆう度と対応する始端をすべて保存することで, 単語境界の存在範囲のあいまい性を保持する. 第2パスではこれを逆引きすることで探索空間の絞込みを行い, またヒューリスティックスコアとして用いることで, 大語彙においても高精度かつ効率の良い探索を実現する. 5000語の毎日新聞記事読上げタスクで評価を行った結果, 単語グラフ形式に比べて高精度であることが確かめられた. 更に仮説を多重化しない1-best近似を用いることで, メモリ効率を10倍以上改善しながら従来手法とほぼ同等の認識精度が得られた. 単語間音素環境依存性を考慮した最終的な単語認識精度は91.4%を達成した.
著者
横井 謙太朗 河原 達也 堂下 修司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.71-78, 1997-01-17
被引用文献数
9

ニュース音声データベースから特定の話題に関連したニュース音声を検索するシステムを実現するため、ニュース音声に話題情報を付与することを考える。新聞記事のテキストデータベースから話題を規定するキーワードを抽出し、それらの話題依存性の統計量を求める。認識器により抽出されたキーワードをもとにこの話題依存性の晴報を総合していくことで、文全体の話題を同定する。今回は、単一単語の話題依存性だけでなく単語共起のもつ話題依存性も利用する機構を提案する。これによってより誤りに強い話題同定が行なえることを、シミュレーションにより実験・評価する。
著者
西光 雅弘 秋田 祐哉 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.69, pp.25-30, 2005-07-15

本稿では落語を対象に劇場内においてリアルタイムで字幕を付与する方法を検討する.落語は演目ごとに基本的なシナリオ(台本)が決まっており,同一演者・演目の音声データとその書き起こしの収集が可能であることから,これを用いて当該演目専用の音響モデルと言語モデルを構築する.特に,台本からの逸脱への頑健性を保持しながら,言語的制約を強力に反映させるために,言語モデルの単位として文節を採用する.実際の落語3演目を用いて認識実験を行ったところ,3演目平均で90%に近い単語認識精度を得た.Automatic real-time captioning of Rakugo using large vocabulary continuous speech recognition is addressed. Rakugo is a Japanese traditional monologue show of story telling performed by a professional Rakugo-ka. Rakugo-ka follows a script, but does not read out it like drama. For automatic captioning, we construct a dedicated language model from the script and an adapted acoustic model. In addition, we adopt the phrase (bunsetsu) unit for language modeling. At this moment, we achieved word accuracy close to 90%.
著者
小窪 浩明 畑岡 信夫 李晃伸 河原 達也 鹿野 清宏
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.11, pp.2597-2606, 2009-11-15
被引用文献数
1

PC向け連続音声認識プログラムJuliusのSuperHマイコン(SH-4A)への搭載に関して行った処理の高速化と,評価実験について報告する.計算リソースの限られたマイコン上で動作させるため,仮説探索時のメモリ管理の最適化や音響尤度計算の高速化を実施した.語彙数5,000語での評価実験では,最適化前のJuliusの実行速度に対して3.7倍の高速化を実現し,SH-4A上での実時間動作を達成した.また,語彙数20,000単語での評価でも実時間の1.25倍で動作すること確認した.最後に,応用アプリケーションとしてT-Engine上に実装した質問応答システムについて報告する.To expand CSR (continuous speech recognition) software to the mobile environmental use, we have developed embedded version of Julius (Embedded Julius). In this paper, we describe an implementation of the "Embedded Julius" on a SH-4A microprocessor. SH-4A is a high-end MPU with on-chip FPU. However, further computational reduction is necessary for the CSR software to operate real-time. Applying some optimizations (efficient memory management, modified GMS), the "Embedded Julius" achieves real-time processing on the SH-4A. The experimental results show 0.73 x real-time, resulting 3.7 times faster than baseline CSR. We also evaluated the "Embedded Julius" on a large vocabulary task (20,000 words). It shows almost real-time processing (1.25 x RT). Finally, We introduced Q & A guidance systems developed for embedded applications.
著者
李 晃伸 河原 達也 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.49, pp.281-286, 2003-12-18
参考文献数
15
被引用文献数
7

音声認識システムにおいて,認識結果に対して事後確率などを用いて信頼度を付与することで,発話検証や対話管理などの音声アプリケーションにおいて認識誤りを考慮したより高度な処理を行うことができる.この単語の事後確率を用いた信頼度算出では,通常,認識処理(デコーディング)の結果得られた仮説群のゆう度をもとに計算されるが,十分な精度の確信度を得るためにはN-best候補で数百以上の大量の文仮説を求める必要があり,多くの計算量を必要とする.本研究では,2パストリートレリス探索に基づくデコーディングにおいて,探索中に得られる部分文仮説の尤度から単語の信頼度を簡易かつ高速に算出するアルゴリズムを提案する.後段パスのスタックデコーディングにおける単語仮説展開時に,その次単語仮説の集合およびそれぞれから展開される新たな仮説のヒューリスティックを含む尤度から,その展開単語の事後確率を計算する.通常のデコーディング処理に対して極めて少ない計算量で信頼度を計算できる.認識エンジンJuliusにおいて,N-best候補から事後確率を算出する従来手法との比較を行った結果,提案手法は大量のN-best候補を求める必要がないことから認識処理全体を非常に高速に行え,また信頼度の精度も,簡易な計算法ながらN-best候補を用いる手法と同等以上の信頼度を算出できることが示された.
著者
壇辻 正剛 坪田 康 河崎 靖 道坂 昭廣 平岡 斉士 大木 充 河原 達也 木南 敦
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2008

本研究では、日本人学習者の外国語のコミュニケーション能力向上を目指して、ICT(情報通信技術)を利用したCALL(コンピュータ支援型語学教育)やe-ラーニングを含む応用言語学的研究を展開した。国際化時代に有効な会話主体の外国語教育支援システムの開発を推進し、良質で多様な言語文化の理解が可能なコンテンツの開発に基づきICT支援型の教材も作成した。研究成果の一部であるマルチメディア教材は希望する教育機関や研究機関に提供することができた。
著者
越智 景子 井上 昂治 ララ ディベッシュ 河原 達也 熊崎 博一
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 99回 (2023/12) (ISSN:09185682)
巻号頁・発行日
pp.78-83, 2023-12-04 (Released:2023-12-04)

精神科デイケア(精神科リハビリテーション外来)における傾聴ロボットの「きくロボ」の有用性について検討する。利用者が発した言葉を繰り返すなどのカウンセリング技法に基づいて開発された傾聴ロボットが、精神科デイケアの環境でが効果的な活動を提供できるかどうかを評価するために、会話実験を行った。ロボットは、18名のデイケア利用者が最近印象に残った出来事について話すのを最長3分間傾聴を実施した。その結果、会話によって自己評価の覚醒度が高まることが示された。また対話システムの応答の分析により、きくロボの評価応答や相槌の頻度が頻度が高かった対話のほど協力者が対話後に気分が改善したことが分かった。