著者
巖寺 俊哲 石崎 雅人 森元 逞
雑誌
全国大会講演論文集
巻号頁・発行日
vol.51, pp.97-98, 1995-09-20
被引用文献数
1

機械翻訳システムあるいは対話システムにおいてある発話を処理する場合、より適切な翻訳/処理結果などを得るためには、その発話が先行するどの発話と関係しているかを考慮することが必要となる。たとえば、ある応答発話「はいそうです」を英語に翻訳する場合、これに対応する先行発話であるyes-no疑問文を発見し、その発話に応じてその呼応関係を考慮して「Yes, I am.」、「Yes, it is.」あるいは「No, you can't.」といった結果を生成する必要がある。従来から対話構造(談話構造あるいは談話セグメント等とよばれている)に関する研究が行なわれている(たとえば[1])。また、このような構造に関して、対話コーパス中の対話について被験者によりセグメントを行ない、この結果を用いた定量的な研究が行なわれている。例えば、Litman & Passonneau[2]は、対話中の談話セグメント境界を発見するための性質とアルゴリズムについて研究している。また、Hirschberg, Nakatani & Grosz[3]は、談話セグメントと韻律情報の関係について研究している。我々は、対話中の発話間の関係(対話構造)を認識する方法を提案している。Litman & Passonneau[2]のアルゴリズムは、セグメント間の境界を発見するのに対して、我々の提案する方法では、対話構造を3階層からなる構造で認識するため構造間の関係を含めて捉えること可能となる。現在、この方法の正当性、有効性あるいは問題点を調査するために、対話コーパスを用いた定量的な評価を行なっている。本稿では、この対話構造に関する定量的評価のための予備調査の結果と照応・省略と対話構造の定量的な関係について報告する。
著者
森元 逞 田代 敏久 竹澤 寿幸 永田 昌明 谷戸 文廣 浦谷則好 鈴木 雅実 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.9, pp.1726-1735, 1996-09-15
参考文献数
21
被引用文献数
5

日本語から英語へ翻訳可能な音声翻訳実験システム(ASURA)を開発した. ASURAでは 分野間の移植性を確保できるよう 一般的な日本語話し言葉の表現を網羅するとともに 音声認識と言語翻訳のコンポーネントのいずれも 名詞や動詞などの分野に依存する辞書項目を容易に入れ替え可能な構成としている. また 音声認識や言語翻訳にともなって発生する暖昧さ(複数の候補)に対処するため 正しい候補を効率良く選択できるようにコンポーネント間 サブコンポーネント間で機能分担を行い また候補の探索メカニズムを組み込んでいる. 本論文では このようなASURAのシステム構成について述べ また システムの性能評価を行い このシステム構成の有効性を示す.We have developed the experimental speech translation system ASURA, which translates from Japanese to English. In order to keep high portability to various domains, most of the common expressions in spoken Japanese are covered, and both the speech recognition and language translation components are constructed so that domain-dependent lexical items such as nouns and verbs are easy to replace. Furthermore, all of the components and sub-components in the system share functionalities so that they can effectively reduce ambiguities created in the course of speech recognition and language translation processing. The candidate search mechanisms are also incorporated for the same purpose. This paper describes the configuration and performance evaluation of the system, and demonstrates the effectiveness of the configuration.
著者
北 研二 小倉 健太郎 森元 逞 矢野 米雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.9, pp.1937-1943, 1993-09-15
被引用文献数
30

自然言語処理では、形態素レベルにおける曖昧性や統語的な曖昧性などさまざまな曖昧性に対処する必要がある。このような曖昧性を軽減するための実際的な方法の一つに、慣用表現や定型表現等の複合的な表現を一つのまとまりとして処理することがあげられる。近年、世界各地で大規模コーパスの構築が行われており、大量な言語データが容易に手に入るようになってきている。本論文では、頻繁に使用される定型的な表現をコーパスから自動的に抽出する基準として「仕事量」という概念を導入する。仕事量は、いくつかの単語を一まとまりの単位と考えることにより、各単語を別個に処理するよりも、どれだけの処理が削減できるかということを定量的に測る尺度である。また、仕事量基準を用いた定型表現の自動抽出方法について述ぺ、提案した方法を実際の日本語のコーパスに適用することにより、その有効性を示す。また、コーパスから抽出された定型表現を形態素解析に組み入れることにより、単語区切りや単語誤りをはじめとする形態素レベルの誤りを削減できることを示す。
著者
高橋 伸弥 森元 逞
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.204, pp.55-59, 2005-07-16

従来の音声認識では、咳やくしゃみ、あくびのような非言語音または非音声音は、誤認識を引き起こす雑音として扱われて来た。しかし、自然な音声対話を実現する場合、このような音情報も積極的に利用すべきである。このような非言語音声を検出する方法としては、対象音の音響信号的な特徴を用いた信号処理的アプローチや、対象音から学習したHMMを用いる音声認識的アプローチなどがあるが、対象音の多様性に対処するためには、いずれも多量のデータが必要となる。そこで本研究では、対象となる非言語音声を音素系列で近似表現した疑似単語モデルを提案する。このモデルは、音素認識の結果得られる音素系列をクラスタリングし、上位クラスターの中心となる音素列パターンを非言語音声の近似的な発音とするというものである。提案手法の有効性を確認するために、咳及び咳払いを対象として、音声認識実験を行い、咳/咳払いの波形を学習データとしたHMMを用いる手法と比較して、認識正解率、認識精度が改善されることを示した。
著者
高橋 伸弥 森元 逞
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.73, pp.135-139, 2005-07-23
被引用文献数
4

従来の音声認識では、咳やくしゃみ、あくびのような非言語音または非音声音は、誤認識を引き起こす雑音として扱われて来た。しかし、自然な音声対話を実現する場合、このような音情報も積極的に利用すべきである。このような非言語音声を検出する方法としては、対象音の音響信号的な特徴を用いた信号処理的アプローチや、対象音から学習したHMMを用いる音声認識的アプローチなどがあるが、対象音の多様性に対処するためには、いずれも多量のデータが必要となる。そこで本研究では、対象となる非言語音声を音素系列で近似表現した擬似単語モデルを提案する。このモデルは、音素認識の結果得られる音素系列をクラスタリングし、上位クラスターの中心となる音素列パターンを非言語音声の近似的な発音とするというものである。提案手法の有効性を確認するために、咳及び咳払いを対象として、音声認識実験を行い、咳/咳払いの波形を学習データとしたHMMを用いる手法と比較して、認識正解率、認識精度が改善されることを示した。This paper proposes imitated word models that represent non-verbal sounds,especially cough sounds here,as phoneme sequences. In conventional speech recognition systems,non-verbal sounds,so-called human noises,are processed as burden noises that cause mis-recognition. Non-verbal sounds are,however,important information to know user`s physical and psychological condition. In particular,coughing is one of the most important barometers of daily health check,so we propose an approach to cough sounds from user utterances using the imitated word models constructed by clustering of phoneme sequences obtained in phoneme recognition. The experimental results show that this approach can improve the correct rates and the accuracies for words and coughs compared with the approach using HMM constructed from cough waveforms.
著者
永井 明人 北 研二 花沢 利行 川端 豪 鹿野 清宏 森元 逞 嵯峨山 茂樹 榑松 明 鈴木 忠 岩崎 知宏 中島 邦男
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.9, pp.723-729, 1994-09-01
被引用文献数
1

本稿は、大語彙の連続音声認識を実時間で処理するための、HMM-LR連続音声認識装置の設計、処理性能について述べる。HMM-LR法は、一般化LR構文解析により入力音声データ中の音素を予測し、予測された音素の存在確率をHMM音素照合により調べることで、音声認識と言語処理を同時進行させる方式であり、高精度で効率的な処理系を構成することができる。処理量が極めて大きな継続時間制御付きトレリス計算を伴うHMM-LR連続音声認識を実時間で実行するために、本装置は種々の高速化手法を33個のDSPを用いて実現した。その結果、連続文節発声の入力音声に対し、入力文の長さに依らずに、発声終了後から2〜3秒ですべての認識処理を終了する処理速度を達成した。
著者
福井 義和 北 研二 永田 昌明 森元 逞
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1996, no.27, pp.111-118, 1996-03-14
参考文献数
7
被引用文献数
2

確率・統計的手法に基づいた対話のモデル化について研究し、このような対話モデルを大規模言語データベースであるコーパスから自動的に生成するための実験を行なった。実験に用いたコーパスは、ATR対話コーパスであり、各発話には話者ラベルおよび発話行為タイプ(FT; Illocutionary Force Typ)が付与されている。Ergodic HMMおよびALERIGIAアルゴリズムを用いて、話者ラベルおよびIFTの系列をモデル化することにより、話者の交替や質問・応答・確認といった会話の基本的な構造を確率・統計的にモデル化することができた。In the work described here, we automatically deduce dialogue structures from a corpus with probabilistic methods. Each utterance in the corpus is annotated with a speaker label and an utterance type called IFT (Illocutionary Force Type). We use an Ergodic HMM(Hidden Markov Model) and the ALERGIA algorithm, an algorithm for learning probabilistic automata by means of state merging, to model the speaker-IFT sequences. Our experiments successfully extract typical dialogue structures such as turn-taking and speech act sequencing.
著者
井ノ上 直己 森元 逞
雑誌
全国大会講演論文集
巻号頁・発行日
vol.42, pp.200-201, 1991-02-25
被引用文献数
1

日本語文を理解するためには種々の知識が必要である。とりわけ、シソーラスは自然言語処理における最も重要な知識である。しかし、田中らが指摘しているように、既存のシソーラスには下位の部分で多種多様な連想関係が存在するため、そのまま自然言語処理に適応するには問題が多い。そこで、自然言語処理に使用できるシソーラスを体系だてて作成する方法が、種々提案されているが、すべてを人手で作成することは容易ではない。一方、国語辞典の語釈文や客観的なデータ(例えば、名詞と動詞の係り受けデータ)を用いて自動的に単語を分類する手法も提案されている。前者は普遍的なシソーラスの作成が期待できる。また、後者の手法はクラスタリング手法と呼ばれ、なんらかの意味的な近さを表す距離を用いて、通常階層的に分類する。しかし、このような距離を用いる場合、妥当な意味分類ができるように??闘値を定める必要があるため、原理的にはすべての単語に対して階層構造を作成することが可能であるが、シソーラスではなくむしろ意味素性を作成することが目的となる。そこで、筆者らは比較的作成が容易なシソーラスの上位は人手により作成したものあるいは既存のシソーラスを用い、人手により作成が困難と思われる下位のレベルはクラスタリング手法を用いて単語を自動的に階層分類することとした。本稿では、当研究所で構築している対話データベース(ADD)から抽出した係り受け関係を用いて名詞を自動的に分類し、そのクラスタリング結果を既存のシソーラスと組み合わせる方法を示す。また、作成したシソーラスについて検討する。