著者
服部 元 武吉 朋也 小野 智弘 滝嶋 康弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.109, no.390, pp.13-18, 2010-01-18
被引用文献数
1

本研究では,特定のテーマに関連するノウハウ情報を効率的に収集する「ノウハウ検索」手法を提案する.既存の検索エンジンにおいては,一般的に大量の検索結果が得られる.ここで,クエリが「富士山の標高」のような,検索結果上位の数文書程度を閲覧すれば十分な回答が得られるタイプの検索であれば,問題はない.一方,クエリが「おいしいカレーの作り方」のような多様なノウハウの収集を目的とするタイプの検索の場合は,なるべく多くのWeb文書を閲覧する必要があり,検索結果を順次閲覧する方法では,時間や労力の点で限界がある.本稿では,なるべく少ない閲覧数でより多くのノウハウを集める効率的な情報収集の手法を提案する.具体的には,単語の概念関係と出現頻度を利用してノウハウに関連する単語をWeb文書から抽出し,未読のノウハウ情報を含むWeb文書を優先的にユーザに提示する.評価実験を行い,単語の概念関係を導入することでノウハウに関連する単語を多く抽出できること,および,未読のノウハウ情報を優先的に提示することで,一般の検索結果を閲覧するよりも効率的にノウハウ情報を閲覧できることを示した.
著者
加藤 健一 小川 哲司 小林 哲則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.106, no.442, pp.25-30, 2006-12-15

本稿では,特徴変換にブースティングの枠組を適用した識別器統合手法を提案する.一般的に,複数の識別器を統合するとき,識別性能は向上することが期待できる.しかし,識別器の統合にあたって,二つの重要な課題がある.一点目は,統合する識別器各々の誤り傾向が異なっていなければ(相補性がなければ),わずかな性能の改善しか得られない点,二点目は,相補的な識別器が生成されたとしても,各々の識別器が与える情報の統合手段が適切でない場合,やはりわずかな性能の向上しか得られないという点である.そこで本稿では,上述した二点を考慮した上で,相補的な識別器の生成手法と,その統合手法について検討を行う.相補的な識別器を生成するにあたっては,Heteroscedastic linear discriminant analysis (HLDA)に基づく特徴変換の過程でブースティングの枠組を適用した.また,統合においては,各々の識別器から出力される尤度の情報を特徴ベクトルとし,このベクトルが張る空間上でSupport vector machine (SVM)に基づくパターン認識を行った.提案手法により識別器を統合することで,孤立単語音声認識実験において,統合前と比較し74%の誤りが削減されることがわかった.
著者
全 炳河 大浦 圭一郎 能勢 隆 山岸 順一 酒向 慎司 戸田 智基 益子 貴史 ブラック アラン 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.405, pp.301-306, 2007-12-13

近年,隠れマルコフモデル(HMM)に基づく統計的パラメトリック音声合成方式が注目されている.本方式では,音声スペクトル・励振源・継続長がコンテキスト依存HMMにより同時にモデル化される.音声合成時は,合成したい文章に対応するHMMからの出力確率が最大となるよう,継続長・スペクトル・励振源系列を決定した後,音声合成フィルタを用いて波形が出力される.2002年より我々は,HMMに基づく音声合成のための研究・開発ツール「HMM音声合成システム(HTS)」を,オープンソースソフトウェアとして公開してきた.本報告では,その最新の開発状況と今後の予定について述べる.
著者
松田 耕史 山本 悠二 酒井 浩之 増山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.595, pp.13-18, 2006-01-27

Web上の情報量の増加とWeblogなどの簡易な情報発信手段の普及によって、Web上のリンクを単に「リンク先ページへの信頼」と解釈することはできなくなってきた。Web上のリンクに込められた感情を知ることによって、より密に連携したWebコミュニティを発見することが可能になると考えられる。そこで本研究では、Weblog内のリンクに対して、教師付き学習によって感情スコアを推定することを試みた。肯定的文書、否定的文書間の表現の偏りや、Weblog特有の文書構造を考慮した結果、ピアソンの相関係数で0.45程度と、かなりの相関をもって推測可能であることがわかった。
著者
竹内 孔一 高橋 秀幸 小林 大介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.110, no.245, pp.13-18, 2010-10-16

本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.
著者
イアン レーン 河原 達也 松井 知子 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.103, no.518, pp.29-34, 2003-12-12

音声言語システムにおいては,バックエンドシステムが受理できない発話(ドメイン外発話)への対処が問題となる.本稿では,このようなドメイン外発話の検出法の枠組みを新たに提案する.本手法は,複数トピックの分類の信頼度を用いて,ドメイン内検証モデルをGPD(Generalized Probabilistic Descent)により学習する。この学習は,ドメイン内データの削除補間に基づいて行うため,ドメイン外の実データを必要とせず,移植性が高い.トピック分類手法として3つの手法(単語N-gram,LSA,SVM)を比較した結果,SVMが最も高い識別能力を得た.ドメイン外検出タスクにおいて,提案手法は,トピック分類結果の単純な組合せによるベースライン法と比較して,6.5ポイントも検出誤り率を改善した.さらに,実際のドメイン外データを用いて学習したシステムと比較しても,ドメイン外データを使用しない提案手法によりほぼ同等の性能が得られることがわかった.
著者
得丸 公明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.111, no.119, pp.49-54, 2011-06-30
被引用文献数
1

西洋の論理学においては,言語命題のみが扱われてきた.日本には日本論理学会も存在しないし,言葉の論理を積みあげること自体が好まれない.イエルネのネットワーク理論とピアジェの心理学を参照にして,日本と西洋の違いを,生命体のもつ論理と記憶の記号メカニズムによって解明することを試みる.記号論において,言葉に意味はなく,言葉の意味は個人の体験記憶である.同様に言語表現の論理性は,言葉自体によって保証されるのではなく,言葉に意味を与える意識が保証するものである。言葉の記号は意識の論理回路で反射的に処理されるので,その構築が重要となる.言語以前の論理学を理解すると,言葉の正しい使い方,言葉の正しい意味付け方を理解でき,先人の努力と言葉を継承して前進することができる.
著者
竹内 孔一 松本 裕治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.95, no.168, pp.13-19, 1995-07-20
被引用文献数
5

日本語の形態素解析は自然言語処理を行なう上で最も基本的でかつ重要な処理である。我々の研究室で開発している形態素解析システムJUMANは、品詞の連接と単語に対してコストによる制約を与えることで曖昧性の絞り込みを行なっている。コスト値はJUMANの品質に大きな影響を与えるにも関わらず、人手で付与されるため最適化する機構は存在しなかった。そこで、本研究では、英語のタグづけなどで効果を発揮しているHMM(Hidden Markov Model)を用いて、コーパスによる学習を行なうことでJUMANのコスト値、すなわちパラメータの最適化を行なう。HMM学習の結果、現在のJUMANの解析精度を改善する結果が得られた。
著者
高岡 充 上平 拓弥 西崎 博光 関口 芳廣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.110, no.142, pp.51-56, 2010-07-15

本稿では,人間とロボットの対話を円滑にするための,対話ロボットが話題とは無関係な発話を聞き流す機構の構築方法を述べる.まず最初に,話題と関係ない発話を人間が聞き流す機構を被験者実験で調査した.その結果,人間は話題からキーワード群を推測し,認識・理解しているということが分かった.この聞き流しモデルを音声認識のための言語モデルに適用し,カードゲームのための音声対話ロボットに組み込んだ.音声認識実験により,提案された機構を取り入れた言語モデルは,効果的に話題外発話を棄却できることが分かった.
著者
吉田 辰巳 大竹 清敬 山本 和英
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.102, no.200, pp.59-64, 2002-07-09

現在入手可能なツールと言語資源を用いて中国語形態素解析を行った場合にどの程度の精度が得られるかを報告する.解析ツールにサポートベクトルマシン(SVM)を用いたYamCha,ならびにコスト最小法に基づく形態素解析器としてMOZを用いた.中国語コーパスとしては,最も一般的なPenn Chinese Treebank(10万語)を使用した.これらを組み合わせて,形態素解析実験を行った.この結果,YamChaによる形態素解析精度は約88%でMOZよりも4%以上高いが,実用的には計算時間に問題があることが分った.また,より大きなタグ付きコーパスとして人民日報タグ付きコーパス(110万語)を用いて解析実験を行ったところ,YamCha,MOZそれぞれの解析精度は92%,89%となった.
著者
栗山 直人 鈴木 基之 伊藤 彰則 牧野 正三
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.106, no.442, pp.55-60, 2006-12-15

PLSAは言語モデルの文脈適応に一般的に用いられる手法である.このPLSAの新しい利用方法を提案する.PLSA言語モデルの語彙を「話題語」「文型語」「汎用語」の3クラスに分割し,話題語PLSAモデルと文型語PLSAモデルを別々に学習・適応した後に3つのモデルを統合する.また新聞記事とCSJ間での品詞分類の出現パターン変化に基づいた,語彙分割基準の自動生成を提案する.評価実験では話題と文型の特徴が学習データで共起していないテキストについて,従来のPLSA言語モデルと比べ15.48%のperplexity削減が得られた.
著者
高橋 伸弥 森元 逞
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.204, pp.55-59, 2005-07-16

従来の音声認識では、咳やくしゃみ、あくびのような非言語音または非音声音は、誤認識を引き起こす雑音として扱われて来た。しかし、自然な音声対話を実現する場合、このような音情報も積極的に利用すべきである。このような非言語音声を検出する方法としては、対象音の音響信号的な特徴を用いた信号処理的アプローチや、対象音から学習したHMMを用いる音声認識的アプローチなどがあるが、対象音の多様性に対処するためには、いずれも多量のデータが必要となる。そこで本研究では、対象となる非言語音声を音素系列で近似表現した疑似単語モデルを提案する。このモデルは、音素認識の結果得られる音素系列をクラスタリングし、上位クラスターの中心となる音素列パターンを非言語音声の近似的な発音とするというものである。提案手法の有効性を確認するために、咳及び咳払いを対象として、音声認識実験を行い、咳/咳払いの波形を学習データとしたHMMを用いる手法と比較して、認識正解率、認識精度が改善されることを示した。
著者
國分 智晴 酒井 哲也 齋藤 佳美 筒井 秀樹 真鍋 俊彦 藤井 寛子 小山 誠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.203, pp.47-54, 2005-07-15

近年, 質問応答システムに関する研究が盛んに行われているが, システムの回答精度と, どれぐらいのユーザが満足するかとの関係が明確になっていなかった.そこで, 質問応答の利用シーンとしてデスクトップ型およびモバイル型の2種類を想定し, シーン別に正解順位に対する満足の度合いを評価するアンケートを行った.この結果, 回答候補を一括提示するデスクトップ型におけるユーザ満足率は質問応答の一般的な評価尺度である逆数順位と似た曲線となるが, 回答候補をひとつずつ提示するモバイル型におけるそれは順位とほぼ比例することが分かった.このため, ユーザ満足率の観点からシステムの目標精度を設定するには, 平均逆数順位ではなく正解順位の分布を決定することが望ましいことを示す.
著者
佐々木 裕 磯崎 秀樹 平 博順 廣田 啓一 賀沢 秀人 平尾 努 中島 浩之 加藤 恒昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.100, no.401, pp.17-24, 2000-10-20
被引用文献数
16

本稿では, いくつかの質問応答システムを独立に作成し, 50問の質問文に対する性能評価を行なった結果を報告する.質問応答システムは1999年のTREC-8のQAタスクの開催以降注目を集めており, 次のような点で従来の情報検索や情報抽出と異なっている.従来の情報検索では, 質問に対する答えを文書の単位で列挙していたが, 質問応答システムは質問の答えを記述した部分を返す.また, 従来の情報抽出は対象分野と抽出項目があらかじめ限定されていたが, 質問応答では, 抽出する項目が質問文により自由に決まる点で異なっている.本稿は, 今後の質問応答システム研究の参考とするため, 日本語QAシステムの性能のベースラインを探るとともに, 日本語QAシステムの比較・評価法を紹介するものである.
著者
デルクロア マーク 中谷 智広 渡部 晋治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.405, pp.55-60, 2007-12-13

一般に、雑音や残響の影響により音声認識率は低下する。これに対し、音声強調を前処理として用いると、時間的に変化する音響的な歪みをある程度低減することができるが、必ずしも音声認識性能を改善できるとはかぎらなかった。また、モデル適応技術を用いることで、音声強調処理後の音声と音響モデルのミスマッチをある程度低減することができるが、動的なミスマッチについては扱うことはできなかった。音声強調とモデル適応のより最適な組み合わせ法の開発が重要であると考えられる。本稿では、動的なミスマッチについても適切に低減できるモデル適応法を提案する。分散を静的な分散と動的な分散で構成されるパラメトリックモデルで表現し、適応処理に基づき、モデルパラメータを最適化する。実験により、残響除去を前処理として用いた場合に、認識誤りを80%削減できること、およびクリーン音声に近い5.4ることを示す。クリーン音声の場合と近い性能が得られた。
著者
林 成起 佐藤 嘉伸 田村 進一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.95, no.320, pp.1-6, 1995-10-19

聾唖者達が会話で使う手話を計算機の上で処理し,認識しようとする研究には指文字,顔の表情,簡単な手の動き,または手話単語などの認識に関する研究が主で,文全体を対象とする研究はない.これは手話の文法構造や統語構造が一般言語とは違って,その文解析が困難であるからである.手話の構成素は手の形,手の位置,手の動き,掌の方向などがあるが,広い意味での手話には非手指信号,すなわち,目,眉毛,口などの顔の部位の変化や,頭部や身体の動きと傾きなどがある.この非手指信号は手話文の中で形態論的,統語論的な機能を持つ.従って,手話文の認識の際にもこの非手指信号を取り入れなければその文の正確な意味解析が困難となる.そこで,本研究では非手指信号の内イントネーションブレークを形態素として取り入れ,ASLを対象として手話文を11パターンに分類しその文解析を行った.
著者
中西 卓哉 今井 むつみ 石崎 俊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.96, no.593, pp.31-38, 1997-03-18
被引用文献数
2

自然言語を用いて、遠く離れた人どうしが、互いに仮想空間の中のオブジェクトを操作できるようにする臨場感通信会議システムの研究が試みられている。しかし、そこでは、空間記述における自然言語の曖昧性が問題になっている。たとえば、「ボールが黄色い車の左側にある」といった場合、どこまでが左の領域で、どこからが左の領域でないのかという境界をはっきりと決めることはできない。さらに、ボールが話し手にとっての左側にあるのか、車自身にとっての左側にあるのか、特定することも難しい。そこで、本研究は、参照物体の種類や、向きなどが変わる状況を考慮した認知実験を行なった。また、空間指示モデルにおいて近似的な前後左右の領域を決定するためデータをとり、研究を進めた。
著者
杉本 明子 柏崎 秀子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.102, no.93, pp.13-18, 2002-05-20

本研究では、日本語学習者が電子メールを利用して行ったコミュニケーションにおいて、どのような発話の機能や構造が見られるのかを質的に分析し、発話機能と発話ぺアの構造の関係、議論における立場表明の表現方法、議論の構成要素の観点から、日本語学習者の議論が対人配慮の点でどのような特徴を持っているのかについて考察した。その結果、相手の意見に賛成する場合には、メールの最初で明示的な表現で賛成の意見表明をするのに対して、反対する場合には、まず根拠を記述してから暗示的な表現で反対意見を述べる傾向があるということが見出された。日本語学習者の議論形式は、対人関係の配慮から、自分の意見の明確な表明や相手への明示的な批判は回避するという日本人特有の議論形式に類似しているということが示唆された。
著者
姫野 完誠 小島 康寛 田野 俊一 市野 順子 橋山 智訓 江崎 朋人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.109, no.390, pp.99-102, 2010-01-18

現在インターネット上には多数のWebページが存在しており,様々なユーザが利用している.しかし,各Webページを見ているユーザは互いを認識することができないため,コミュニケーションは活発に行われず,コミュニケーションの場として有効活用されていない.本研究では,アバターを用い互いを認識させることによりコミュニケーションを活性化し,各Webページをコミュニケーションの場と捉え,ユーザから集合知を収集するシステムを提案する.
著者
高橋 弘太 蔦木 圭悟 吉原 亨
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.337, pp.227-232, 2008-12-02
被引用文献数
2

高齢者に確実に音声を聞き取らせるには,どうしたらよいか,また健常者に対しては,短い時間でより多くの音声を聞き取らせるには,どうしたらよいか.これらの研究を行うためには,正確な時間管理のもと,同じ音声を同じ話者が話速を変えて発声した音声のデータベースが必要である.しかし,現時点では,そのような目的で大規模に作られた音声データベースは存在しない.そこで,我々は,平成20年度〜平成22年度の科研費の研究として,さまざまな話速で録音した音声データベースを構築している.今回は,このデータベースの紹介を行うとともに,会場で音声の研究者の生の意見やコメントをうかがって,今後のデータベース作りに反映させていきたいと考えている.また,我々は,音声データベース作成のために,話速を正確に管理しつつ録音できるシステム(原稿提示システム)も製作した.システムはパソコン上で動くもので,将来は,このソフトも公開して,電通大外でも音声を追加できるようにしたいと考えている.当日は,このシステムの機能と,どのような工夫がなされているかについても紹介したい.