著者
栃木 博子 萩田 紀博 宮下 敬宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.300, pp.5-10, 2005-09-15

ファンタジー世界の物語は子供たちの創造性を駆り立てるのに有効なコンテンツである.ユーザが案内役の人形型入力装置とのインタラクションを通して, 物語の展開が変わっていくファンタジー世界を楽しむインタラクティブアニメーションシステムを提案する.初めに, 研究の基本方針を述べる.案内役はユーザの単なる入力装置ではなく, 物語を展開できる機能をもち, ファンタジー世界とのインタラクションによって, ユーザにファンタジー世界の反応を返すこともできる.日本の古い家屋と街並みを題材にした物語コンテンツと, 妖怪をモチーフとした人形型入力装置による実験システムの試作を行い, 本システムの有効性を仮説検証するために展示をし, 予備検討を行なった.その結果, ユーザの興味, 人形とのインタラクション行動, 使いやすさなどに関する意見が得られたことについて述べる.
著者
三品 賢一 土屋 誠司 黒岩 眞吾 任 福継
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.158, pp.37-42, 2007-07-17

従来,文が表現する感情を推定する手法では,推定できる感情の種類がわずかであったり,一つ一つの単語ごとに感情別の重みを付与した辞書を構築し,推定に利用するものが多かった.そこで我々は,推定できる感情の種類を容易に増やすことができ,また感情別の重みの付与を単語N-gramで行うことで文が指す内容に対する話し手の判断や心的態度を表すモダリティなどの感情表現も利用する,従来手法よりも高い精度で推定可能な感情推定手法の提案を目指している.このような推定手法を実現するため,我々は2つの文が表現している感情がどれほど類似しているかを計算する感情類似度計算手法を過去に提案した.感情類似度は,あらかじめ用意した,文を感情別に分類した複数のコーパス(感情コーパス)を用い,機械翻訳システムの翻訳精度を求める尺度であるBLEUか基に,入力文と感情別に分類された文との類似度を計算することで求める.本稿で我々は,従来のBLEUを用いる感情推定よりも高い精度で推定を行うために,感情コーパス別に単語N-gramの出現頻度を求めた辞書を従来手法に導入した新たな手法を提案する.提案手法の性能を調べるため,入力文から感情類似度を求め,最も感情類似度が高ぐなった感情と,人手で判断した入力文の感情の一致率を求める実験を行った.その結果,従来のBLEUによる類似度計算を用いた手法に比べ,提案手法では20.59%一致率が向上した.
著者
鶴丸 弘昭 城戸 健雄 日高 達 吉田 将
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.95, no.429, pp.47-54, 1995-12-15
被引用文献数
1

本稿は国語辞典の語義文に現れる機能表現について調査・整理したものである。機能表現は,語義文の末尾に現れ,語義文から定義語,および,定義語と見出し語との間の階層関係を求める際に意味情報(ρ_<FE>)を与えるものである。調査対象は主として新明解国語辞典^<(1)>の語義文であるが,他の同様な辞典(旺文社^<(2)>,岩波^<(3)>,角川^<(4)>)も参考にしている。約一万の語義文^<(1)>のなかて,機能表現を含んでいる語義文は約1,500文であった。調査結果は,表1,表2,表3にまとめて示している。
著者
高橋 裕信 新田 義貴 遠藤 隆 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.97, no.330, pp.41-47, 1997-10-17

本報告ではテキストを時系列データと考える大規模なテキストデータベースを対象として, 単語を空間に配置し, 空間の距離を利用した文章の検索方式を提案する. まず, 形態素解析によって分節した単語をノードとして, 単語bigramの作るネットワークを構築する. 次にこのネットワークのノードを有限次元の空間中に, ノード群のクラスタリングを伴なう配置問題を考える. この配置問題は, 時系列方向での近傍共起性から, ノード間の距離を定義し, 有限の小さい次元の空間で効率よく分類 (クラスタリング) するために, 最適化関数を導入した非線形化した手法で解かれている. 本手法を新聞データベースのリアルタイム検索に適用した実験結果について述べる.
著者
西村 竜一 秋田 祐哉 須藤 克仁 大庭 隆伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.106, no.442, pp.61-66, 2006-12-15

本稿では,2006年9月アメリカ合衆国ピッツバーグにおいて開催された国際会議Interspeech2006-ICSLPにおける研究動向を報告する.サーベイ二部構成の後編にあたる本編では,音声認識システム,言語モデル,言語処理関連,音声対話,音声検索,要約,翻訳等のトピックを中心に報告する.
著者
宮森 恒 赤峯 享 加藤 義清 兼岩 憲 角 薫 乾 健太郎 黒橋 禎夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.158, pp.103-108, 2007-07-17

本稿では,情報の信頼性を自然言語処理に基づいて分析する際に必要となる評価用データおよびプロトタイプシステムWISDOMについて述べる.われわれは,ウェブ上のテキストを主な対象として,情報信頼性を分析することを目指したプロジェクトを2006年4月より進めている.本プロジェクトでは,ウェブ上の情報の信頼性を,情報内容,情報発信者,情報外観,社会的評価といった4つの基準で捉えることを提案しており,これらを述語項構造を単位とする自然言語処理によって論理的に分析・組織化することを目指している.本稿で述べる評価用データは,これら種々の分析処理の学習・検証用データとして構築されたものであり,時事問題,医療問題等の20トピックを選定し,各100ウェブページを収集して,各評価尺度のデータを人手で付与したものである.また,情報信頼性を多角的に評価するプロトタイプシステムWISDOMを開発した.本システムを用いて上記評価尺度で条件を様々に変化させて情報閲覧することにより,興味のトピックについて,信頼できる情報をより確実に見極めることができるようになる.
著者
北條 奈緒美 獅々堀 正幹 北 研二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.408, pp.59-64, 2009-01-19
被引用文献数
1

近年,ユーザが入力した質問文に対して大量の知識源から回答を得る質問応答システムの研究が注目されている.特にインターネットの普及により,Googleに代表されるWWW検索エンジンを用いて,WWW空間から回答を探す技術が研究されている.これらのシステムでは,質問文内から抽出されたキーワードをWWW検索エンジンに入力し,その検索結果から回答を出力している.本稿では,質問文からキーワードを抽出する際に起こる,用語の過分割問題に着目し,WWW検索エンジンを用いた質問文内の用語特定手法を提案する.本手法は,学習フェーズおよび用語特定フェーズから構成される.まず学習フェーズでは,学習データの各用語候補に対して,WWW検索エンジンでの検索結果(サマリ)から継続度,品詞,文字種などの特徴量を抽出し,Support Vector Machine(SVM)を用いて用語判定モデルを作成する.次に,用語特定フェーズでも同様に特徴量を抽出した後,用語判定モデルを用いて用語を特定する.実際に,NTCIR4-QAC2の質問文に対して本手法で用語特定を行った結果,従来手法と比較して約55%の質問文に対して用語特定精度の向上が認められた.
著者
乾 健太郎 脇川 浩和
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.99, no.228, pp.31-38, 1999-07-23

近年, 信頼性の高い品詞・構文タグつきコーパスに対する需要の増大にともなって, コーパスを共有・再利用することの重要性がますます大きくなっている. しかし, 既存のタグつきコーパスでは基礎とする品詞体系が統一されておらず, そのことが共有・再利用の障害となっている. このような背景から本稿では, 既存のコーパスの品詞・構文タグを別の品詞体系に基づく品詞・構文タブに変換するアルゴリズムについて論じる. 本稿で提案する手法では, ターゲット側品詞体系に基づく文法・辞書でコーパスを形態素・構文解析することによって半自動的にタグ付けを行う. このとき生じる曖昧性は, ソース側タグ情報を最大限に利用することによって高い精度で解消することができる.
著者
森 信介 伊東 伸泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.101, no.189, pp.47-54, 2001-07-09

確率的言語モデルを基礎とする自然言語処理において、タグが付与された学習コーパスは重要であり、これを増量することが精度向上につながることがわかっている。しかしながら有意な精度向上のためには、学習コーパスを指数関数的以上に増加させる必要があり、このために必要なコーパスにタグを付与するコストは無視できない程度になっている。このような背景のもと、本論文ではタグなしコーパスの利用による形態素解析と仮名漢字変換の精度向上について述べる。実験では、タグなしコーパスの利用により、確率的言語モデルの予測力やそれに基づく仮名漢字変換の精度は有意に向上し、タグなしコーパスは0.87倍の量のタグつきコーパスに匹敵したが、形態素解析の精度向上は微小であった。
著者
河原 達也 Lee Chin-Hui Juang Biing-Hwang
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.96, no.420, pp.61-68, 1996-12-13

対話環境における柔軟な音声理解を実現するために、キーフレーズの検出と検証の組合せに基づくアプローチを提案する。キーフレーズには意味タグが付与されており、その検出が直接的に頑健な理解を実現する。検出の湧出し誤りを抑制するために、サブワードベースの発話検証手法を導入する。これは、認識結果に信頼度を付与するものである。信頼度を定義するいくつかの関数について比較・検討を行った。複数の音声対話タスクのフィールドデータに適用した結果、本手法が、 (1)定型的な発話に対して精度を維持した上で、 (2)非定型な発話に対する理解率を向上し、 (3)タスク外発話の棄却率も改善することが示された。
著者
堂坂 浩二 島津 明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.95, no.321, pp.1-8, 1995-10-20
被引用文献数
3

本稿では,実時間対話における漸次的発話を生成するためのプランに基づくモデルを提案する.このモデルは,与えられた問題を解決しながら,その問題の解を対話相手に自然言語で提案するために,時間制限の下に漸次的に発話を行う.このモデルは(1)問題の解が部分的に決まった段階で発話を開始する,(2)実時間対話に特有の談話構造を利用して,小さな発話単位で発話を行う,(3)言語運用制約を使って,発話の自然性を損なうことなく,発話を漸次的に行うという利点をもつ.また,発話シミュレーション実験により,モデルの有効性を検証した.
著者
難波 英嗣 国政 美伸 福島 志穂 相沢 輝昭 奥村 学
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.203, pp.67-74, 2005-07-15

「日経平均株価」や「内閣支持率」のように数値が時間とともに常に変動するような情報のことを動向情報と呼ぶ.本稿では, 動向情報の抽出を一種の複数文書要約であると考え, 複数文書要約技術を用いて, あるトピックに関する複数の文書から動向情報を自動的に抽出し, グラフ化する手法について述べる.複数文書からの要約の作成は, 様々な要素技術を組み合わせることで実現できる.こうした技術のひとつとして, 我々は文書横断文間関係理論(CST)に着目する.CSTとは, Radevらが提唱している理論で, 文書中の各文の機能を特定し, 文間の依存関係を特定する修辞構造理論(RST)を, 文書間関係に拡張したものである.本研究では, CSTの一部を計算機上で実現し, それを用いてグラフ化に必要な数値情報と時間情報の抽出を行う.
著者
Baldwin Timothy 岡崎 篤 徳永 健伸 田中 穂積
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.101, no.351, pp.17-24, 2001-10-10

本研究では, Senseval2の対訳対検索タスクにおいて、2つの全く異なった検索手法を紹介する。1つ目の手法は表層的類似に基づくもので、文字列を文字バイグラムの集合として扱う。2つ目の手法は構造的類似をもととしたもので、構文解析木および概念的類似を用い文字列間の類似度を計算する。さらに、この2つの手法を組み合わせるハイブリッド手法も提案する。評価実験では、単純でありながらも、表層的類似度計算法が構造的計算法より勝ることを明らかにし、全体ではハイブリッド手法が再優良であることを実証している。
著者
横山 晶一 安野 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.95, no.321, pp.39-46, 1995-10-20

これまで方言は、主として社会言語学や民俗学的な観点から研究されてきた。本稿では、自然言語処理の立場から方言を取り扱うアプローチについての予備的な考察を行う。その目的は、1.方言が古い日本語を保存しているならば、系統的な規則で記述が可能ではないかということ、2.話し言葉として伝えられてきた方言の文法を書くことは、話し言葉の文法を作ることになること、3.方言と共通語の比較によって、日本語の性格がより明らかになり、さらに両者の機械翻訳システムを作ることによって、翻訳の研究にも有用であること、などである。以上のような考えから、庄内方言を例として機械処理の観点から特に動詞と助詞を中心に、予備的な調査と考察を行った。
著者
太田 貴久 増山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.594, pp.37-42, 2006-01-26
被引用文献数
6

近年の情報技術の発達により,レポートの剽窃が非常に容易なものとなり問題となっている.本研究ではSmith-Watermanアルゴリズムを基礎とした,さまざまな「類似」を検出できるレポート類似部分発見法を考案した.そして,現実に提出されたレポートを含めた文書集合に対して実験を行った結果,F値=1となり,完全に剽窃レポートを検出することに成功した.
著者
呉 浩東 下川 浩 二宮 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.203, pp.43-46, 2005-07-15

言い換えに関する研究は自動要約、質疑応答、平易文生成と多岐の分野において重要な道具になりつつある。本稿では、語彙的換言処理、構文的換言処理と意味的換言処理を実現するために、辞書、シソーラス、コーパス、WWWなどの言語資源から、また言語学の視点から複数な手掛かりを得る方法を提案し、その有効性と適用性を論じる。
著者
小倉 和貴 賀 小淵 佐藤 彰洋 長谷川 修
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.106, no.298, pp.33-38, 2006-10-12

本システムはSOINN[10]の特徴を利用して,オンラインで与えられるデータかち物体の色や形の概念,物体の動きの概念を追加的に学習できる.また,メンタルモデルを利用することで1つの発話例から語順のルールを学習し,文章を構成して発話したり,言語的な指示を解釈して行動することができる.従来手法では動きの学習,語順の学習のための学習データをバッチ的に与えているため学習時間がかかり,オンラインでの学習や追加学習が困難であったが,提案手法では1つの発話例から安定した学習を行うシステムを実現し,優位性が示された.
著者
中村 順一 甲斐 郷子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.95, no.168, pp.57-62, 1995-07-20

PACLING-II(The Second Conference of the Pacific Association for Computational Linguistics)が1995年4月19日から22日に,オーストラリアBrisbaneのThe University of Queenslandで開催された.参加者は約50人で,日本,オーストラリア,韓国が中心であったが,その他,米国,カナダや英国からの参加者もあった.4つのキーノート・アドレスと35の論文発表が行われた.筆者らは,これに参加したので,その概要について報告する.
著者
久保田 千太郎 松坂 要佐 小林 哲則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.99, no.708, pp.49-56, 2000-03-17
被引用文献数
2

ロバストかつ高精度・高速な顔画像処理システムを実現し, これを対話ロボットに組み込んでグループ会話を実現した.グループ会話とは, 複数の話者を同時に相手にする対話形態である.グループ会話に円滑に参与するためには, 発話者が誰であるか, および発話が誰に向けられているか等の, 対話の状況を把握する必要がある.この目的には, 顔向きや個人の認識を行なう画像処理が重要な役割を演じる.この際, 画像処理システムには, 環境変化にロバストであることや, 高精度でかつ実時間処理に適していることが必要とされる.本研究では, 前者には顔領域を抽出する手掛かりとなる肌色尤度モデルを逐次更新することで, また後者にはパターン認識に適した高精度情報圧縮を実現する独立成分分析を適用することで達成した.この画像処理システムにより, グループ会話に必要な状況把握が可能となり, 自然なグループ会話の実現に貢献することを確認した.