著者
池田 定博 金田 重郎 金杉 友子 加藤 恒昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.99, no.708, pp.113-120, 2000-03-17
参考文献数
6
被引用文献数
2

商品開発やマーケティングでは、効果的なコンセプトの作成が極めて重要である。しかし, 思いついた多数のコンセプトや広告コピー案の中から, 戦略の柱となるキーワード候補を絞り込んでゆく方法は知られていない.本稿では, この問題を解決するため, 「流行ことば予測」手法を提案する.そこでは, まず, 過去・現在・将来における流行語の背景となる社会的要因を、「ことば」として表現する.そして, 今後流行の可能性がある新しい「ことば」と, これら社会的要因との距離を計算し, 「近い」と算出されたことばから, 流行のキーワードを開発する.過去の「ことば」としては, 自由国民社発行の「現代用語の基礎知識」を使用し、距離計算にはベクトル空間法を利用した。1998年度の流行語大賞である「ショムニ」等が, どのような背景により流行したかを実験的に分析する。
著者
加藤恒昭 松下 光範 平尾 努
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.89-94, 2004-11-05
被引用文献数
13

動向情報は,製品価格や内閣支持率の変化など,時系列情報に基づき,それを総合的にまとめ上げることで得られるものである.このような動向情報の効率的な提供には,文章だけでなくグラフなどの視覚的手段を利用し,それらを協調させることが必要となる.本稿では,複数文書に分散した様々な動向情報を文章や図表で要約・可視化するという研究課題を提案し,その処理の枠組みを示す.加えて,この課題の研究に有益であろうコーパスについて説明し,これを共通の研究素材とし,動向情報の要約と可視化への関心を共有する研究者によるワークショップを提案する.Trend information is obtained by synthesis and organization of series of temporal information such as transitions of a product price and a degree of public support for a cabinet. Effective communication of trend information should employ as its media not only text but also visual ones such as charts, and use those in a cooperative manner. In this paper, a research theme is proposed, that allows trend information scattered in multiple articles to be gathered, summarized, and provided in linguistically and/or visually. We show a framework to accomplish this research and explain a corpus useful for that purpose. We also propose a workshop on this research on summarization and visualization of trend information in which the researchers share this corpus as a common material.
著者
堀井 統之 加藤 恒昭 大山 芳史
雑誌
全国大会講演論文集
巻号頁・発行日
vol.41, pp.183-184, 1990-09-04

メッセージ、特に電報文を対象として、その効率的な蓄積方法について検討を行なっている。できるだけ少ない蓄積メッセージから多様なメッセージを生成するためには、蓄積されている複数のメッセージの各部分を組み合わせて新たなメッセージを合成できると都合がよい。これは、たとえば、(例1)新郎、新婦の誕生バンザイ。人生は七転八起。二人三脚で長い旅路のゴールを目指そう。(例2)ご結婚おめでとうございます。北の町の春は、お二人の愛から始まります。末長くお幸せに。という2つの電報文が蓄積されているときに、これらから、ご結婚おめでとうございます。人生は七転八起。二人三脚で長い旅路のゴールを目指そう。末長くお幸せに。を合成できるということである。このような処理を考えた場合、メッセージをそのまま蓄積するのではなく、新たなメッセージを合成する際の一部分となり得るような単位、すなわち「人生は七転八起。二人三脚で長い旅路のゴールを目指そう。」などのような、意味的につながりを持つまとまりに分割して蓄積する必要がある。我々はそのような単位のことをセグメントと呼んでいるが、本稿では、各文の言語行為に着目して、メッセージを自動的にセグメントごとに分割する手法について述べる。
著者
畠山 真一 坂本 浩 加藤恒昭 伊藤 たかね
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.1, pp.1-8, 2005-01-11

語彙概念構造 (Lexical Conceptual Strucuture LCS) とは,言語学のフィールドにおいて,少数の意義素により動詞の持つ基本的な意味を捉えるために考案された意味表現のフォーマットである.LCS は言語学のみならず,自然言語処理の分野でもその応用が提案されている.しかし,どのようにして個々の動詞の持つLCS を推定するかという問題については,確固たる手法が確立されているわけではない.実際,現在までに提案されている LCS 推定に用いられるテストには,いくつかの問題が存在する.本稿では,対象変化動詞と接触・打撃動詞という他動詞の2つのカテゴリを区別する手法を提案する.In linguistics, Lexical Conceptual Structure (LCS), whichis constucted from some semantic primitives, is used to represent the meaning of a verb. In addition, LCS is used in Natural Language Processing as a representation format for the verb meaning. However, the problem of how to determine the LCS of a verb is still disputed. In fact, existing tests for determining the LCS of a verb have some shortcomings. In this paper, we pin down the problems with the existing tests for distinguishing a causative verb and a non-affecting verb, and propose a better test for it.
著者
池田 定博 金田 重郎 金杉 友子 加藤 恒昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.710, pp.113-120, 2000-03-17
参考文献数
6
被引用文献数
2

商品開発やマーケティングでは、効果的なコンセプトの作成が極めて重要である。しかし, 思いついた多数のコンセプトや広告コピー案の中から, 戦略の柱となるキーワード候補を絞り込んでゆく方法は知られていない.本稿では, この問題を解決するため, 「流行ことば予測」手法を提案する.そこでは, まず, 過去・現在・将来における流行語の背景となる社会的要因を、「ことば」として表現する.そして, 今後流行の可能性がある新しい「ことば」と, これら社会的要因との距離を計算し, 「近い」と算出されたことばから, 流行のキーワードを開発する.過去の「ことば」としては、自由国民社発行の「現代用語の基礎知識」を使用し、距離計算にはベクトル空間法を利用した。1998年度の流行語大賞である「ショムニ」等が, どのような背景により流行したかを実験的に分析する。
著者
佐々木 裕 磯崎 秀樹 平 博順 廣田 啓一 賀沢 秀人 平尾 努 中島 浩之 加藤 恒昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.100, no.401, pp.17-24, 2000-10-20
被引用文献数
16

本稿では, いくつかの質問応答システムを独立に作成し, 50問の質問文に対する性能評価を行なった結果を報告する.質問応答システムは1999年のTREC-8のQAタスクの開催以降注目を集めており, 次のような点で従来の情報検索や情報抽出と異なっている.従来の情報検索では, 質問に対する答えを文書の単位で列挙していたが, 質問応答システムは質問の答えを記述した部分を返す.また, 従来の情報抽出は対象分野と抽出項目があらかじめ限定されていたが, 質問応答では, 抽出する項目が質問文により自由に決まる点で異なっている.本稿は, 今後の質問応答システム研究の参考とするため, 日本語QAシステムの性能のベースラインを探るとともに, 日本語QAシステムの比較・評価法を紹介するものである.
著者
加藤 恒昭 松下 光範
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.22, no.5, pp.553-562, 2007 (Released:2007-07-17)
参考文献数
20
被引用文献数
1 2

Information compilation is a novel technology that allows it to compile various information intelligently, and to make it easy to understand and to access. In this paper, as an instance of the possibilities of information compilation, we show a framework that extracts and visualizes given time-series information and its changes, and provides users with a multi-modal summarization and also an interactive interface for accessing that information. It can meet information requests, in which users need to comprehend some trend and movement, and access a series of documents containing specific time-series information related. We emphasis the importance of changes of data during some time period rather than data points, as the unit of information extracted and represented. Based on this idea, we propose a visualization method in which qualitative and quantitative characteristics of changes of a given time-series information are plotted with textually represented comments, and a widely applicable information extraction method that regards the changes of time-series information as information primitives and extracts those for the visualization.