著者
池田 定博 金田 重郎 金杉 友子 加藤 恒昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.99, no.708, pp.113-120, 2000-03-17
参考文献数
6
被引用文献数
2

商品開発やマーケティングでは、効果的なコンセプトの作成が極めて重要である。しかし, 思いついた多数のコンセプトや広告コピー案の中から, 戦略の柱となるキーワード候補を絞り込んでゆく方法は知られていない.本稿では, この問題を解決するため, 「流行ことば予測」手法を提案する.そこでは, まず, 過去・現在・将来における流行語の背景となる社会的要因を、「ことば」として表現する.そして, 今後流行の可能性がある新しい「ことば」と, これら社会的要因との距離を計算し, 「近い」と算出されたことばから, 流行のキーワードを開発する.過去の「ことば」としては, 自由国民社発行の「現代用語の基礎知識」を使用し、距離計算にはベクトル空間法を利用した。1998年度の流行語大賞である「ショムニ」等が, どのような背景により流行したかを実験的に分析する。
著者
松澤 和光 阿部 明典 笠原 要 金杉 友子
雑誌
全国大会講演論文集
巻号頁・発行日
vol.55, pp.224-225, 1997-09-24

「言霊(ことだま)」-古来より日本人は言葉の持つ不思議な力/能力をそう呼んで, 敬い, 大切に扱ってきた。日本語には同音異義語や, 音の組み合わせだけで意味をなす擬音語/擬態語の類が多い。また, 漢字という表意文字を使用することによって, 音のみならず視覚的に何かを訴えることのできる言語てもある。日本語はまさに「とほうもない可能性を有する天才」といえるだろう。その天才ぶりを証明するかのように, 日本には日本語の特性を利用した「言葉遊び」的なものが数多く存在する。古くは短歌の中に見られる表現技法から, 今日においてもよく見られる「しりとり」 「回文」まで, その在り様は多岐をきわめる。しかし, 昨今の科学技術文明の中, テレビ等の映像メディアの出現て, 我々現代人はこうした「言葉に対する敬虔な気持ち/ゆとり」を失って来つつあるように思われる。さて, 時代はまさにネットワーク&マルチメディア社会へ突入しようとしている。この人類が未経験の新世界の入り口に立って, 人々はある種の戸惑いや恐れを感じているのてはないか。こうした心理的障壁を取り除ぎ, 人々が科学技術と調和した豊かな社会生活を創り出していくためには, 新時代にふさわしい新しい「言葉遊び」の文化を創世していくべきではないか。当研究所では, 人と人の豊かなコミュニケーション社会を実現するため, 「言葉を工学的に取扱う技術」について研究してきた。この成果の1つの応用として, コンピュータに人間と同じような言葉遊びをさせることに成功した。この技術を利用すると, ネットワークを通じてコンピュータや見知らぬ人と色々な言葉遊びを行なえる。そこで, こうした言葉遊び文化の発展と, 技術的成果の新たな適用性を探るため, 首葉を扱う技術を利用した新しい「言葉遊び」のアイデアを, ネットを通じて募集するコンテストを開催した(図1)。このコンテストと募集結果について技術的に考察する。
著者
笠原 要 佐藤浩史 フランシス ボンド 田中 貴秋 藤田 早苗 金杉 友子 天野 成昭
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2004, no.1(2003-NL-159), pp.75-82, 2004-01-13

単語の意味を用いた情報処理技術の基盤となりうる基本語の言語知識ベースとして,「基本語彙知識ベース」の構築を進めている.本稿では,その構想と,中核となる2.8万の基本語の意味記述である「基本語意味データベース」の構築状況について説明する.
著者
佐藤 浩史 笠原 要 金杉 友子 天野 成昭
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.19, no.6, pp.502-510, 2004 (Released:2004-09-03)
参考文献数
26
被引用文献数
1 3

This paper proposes a new method for selecting fundamental vocabulary. We are presently constructing the Fundamental Vocabulary Knowledge-base of Japanese that contains integrated information on syntax, semantics and pragmatics, for the purposes of advanced natural language processing. This database mainly consists of a lexicon and a treebank: Lexeed (a Japanese Semantic Lexicon) and the Hinoki Treebank. Fundamental vocabulary selection is the first step in the construction of Lexeed. The vocabulary should include sufficient words to describe general concepts for self-expandability, and should not be prohibitively large to construct and maintain. There are two conventional methods for selecting fundamental vocabulary. The first is intuition-based selection by experts. This is the traditional method for making dictionaries. A weak point of this method is that the selection strongly depends on personal intuition. The second is corpus-based selection. This method is superior in objectivity to intuition-based selection, however, it is difficult to compile a sufficiently balanced corpora. We propose a psychologically-motivated selection method that adopts word familiarity as the selection criterion. Word familiarity is a rating that represents the familiarity of a word as a real number ranging from 1 (least familiar) to 7 (most familiar). We determined the word familiarity ratings statistically based on psychological experiments over 32 subjects. We selected about 30,000 words as the fundamental vocabulary, based on a minimum word familiarity threshold of 5. We also evaluated the vocabulary by comparing its word coverage with conventional intuition-based and corpus-based selection over dictionary definition sentences and novels, and demonstrated the superior coverage of our lexicon. Based on this, we conclude that the proposed method is superior to conventional methods for fundamental vocabulary selection.
著者
池田 定博 金田 重郎 金杉 友子 加藤 恒昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.710, pp.113-120, 2000-03-17
参考文献数
6
被引用文献数
2

商品開発やマーケティングでは、効果的なコンセプトの作成が極めて重要である。しかし, 思いついた多数のコンセプトや広告コピー案の中から, 戦略の柱となるキーワード候補を絞り込んでゆく方法は知られていない.本稿では, この問題を解決するため, 「流行ことば予測」手法を提案する.そこでは, まず, 過去・現在・将来における流行語の背景となる社会的要因を、「ことば」として表現する.そして, 今後流行の可能性がある新しい「ことば」と, これら社会的要因との距離を計算し, 「近い」と算出されたことばから, 流行のキーワードを開発する.過去の「ことば」としては、自由国民社発行の「現代用語の基礎知識」を使用し、距離計算にはベクトル空間法を利用した。1998年度の流行語大賞である「ショムニ」等が, どのような背景により流行したかを実験的に分析する。
著者
金杉 友子 笠原 要 稲子 希望 天野 成昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.66, pp.119-124, 2002-07-15
被引用文献数
1

意味に関する言語処理技術の基盤となりうる概念辞書である"常識概念体系"を構築する第一歩として、人々の概念的な思考で共通して利用していると推定される基本的な語の集合("基本的語彙"と呼ぶ)を選定した.選定の対象としては学研国語大辞典(9万5千見出し語)を用い、選定の尺度として、心理実験により評定される単語の馴染み深さを表す単語属性である単語親密度を用いた.過去の研究において12歳児の理解語彙数の推測値が2万5千と報告されており、別の語彙数調査結果から、同数の語彙を成人の94%が知っていると推測される.そこで、基本的語彙数を2万5千程度と定めた.国語辞典の見出し語について、過去の単語親密度に関するデータベースに含まれていない3万3千語の追加の評定実験を行い、9万5千語から親密度が高い2万7千語を基本的語彙として実際に選定した.As the first step of constructing a dictionary of word concepts, the "Commonsense Concept Database," which will be a base for language processing technologies regarding meaning, we selected basic words which are supposed to be commonly used by Japanese adults. We selected the basic words from a Japanese dictionary in which the number of word entries is about 95,000. In a previous study, the size of the basic words which a Japanese child of twelve years knew was estimated to be 25,000. From the another recent psychological study estimating the number of the vocabulary in Japanese speakers, we were able to estimate that 25,000 of the Japanese basic words were known by 94% of Japanese adults. Therefore, we selected the number of basic words for Commonsense Concept Database to be 25,000. As a measure of selecting the basic word, we used word familiarity ratings. We did farther psychological experiments of rating familiarity of words in the Japanese dictionary which had not been listed in the word familiarity database previously published. Finally, we selected all words with a familiarity rating above five(between seven point scale) which gave us around 27,000 words out of the 95,000 entries of the dictionary.