著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
vol.15, no.1, pp.31-37, 2016 (Released:2016-02-26)
参考文献数
16

This paper describes linguistic features of generally unreadable person names, which are defined as “KIRAKIRA names,” and proposes a method to detect KIRAKIRA names based on the features. Through the discussions, the following eight features are founded as the linguistic features of KIRAKIRA names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, KIRAKIRA names are automatically detected by using Support Vector Machine. The experiments to detect KIRAKIRA names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
(Released:2015-10-09)
参考文献数
16
被引用文献数
0 or 1

This paper describes linguistic features of generally unreadable person names, which are defined as “KIRAKIRA names,” and proposes a method to detect KIRAKIRA names based on the features. Through the discussions, the following eight features are founded as the linguistic features of KIRAKIRA names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, KIRAKIRA names are automatically detected by using Support Vector Machine. The experiments to detect KIRAKIRA names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
Shan Junjie 西原 陽子 山西 良典 福本 淳一
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

近年、アニメを代表とする日本のポップカルチャーが世界中に発展するに従い、日本語を勉強する人が増えている。学習者が増加すると共に、二つの問題が現れる。一つは教材が足りない事。二つ、伝統的な教材にはコミュニケーション能力への訓練が足りない事。 本研究は、豊かな音声や対話を含む日本アニメを新しい日本語勉強素材として、アニメの台詞を日本語各レベルとの内容を合わせ分析し日本語勉強者に向いて活用可能とする。
著者
福本 淳一
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

日本酒の味表現で多く用いられているのが比喩表現である.これまでの味表現の分析から,香り,甘味,酸味,旨味,苦味についてのいろいろな比喩表現が用いられていることがわかっている.本研究では,比喩表現を用いることでどのような味の違いを説明しているのか,また,比喩表現以外の味表現との違いにはどのようなものがあるのについての分析結果を報告する.
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
vol.15, no.1, pp.31-37, 2016

This paper describes linguistic features of generally unreadable person names, which are defined as "<I>KIRAKIRA</I> names," and proposes a method to detect <I>KIRAKIRA</I> names based on the features. Through the discussions, the following eight features are founded as the linguistic features of <I>KIRAKIRA</I> names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, <I>KIRAKIRA</I> names are automatically detected by using Support Vector Machine. The experiments to detect <I>KIRAKIRA</I> names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
山西 良典 鍵田 里沙子 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
vol.14, no.1, pp.29-35, 2015 (Released:2015-02-10)
参考文献数
19

This paper proposes a method to detect attractive phrases from musical lyrics. The method considers not only acoustic but also lyrical features which attract human attention. Through the interview on impression for lyrics, we have found that “uniqueness of co-occurred terms” and “repetition” significantly influence human attraction. Therefore, we modeled these linguistic expressions as mathematical features. The proposed method detected attractive phrases using support vector machine with the modeled features. The results of the model evaluation experiments showed the 69% accuracy and 86% precision. Moreover, the results were compared and discussed with the key sentences detected by the existing summarization methods. As the result of comparison, it is confirmed that the proposed method detected attractive phrases more accurate than the existing summarization methods.
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
Japan Society of Kansei Engineering
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
2015

This paper describes linguistic features of generally unreadable person names, which are defined as "<I>KIRAKIRA</I> names," and proposes a method to detect <I>KIRAKIRA</I> names based on the features. Through the discussions, the following eight features are founded as the linguistic features of <I>KIRAKIRA</I> names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, <I>KIRAKIRA</I> names are automatically detected by using Support Vector Machine. The experiments to detect <I>KIRAKIRA</I> names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
福本 文代 福本 淳一 鈴木 良弥
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.4, no.2, pp.89-109, 1997-04-10 (Released:2011-03-01)
参考文献数
28

本稿では, 文脈依存の度合いに注目し, 重要パラグラフを抽出する手法を提案する. 本手法では, Luhnらにより提唱されたキーワード密度方式と同様, 「主題と関係の深い語はパラグラフを跨り一貫して出現する」という前提に基づく. 我々は, 文脈依存の度合, すなわち, 記事中の任意の語が, 設定された文脈にどのくらい深く関わっているかという度合いの強さを用いることで, 主題と関係の深い語を抽出し, その語に対し重み付けを行なった.本手法の精度を検証するため人手により抽出したパラグラフと比較した結果, 抽出率を30%とした場合, 50記事の抽出総パラグラフ数84に対し75パラグラフが正解であり, 正解率は89.2%に達した.
著者
山西 良典 古田 周史 福本 淳一 西原 陽子
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.27, no.1, pp.501-511, 2015

インターネットの発展に伴って普及したWebレビューには,有用な情報が含まれている一方で不要な情報も含まれている.そのため,対象の評価視点および評価視点間の関係を捉えることは難しく,レビュー全文を閲覧することはユーザにとって大きな負担となる.本稿では,自由記述形式のレビューにおける評価視点とその評価視点間の関係が不明瞭という問題点を,レビュー構造の俯瞰によって解決可能であると考えた.提案手法では,評価視点の出現頻度とレビュー中の構文特徴を用いることで,レビュー構造の俯瞰に有用な呈示評価視点として,頻出の評価視点と頻出する評価視点に意味的に関連した評価視点を採択する.評価視点抽出実験の結果,評価対象の種別によらず,採択された呈示評価視点には高い適合率が確認された.そして,呈示評価視点採択時に用いた構文特徴を参照することで,獲得する評価視点間の関係の呈示を実現した.
著者
福本 淳一 小松 英二 木下 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理
巻号頁・発行日
vol.95, no.76, pp.23-28, 1995-05-26
被引用文献数
1 or 0

従来の自然言語処理では,文法,辞書,語用論などをはじめとする様々な知識が利用されてきた.自然言語処理の頑健性を向上させるためには,これらの知識を用いた種々の自然言語処理機能が協調的に動作する必要がある.このような協調的システムのモデルとしてマルチエージェントモデルがある.我々は,このマルチエージェントモデルに基づいて,従来の自然言語処理システムに埋め込まれていた自然言語処理モジュール群をエージェントとして形式化し,これらエージェントの協調的動作によって頑健で効率的な自然言語処理システムについて検討を進めている.本稿では,まず,従来のシーケンシャルな自然言語処理における問題点についていくつかの例をあげ,それらの問題点を解決するための基本的な処理の枠組みについて検討する.次に,種々の知識の協調的活用という視点から頑健な自然言語処理の基本的枠組について検討し,マルチエージェントモデルに基づく自然言語処理システムのアーキテクチャについて考察する.
著者
福本 文代 佐野 洋 斎藤 葉子 福本 淳一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.33, no.10, pp.1211-1223, 1992-10-15
被引用文献数
9 or 0

一般に 語の係り受け関係を解析する依存文法は 文を構成する要素間の2項関係を重視しているこのため 従来から提案されている手法の多くは 係り受け関係を判定するための言語的な制約として 格情報あるいは意味属性などを中心とした任意の2要素間の局所的な情報を用いている.しかしこれら局所的な情報だけでは 文全体の構造を決定するための制約として不十分であり 結果的に 可能な解釈として不自然なものまで得られてしまう.そこで本文法では言語的な制約に 係り受けの強度に基づく制約を課した.この制約は 文節とアークに付与された係り受けの強度を用いて2文節間の係り受け関係の有無を判定するものである.ここで 文筋に関する係り受けの強度とは その文節が修飾することができる相手の文節の種類 およびその文節が修飾を受けることができる相手の文節の種類を分類し それぞれ係り 受けの強さの度合いとして表したものであるまた アークに関する係り受けの強度とは 文節同士の結びつきの強さの度合いを示したもので これを用いて依存構造に現れるアーク間の制約を表している.係り受け関係の判定に意味素性を用いた文法と この文法に係り受けの強度に基づく制約を加えた文法とを作成し 文解析実験をった結果 解の数はこの制約を加えることで 約6割に抑えられていることがわかった.本稿ではこの係り受けの強度を用いた文法の記述について述べる.