著者
乙武 北斗 高丸 圭一 内田 ゆず 木村 泰知
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.35, no.3, pp.700-705, 2023-08-15 (Released:2023-08-16)
参考文献数
10

議会会議録には議会におけるすべての発言が記録されている.議会会議録の発言内容に基づき,議会における議員の取り組みや政治的態度を明らかにする研究が進められている.従来の研究ではTF-IDFなどの単語ベースの方法が用いられており,複数単語のフレーズや文脈を考慮する表現力に欠けていた.本論文では,会議録中の各発言の発言者を推定するBERTベースの分類器とSHAPを用いて算出されるトークン単位の分類貢献度を利用し,発言文から文節単位で政治的関心を含む特徴的な表現を抽出する手法,およびその結果の分析について述べる.文節単位で係り受け関係も考慮することで,抽出された表現の文脈を提示できる.分析の結果,本手法はTF-IDFと比較して発言者の政治的関心が見受けられる特徴的な表現を多く抽出できることを確認した.また,TF-IDFでは抽出が困難な,発言者の独特の言葉遣いを抽出できることを確認した.
著者
木村 泰知 小林 暁雄 坂地 泰紀 内田 ゆず 高丸 圭一 乙武 北斗 吉田 光男 荒木 健治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

本研究では,地方政治に関する研究の活性化・学際的応用を目指して,「議論の背景」「議論の過程」「議論の結果」を関連づけるコーパスの構築を進めている.本稿では,議論の背景・過程・結果を関連づける地方政治コーパスの構築の試みについて述べる.
著者
家坂 光弥 内田 ゆず 米山 淳
出版者
日本知能情報ファジィ学会
雑誌
日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集 第30回ファジィシステムシンポジウム
巻号頁・発行日
pp.632-637, 2014 (Released:2015-04-01)

オノマトペは日本語での日常会話において、微妙なニュアンスを伝えるという重要な役割を担っている。 また、日本語は世界各国の言語の中でも特にオノマトペに富む言語であるため、世界各国の言語には日本語のオノマトペに対応する言葉が少ない。このため、日本語学習者にとって日本語のオノマトペの学習が必須なのは明らかである。既存の学習方法としては、72語のオノマトペをスキットを通して学習することができるwebサイトがある。しかし、日本語のオノマトペの学習方法は未だ確立されていないのが現状である。以上により、日本語学習者のオノマトペ学習を支援するシステムが必要である。本稿では、日本語学習者にとって最適なオノマトペ学習の方法を検討するため、日本人の擬音語・擬声語の判別方法や使用方法について調査する。さらに、擬音語、擬声語を検索、学習できるタブレット端末用のアプリケーションを開発する。
著者
高丸 圭一 内田 ゆず 乙武 北斗 木村 泰知
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.306-318, 2015-01-06 (Released:2015-01-06)
参考文献数
25
被引用文献数
2

An onomatopoeia is a useful linguistic expression to describe sounds, conditions, degrees and so on. It is said Japanese is rich in onomatopoeic expressions. They are frequently used in daily conversations. The meaning and surface structure of an onomatopoeia varies diachronically. There seem to be regional variations in usage of onomatopoeias. It is necessary to investigate the actual condition of onomatopoeia quantitatively in order to apply onomatopoeias into artificial intelligence. This paper studies practical usages of onomatopoeias in spoken modern Japanese language. To explore Japanese onomatopoeias nowadays, we investigate regional assembly minutes collected from all areas in Japan. The corpus of regional assembly minutes, which has about 300 million words, is the target of the investigation of this study. The minutes of Japanese regional assemblies contain all transcriptions of the utterances in the assemblies. This corpus is suitable for our research since attributes of the speakers are clear and speakers are distributed nation-wide. The first research is about total frequency and regional distribution of onomatopoeias. The onomatopoeias, which represent a request for a promotion of policy, e.g., ``shikkari'', ``dondon'', are used at high frequency in regional assemblies. There are no remarkable regional differences in frequencies of these onomatopoeias though western Japan has slight higher frequency. The second research is about the meaning of the onomatopoeias. Most of onomatopoeias are polysemous. The meaning of the onomatopoeia differs by context. The authors have manually checked through 10,827 sentences, which contain 153 kinds of onomatopoeia, and then classified the meaning of each onomatopoeic expression. We analyzed for the following subjects: i) ambiguity of onomatopoeic expression, ii) regional differences in meaning, iii) new meanings in modern spoken language, iv) special usage in assemblies, and v) onomatopoeias in the named entities. The third research is about false extraction of onomatopoeias in the morphological analysis. The extraction errors are analyzed from the viewpoint of surface structure and appearance position. In terms of surface structure, it is clear that the word length of an onomatopoeic expression, which has highly false extraction, is shorter. The onomatopoeic expressions, which end with special morae, namely moraic obstruent, moraic nasal and long vowel, have a higher rate of false extraction. In terms of appearance position, dialectal grammar is the main factor causing false extraction. About 25% of false extraction is found in the sentence-closing particles in dialectal grammar. The result of quantitative analysis of the onomatopoeia in modern spoken Japanese language serves as the basic data which contributes to engineering. The results of the analysis in our research are exhibited through the WWW. It is hoped that results will contribute broadly to the practical use of onomatopoeia in the engineering field.
著者
内田 ゆず 荒木 健治 米山 淳
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.24, no.3, pp.811-820, 2012-06-15 (Released:2012-06-26)
参考文献数
10
被引用文献数
2 4

日本語の語彙には,オノマトペが豊富に存在している.これらの語は生き生きとした表現力をもち,日本語でのコミュニケーションには欠かせないものとなっている.日本語を母語とする人は,ごく自然にオノマトペの用法を身につけ,「感覚的に」使用する.そのため,オノマトペをほかの言葉に置き換えたり,その意味を明確に説明することは困難である.日本語学習者がオノマトペの意味や用法を習得することは難しいとされている.オノマトペを学ぶ方法のひとつとして,オノマトペを用いた様々な表現に触れることが挙げられる.そこで,本論文では,ブログ記事を対象としたオノマトペ用例文の自動抽出手法を提案する.提案手法は,オノマトペの後続要素と係り先を分析した結果に基づくものである.評価実験の結果,41,315件のブログ記事から15,437文の用例文を抽出し,適合率96.2%(481/500)が得られた.