著者
尾野 嘉邦 石綿 はる美 三輪 洋文 横山 智哉 中村 航洋 松林 哲也 粕谷 祐子 木村 泰知 河村 和徳
出版者
東北大学
雑誌
基盤研究(A)
巻号頁・発行日
2020-04-01

本研究の目的は、人々のジェンダーバイアスとその政治的影響を包括的に検証し、「指導的地位」に占める者の間に大きな男女格差が生じる要因と解決策を明らかにすることである。それにより、政治や社会において男女共同参画をさらに進めるだけでなく、男女それぞれが個人として、多様な選択やキャリアの実現を可能とするための方策を考える。そのために、①議事録などのテキストデータを機械学習によって分析するテキストマイニング、②サーベイ実験などの実験的手法により因果関係の解明を目指す行動実験、③世界各国の専門家を対象とした大規模なサーベイによる国際比較調査、という複数の手法を用いて、学際的かつ国際的に研究を行う。
著者
乙武 北斗 高丸 圭一 内田 ゆず 木村 泰知
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.35, no.3, pp.700-705, 2023-08-15 (Released:2023-08-16)
参考文献数
10

議会会議録には議会におけるすべての発言が記録されている.議会会議録の発言内容に基づき,議会における議員の取り組みや政治的態度を明らかにする研究が進められている.従来の研究ではTF-IDFなどの単語ベースの方法が用いられており,複数単語のフレーズや文脈を考慮する表現力に欠けていた.本論文では,会議録中の各発言の発言者を推定するBERTベースの分類器とSHAPを用いて算出されるトークン単位の分類貢献度を利用し,発言文から文節単位で政治的関心を含む特徴的な表現を抽出する手法,およびその結果の分析について述べる.文節単位で係り受け関係も考慮することで,抽出された表現の文脈を提示できる.分析の結果,本手法はTF-IDFと比較して発言者の政治的関心が見受けられる特徴的な表現を多く抽出できることを確認した.また,TF-IDFでは抽出が困難な,発言者の独特の言葉遣いを抽出できることを確認した.
著者
木村 泰知 小林 暁雄 坂地 泰紀 内田 ゆず 高丸 圭一 乙武 北斗 吉田 光男 荒木 健治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

本研究では,地方政治に関する研究の活性化・学際的応用を目指して,「議論の背景」「議論の過程」「議論の結果」を関連づけるコーパスの構築を進めている.本稿では,議論の背景・過程・結果を関連づける地方政治コーパスの構築の試みについて述べる.
著者
木村 泰知 ジェプカ ラファウ 高丸 圭一
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

我々は「ラジオ番組のパーソナリティとリスナーのリアルタイムな反応」の関係性が「対話システムとユーザ」の最適な関係であると考え,対話システムの最終ゴールを示すとともに,従来の対話システムの問題を述べ,対話システムのプラットフォーム(Radiobots FM)構築に向けたプロトタイプを紹介する.
著者
木村 泰知 近藤 隆史 門脇 一真 加藤 誠
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2022, no.FIN-029, pp.32-38, 2022-10-08 (Released:2022-10-01)

This paper proposes an Understanding of non-Financial Objects in Financial Reports (UFO) task. The UFO task aims to develop techniques for extracting structured information from tabular data and documents, focusing on annual securities reports. We will provide a dataset based on annual securities reports and organize an evaluation-based workshop for participants. The UFO task consists of two subtasks: table data extraction (TDE) and text-to-table relationship extraction (TTRE). The table data extraction subtask aims to extract the correct entries and values in the tables of the annual securities reports. The text-to-table relationship extraction subtask aims to link the values contained in the tables with the relevant statements in the text. In this paper, we describe an overview of the UFO task.
著者
門脇 一真 木村 泰知 加藤 誠 近藤 隆史 乙武 北斗
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2023, no.FIN-030, pp.100-105, 2023-03-04 (Released:2023-03-04)

我々は,有価証券報告書(有報)に含まれるさまざまなタイプの表の理解を目的に,表構造解析を行うタスクを計画している.有報にはタクソノミがテキストブロックとして定義された箇所があり,特に非財務情報を表現する表には様々なタイプが含まれる.既存研究を参考に有報の表の各セルをヘッダ,属性,データといったクラスに分類した結果,既存研究で分類された関係表,エンティティ表,行列表などのいずれのパターンにも分類されない複雑な構造の表が見られ,さらにそれらの構造がいくつかのパターンに分類できた.本稿ではまず,各セルの分類方法と,その結果発見された表構造のパターンについて報告する.これらのうちセルが正しく分類できた表については,NTCIR-17 UFOタスクの表データ抽出(TDE)サブタスクでアノテーションデータを公開し,評価型ワークショップとして取り組めるようにする予定である.本稿ではこのタスクのデータ形式,評価方法についても取り上げる.
著者
桧森 拓真 木村 泰知 坂地 泰紀 荒木 健治
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.31, no.2, pp.645-652, 2019-04-15 (Released:2019-04-15)
参考文献数
13

本研究では,地方議会会議録に含まれるテキストの発言箇所を自動で推定する.実験のデータセットは,平成23年4月から平成27年3月までの4年間の4つの自治体の議会会議録であり,青森県,東京都,大阪府,福岡県の会議録に対して,人手で発言文と発言以外の文にアノテーションを行った.「4年間のデータを利用した発言文の推定実験」では,学習データと評価データに「同一自治体のデータ」を利用した実験,および,「異なる自治体のデータ」を利用した実験を行なった.実験の結果,SVMの平均正解率が最も高く,それぞれ,0.985,0.951となった.また,少量の学習データによる「1年間のデータを利用した推定実験」では,LSTMとSVMの比較を行った.比較実験の結果,LSTMの平均正解率が0.926となりSVMの平均正解率よりも6.1ポイント上回る結果となった.
著者
木村 泰知 荒木 健治 桃内 佳雄 栃内 香次
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.9, pp.2079-2091, 2001-09-01

本論文では対話例から学習を行う音声対話処理手法について述べる.多くの音声対話システムはあらかじめ生成規則やデータベースを与えて処理を行うタスク指向であり,日常対話における雑談などの様々な話題を処理することは難しい.本手法はシステムとユーザのやりとりを対話例として,遺伝的アルゴリズムを用いた帰納的学習によってシステム応答とユーザ発話を対としたルールの獲得を行う.あらかじめ学習データを必要とせず,実対話例から獲得したルールにより応答を試みる.そのため,動的なデータから学習を行うことができ,データによる偏りを少なくする.本論文では本手法の有効性を明らかにするために,雑談を対象とし,音声対話に拡張したELIZA型システムと本手法によるシステムとの比較実験及び,複数被験者による実験を行った.その結果,比較実験で正応答と準応答の合計の割合が66.3%から76.1%に向上したことと,実対話例から獲得したルールを用いて有効な応答を行うことを確認した.この9.8ポイントの向上という結果は本手法が雑談に対して有効であることを示している.
著者
高丸 圭一 内田 ゆず 乙武 北斗 木村 泰知
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.306-318, 2015-01-06 (Released:2015-01-06)
参考文献数
25
被引用文献数
2

An onomatopoeia is a useful linguistic expression to describe sounds, conditions, degrees and so on. It is said Japanese is rich in onomatopoeic expressions. They are frequently used in daily conversations. The meaning and surface structure of an onomatopoeia varies diachronically. There seem to be regional variations in usage of onomatopoeias. It is necessary to investigate the actual condition of onomatopoeia quantitatively in order to apply onomatopoeias into artificial intelligence. This paper studies practical usages of onomatopoeias in spoken modern Japanese language. To explore Japanese onomatopoeias nowadays, we investigate regional assembly minutes collected from all areas in Japan. The corpus of regional assembly minutes, which has about 300 million words, is the target of the investigation of this study. The minutes of Japanese regional assemblies contain all transcriptions of the utterances in the assemblies. This corpus is suitable for our research since attributes of the speakers are clear and speakers are distributed nation-wide. The first research is about total frequency and regional distribution of onomatopoeias. The onomatopoeias, which represent a request for a promotion of policy, e.g., ``shikkari'', ``dondon'', are used at high frequency in regional assemblies. There are no remarkable regional differences in frequencies of these onomatopoeias though western Japan has slight higher frequency. The second research is about the meaning of the onomatopoeias. Most of onomatopoeias are polysemous. The meaning of the onomatopoeia differs by context. The authors have manually checked through 10,827 sentences, which contain 153 kinds of onomatopoeia, and then classified the meaning of each onomatopoeic expression. We analyzed for the following subjects: i) ambiguity of onomatopoeic expression, ii) regional differences in meaning, iii) new meanings in modern spoken language, iv) special usage in assemblies, and v) onomatopoeias in the named entities. The third research is about false extraction of onomatopoeias in the morphological analysis. The extraction errors are analyzed from the viewpoint of surface structure and appearance position. In terms of surface structure, it is clear that the word length of an onomatopoeic expression, which has highly false extraction, is shorter. The onomatopoeic expressions, which end with special morae, namely moraic obstruent, moraic nasal and long vowel, have a higher rate of false extraction. In terms of appearance position, dialectal grammar is the main factor causing false extraction. About 25% of false extraction is found in the sentence-closing particles in dialectal grammar. The result of quantitative analysis of the onomatopoeia in modern spoken Japanese language serves as the basic data which contributes to engineering. The results of the analysis in our research are exhibited through the WWW. It is hoped that results will contribute broadly to the practical use of onomatopoeia in the engineering field.
著者
筒井 貴士 我満 拓弥 大城 卓 菅原 晃平 永井 隆広 渋木 英潔 木村 泰知 森 辰則
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.21, no.2, pp.125-155, 2014
被引用文献数
1

近年,国会や地方議会などの会議録が Web 上に公開されている.会議録は,首長や議員の議論が書き起こされた話し言葉のデータであり,長い年月の議論が記録された通時的なデータであることから,政治学,経済学,言語学,情報工学等の様々な分野において研究の対象とされている.国会会議録を利用した研究は会議録の整備が進んでいることから,多くの分野で行われている.その一方で,地方議会会議録を利用した研究については,各分野で研究が行われているものの,自治体によりWeb上で公開されている形式が異なることが多いため,収集作業や整形作業に労力がかかっている.また,各研究者が重複するデータの電子化作業を個別に行っているといった非効率な状況も招いている.このような背景から,我々は多くの研究者が利用することを目的として,地方議会会議録を収集し,地方議会会議録コーパスを構築した.本稿では,我々が構築した地方議会会議録コーパスについて論ずる.同コーパスは,Web上で公開されている全国の地方議会会議録を対象として,「いつ」「どの会議で」「どの議員が」「何を発言したのか」などの各種情報を付与し,検索可能な形式で収録した.また,我々は会議録における発言を基に利用者と政治的に近い考えをもつ議員を判断して提示するシステムを最終的な目的としており,その開発に向けて,分析,評価用のデータ作成のために会議録中の議員の政治的課題に対する賛否とその積極性に関する注釈付けをコーパスの一部に対して行った.本稿では,注釈付けを行った結果についても報告する.
著者
木村 泰知 渋木 英潔 高丸 圭一 乙武 北斗 小林 哲郎 森 辰則
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.26, no.5, pp.580-593, 2011 (Released:2011-07-20)
参考文献数
14
被引用文献数
3

This paper presents an automatic question generation method for a local councilor search system. Our purpose is to provide residents with information about local council activities in an easy-to-understand manner. Our designed system creates a decision tree with leaves that correspond to local councilors in order to clarify the differences in the activities of local councilors using local council minutes as the source. Moreover, our system generates questions for selecting the next branch at each condition in the decision tree. We confirmed experimentally that these questions are appropriate for the selection of branches in the decision tree.