著者
高橋 啓吾 大森 光 小町 守
出版者
人工知能学会
雑誌
2019年度 人工知能学会全国大会(第33回)
巻号頁・発行日
2019-04-08

近年文内述語項構造解析(PASA)においてニューラルネットワークモデルが利用されている.しかしながら,系列ラベリングを用いた手法は一つの項候補に複数の必須格を割り当ててしまう問題がある.我々は新たな手法としてPointer Networksを用いたものを提案し,複数の必須格を割り当ててしまう問題が改善されることを確認した.
著者
丸山 正人 竹川 高志
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3Rin233, 2019 (Released:2019-06-01)

Word2vecは単語の概念を表したベクトル表現を学習する手法である.これを用いて文章内に誤った意味で用いられている単語の検出を目指す.本研究では文章内にある固有名詞を文章で用いられていない固有名詞に交換を行い,その固有名詞を誤字として検出法の検討を行った.結果,線形判別分析を用いると文章内の固有名詞と文章に含まれていない固有名詞の分布の分離を進められ誤字の検出率の向上が見込まれた.
著者
高橋 諒 蓑田 和麻 舛田 明寛 石川 信行
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3C4J903, 2019 (Released:2019-06-01)

カスタマーとクライアントのマッチングビジネスを展開するリクルートでは、クライアントの情報をカスタマーに伝達するために日々大量の原稿が作成されている。本論文では、機械学習を用いてそれらの原稿の誤字脱字を検出する方法を提案する。このシステムは主に2つのパートで成り立っている。1つは複数のBidirectional LSTMを用いて各文字に対して誤りがないかの確率を算出するパート。もう一つはそれらの出力値を入力として、文全体で誤りがあるかないかを判定するランダムフォレストアルゴリズムである。この方法の有効性を示すために人工で作成した文と我々のサービスで持つ実データを用いて検証を行った。
著者
赤坂 亮太
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.2I4OS15b02, 2019 (Released:2019-06-01)

本報告では、AIが法制度に影響を与える場面の、特に人間の意思が問題となる契約に着目し、その解決手法としてAIを代理法における代理人として扱う考え方について検討する。AIが法制度に影響を与える理由として、近代以降の法制度が個人の自由意思と自律に基づき主体としての人間と客体としての非ー人間という区別が、AIの在り方となじまないことを議論する研究者がいる。このような考え方をもとに民法領域を考えてみると、特に人間の意思にもとづいて法律効果が生じる契約は重大な問題を孕んでいる。本報告ではこの問題について米国において議論がみられる代理法における代理人としてAIを解釈する学説を検討した。この説は一定の批判があるものの、ローマ法における奴隷や企業の応用的な概念で社会実装の可能性はある。しかしながら、日本法への導入はなお困難が伴う。
著者
浦澤 合 関根 裕人 乾 孝司 岩倉 友哉
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1N4J903, 2019 (Released:2019-06-01)

本論文は化学化合物抽出におけるサブワード系列の有効性を調査する.5種類のサブワード分割方法(SYMBOL,SP,BPE,BPE-DICT,BPE-PMI)を用いて調査を行った.この内,BPE-DICTとBPE-PMIは今回新たに提案する手法であり,BPE-DICTとは辞書制約付きのBPE,BPE-PMIとは通常のBPEが語の出現頻度を用いる箇所をPointwise Mutual Information(PMI)に置き換えたBPEである.実験結果よりサブワード系列が抽出性能を向上させることを示した.本論文で行った全ての実験結果ではBPE-DICTのF値86.74が最も良い結果となった.
著者
崔 一鳴 西川 仁 徳永 健伸 吉川 和 岩倉 友哉
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1N4J901, 2019 (Released:2019-06-01)

本研究では,化学文書中の専門用語の自動抽出に自己学習を取り入れる手法を提案する.我々は CHEMDNER コーパスを使い,ニューラルネットワークをベースとする化学文書中の専門用語抽出のモデルを訓練した.訓練済みのモデルは自動的に訓練データを作成するために,正解タグがついていない MEDLINE コーパスにアノテーションをするのに使用した.そして,最終的なモデルを獲得するために,人手でタグ付けが行われた CHEMDNER コーパスと自動タグ付けを行った MEDLINE コーパスの両方を用いて訓練を行った.訓練データとしてタグがついていない MEDLINE コーパスを用いた評価は,化学文書中の専門用語抽出における自己学習の有効性を示した.
著者
大知 正直 城 真範 森 純一郎 浅谷 公威 坂田 一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1K3J403, 2019 (Released:2019-06-01)

研究への投資戦略策定のために,早い段階で有望な研究や研究分野を特定することは重要である.また,近年の論文出版数の急増及び専門知識の細分化のため,将来の技術動向を自動で予測する技術の開発が必要である.一方で技術の現状を表す指標には様々なものがあり,どの指標による未来予測を示すかは分析の目的に依存する.つまり,様々な指標による技術動向の自動予測を行うための基盤技術の開発が課題である.そこで,本稿では,出版社の論文データの様々な異種ネットワーク情報を用いて,未来の様々な技術指標を自動で予測するための分散表現を抽出する手法を提案する.実験の結果,論文間の参照関係の予測のF値は95.6%で,出版後3年後のh-indexは一定の条件下で64.4%だった. この結果は,論文間の参照関係を十分に写像できていることを示している.一方で,将来のh-indexの予測精度は比較手法と同等であり,さらに研究を深める必要がある.本論文の成果は,論文データ向けの異種ネットワーク分散表現が技術動向の自動予測を行うための基盤となる可能性が示唆している.
著者
中川 大海 岩澤 有祐 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1Q3J203, 2019 (Released:2019-06-01)

近年,教育と情報技術の融合が進む中で,生徒の過去の学習行動を元に習熟度を推定する,知識獲得予測(knowledge tracing)の研究が活発化している.オンライン教育サービスの普及によるデータの大規模化も伴い,深層学習の活用によって従来より高い精度での予測が可能になったことが知られているが,既存の深層学習を用いた手法はでいずれも知識特有の構造を十分に考慮したモデルが設計されておらず,モデルの予測精度や予測の解釈性・妥当性が損なわれている.本研究では,知識構造をグラフ表現を用いて定式化し,近年発展が進む,深層学習を用いてグラフを扱うGraph Neural Networkを拡張したモデルによって,これらの問題の解決を図る.実験では,提案手法が既存手法に比べて,高精度かつ妥当性と解釈性の高い予測を行えることを,オープンデータを用いて実証的に検証し,またデータから学習されたグラフ構造を分析することで,効率的な知識構造の設計に関して考察する.

1 0 0 0 OA differential PLSA

著者
野守 耕爾
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.4G2OS8a02, 2019 (Released:2019-06-01)

PLSA(確率的潜在意味解析)などトピックモデルを適用してテキストデータからトピックを抽出する際に,典型的なトピックだけではなく,より個性的なトピックを抽出する手法としてdifferential PLSA(以下diff-PLSA)を提案する.本稿では,電気自動車に関連する26,419件の特許の要約文データを例に,通常のPLSAを適用した結果とdiff-PLSAを適用した結果を比較し,提案手法の有効性を検討した.その結果,通常のPLSAでは,頻度の多い表現でトピックが構成される傾向にあり,全体を表す代表的なトピックが抽出されやすいが,diff-PLSAでは,頻度の少ないより具体的で細かい表現もトピックを構成しており,より個性の強いトピックが抽出されていた.ビジネスにおけるデータ活用では,新たな気づきとなるインサイトを獲得することが求められるが,テキストデータからより個性的なトピックを抽出できるdiff-PLSAはそうしたインサイト獲得に向けて有用な知識を提供することが期待できる.
著者
槫松 理樹
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.2I5J903, 2019 (Released:2019-06-01)

本研究では,業務で行われる特許公報の細分化を支援するため,機械翻訳とラフセット理論を利用した特許公報システムを提案する.本手法では,機械翻訳で英語に翻訳することによる表記ゆれの削減,ラフセット理論における「属性の縮約」(クラスがお互いに識別されるために必要かつ十分な属性の組)を用いることによる語句の適切な絞込み,決定ルールを用いることによる語句関係の考慮を図る.本手法では機械翻訳を行った特許公報から抽出した特定の品詞の単語から構築した文書語彙行列から,尤度表とラフセット理論に基づく決定ルールを構築する.これらを利用し,新規特許の分類を行う.提案手法の有用性を評価するために,専門家の協力のもと検証を行った結果,ラフセット理論に基づく分類,尤度表を用いたナイーブベイズ分類ともに一定の精度をあげたことから,提案手法の有用性を示せた.
著者
山田十畝 著
出版者
弄花書屋
巻号頁・発行日
vol.[本編], 1877