1 0 0 0 OA differential PLSA

著者
野守 耕爾
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.4G2OS8a02, 2019 (Released:2019-06-01)

PLSA(確率的潜在意味解析)などトピックモデルを適用してテキストデータからトピックを抽出する際に,典型的なトピックだけではなく,より個性的なトピックを抽出する手法としてdifferential PLSA(以下diff-PLSA)を提案する.本稿では,電気自動車に関連する26,419件の特許の要約文データを例に,通常のPLSAを適用した結果とdiff-PLSAを適用した結果を比較し,提案手法の有効性を検討した.その結果,通常のPLSAでは,頻度の多い表現でトピックが構成される傾向にあり,全体を表す代表的なトピックが抽出されやすいが,diff-PLSAでは,頻度の少ないより具体的で細かい表現もトピックを構成しており,より個性の強いトピックが抽出されていた.ビジネスにおけるデータ活用では,新たな気づきとなるインサイトを獲得することが求められるが,テキストデータからより個性的なトピックを抽出できるdiff-PLSAはそうしたインサイト獲得に向けて有用な知識を提供することが期待できる.
著者
野守 耕爾
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.3F1OS12a01, 2018 (Released:2018-07-30)

テキストデータからあるターゲット事象に影響を与えるトピックに限定してPLSAで抽出する手法を,確率的因果意味解析(PCSA: Probabilistic Causal Semantic Analysis)として提案する.またその適用事例として,約3万件の特許公報の要約のテキストデータを用いて,ある出願年以降の出願であることをターゲット事象に,その出願年前後で影響を与えるトピック,つまりその出願年を境に上昇傾向,あるいは下降傾向にあるトピックを抽出した分析結果を紹介する.本手法はテキストデータに潜む要因関係を顕在化させ,特にターゲット事象に影響を与える要因を集中的に抽出することができ,効果的なビジネスアクションの検討に有用な知識を提供することが期待できる.
著者
野守 耕爾
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.68, no.7, pp.332-337, 2018-07-01 (Released:2018-07-01)

テキストマイニングにPLSA(確率的潜在意味解析)とベイジアンネットワークという2つの人工知能技術を応用した新たなテキスト分析技術とそれを特許文書データに適用した分析事例を紹介する。風や空気に関連する約3万件の特許公報の要約文を対象とし,PLSAの実行でその要約内容を数十個のトピックに集約して全体像をシンプルに理解可能にした。またそのトピックを軸に,技術のトレンドを把握したり,各出願人のポジショニングを可視化することで提携戦略や競争戦略の検討について考察した。さらにベイジアンネットワークにより用途と技術のトピック間の確率的因果関係をモデル化することで,企業が保有する技術の新たな用途展開の着想を検討した。