著者
内田 脩斗 吉川 大弘 ジメネス フェリックス 古橋 武
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回 (2018)
巻号頁・発行日
pp.2C105, 2018 (Released:2018-07-30)

文書分類は,現代の情報化社会において重要な技術である. また,Word2vecを用いて単語の意味関係をベクトルへ埋め込む分散表現が近年注目を集めており,文書分類へ適用する手法も報告されている. 分散表現は一般的にWord2Vecと呼ばれるツールを用いて生成される.そして,Word2Vecはニューラルネットワークを用いた学習構造をしており,ネットワーク内の入力側の重みを分散表現として利用している.しかし,Word2Vecでは,分散表現とは別にネットワーク上で学習される出力側の重みが存在し,異なる性質を持っていると考えられるが一般的に利用されていない. そこで本稿では,分散表現と出力側の重みを利用したアンサンブル学習による文書分類手法を提案し,提案手法の有用性を示す.
著者
内田 脩斗 吉川 大弘 古橋 武
出版者
日本知能情報ファジィ学会
雑誌
日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集 第34回ファジィシステムシンポジウム
巻号頁・発行日
pp.214-216, 2018 (Released:2019-01-09)

Word2Vecを用いて単語の意味関係をベクトルへ埋め込む分散表現型単語ベクトルが近年注目を集めている.さらに,この単語ベクトルは,構文解析や文書分類など,言語処理分野において幅広く利用され,その有効性も報告され始めている.一般的に,単語ベクトルとして利用されるのは,Word2Vec学習ネットワーク上の入力側重みであり,同時に生成される出力側重みは利用されない.これに対し著者らは,対となる出力側重みの有用性に着目し,本稿において,前者と後者を併用した単語ベクトルを提案する.また,実際に単語ベクトルの性能評価実験を行い,その有効性を示す.
著者
内田 脩斗 吉川 大弘 ジメネス フェリックス 古橋 武
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

文書分類は,現代の情報化社会において重要な技術である. また,Word2vecを用いて単語の意味関係をベクトルへ埋め込む分散表現が近年注目を集めており,文書分類へ適用する手法も報告されている. 分散表現は一般的にWord2Vecと呼ばれるツールを用いて生成される.そして,Word2Vecはニューラルネットワークを用いた学習構造をしており,ネットワーク内の入力側の重みを分散表現として利用している.しかし,Word2Vecでは,分散表現とは別にネットワーク上で学習される出力側の重みが存在し,異なる性質を持っていると考えられるが一般的に利用されていない. そこで本稿では,分散表現と出力側の重みを利用したアンサンブル学習による文書分類手法を提案し,提案手法の有用性を示す.