著者
西垣 貴央 小野田 崇
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

観測データをそのデータの高次独立性に基づきクラスタリングする手法を提案し,文書情報など,複数のクラスタに属する情報がある場合での有効性を示した。しかし,ユーザが望むクラスタリング結果とならない場合があった。そのため,ユーザ制約を考慮できるように提案手法を拡張する必要がある。本報告では,ユーザ制約を考慮できる一つの拡張方法について述べるとともに,その有用性をベンチマークデータによる実験で示す。
著者
西垣 貴央 新田 克己 小野田 崇
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.4, pp.D-FB1_1-13, 2016-07-01 (Released:2016-08-03)
参考文献数
32

In this paper, we propose a constrained independent topic analysis in text mining. Independent topic analysis is a method for extracting mutually independent topics from the text data by using the independent component analysis. In the independent topic analysis, it is possible to obtain the most independent topics. However, these obtained topics may differ from the ones wanted by user. For example, it is assumed resultant three topics, topic A and topic B and topic C. If a content of topic A and topic B is thought to be close, user wants to merge the topic A and topic B as one of the topic D. In addition, when user wants to analyze topic A in more detail, user would like to separate topic A to topic E and topic F. In that case, method which can incorporate these requests of the user is required. To that end, we define the Merge Link constraints and Separate Link constraints. Merge Link constraints is a constraint that merges two topics in a single topic. Separate Link constraint is a constraint that separates one of the topics in the two topics. In this paper, we propose a method of obtaining a highly independent topic that meet these constraints. We conducted evaluation experiments on proposed methods, and obtained results to show the effectiveness of our approach.
著者
西垣 貴央 小野田 崇
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

一般に,既存のクラスタリング手法はクラスタ内データの類似性のみに着目しており,クラスタ間の距離や独立性については考慮されていない。しかし,そのクラスタリング結果を見たユーザは,クラスタ内は類似しており,クラスタ間が離れている,または,独立であると期待する場合が多い。本研究では,クラスタ間の独立性が高く,かつクラスタ内の類似性が高いクラスタリングを提案し,ベンチマークデータに適用した結果を示す。