著者
奥野 智孝 市野 将嗣 久保山 哲二 吉浦 裕
雑誌
研究報告コンピュータセキュリティ(CSEC)
巻号頁・発行日
vol.2011, no.2, pp.1-8, 2011-11-28

近年,多様な個人情報がネットワーク上に流通している.同一人物に関する複数の情報を入手することで,単独の情報からでは分からなかった情報が明らかになり,予期せぬプライバシー侵害につながる懸念がある.本研究ではこの危険性を明らかにするために,問題の代表例としてバックグラウンドチェックと呼ばれる雇用前の身辺調査を例に挙げ,ソーシャルメディアのプロフィールが匿名化されていても,履歴書の情報を基にソーシャルメディアのコンテンツの特徴を分析することで,採用希望者のアカウントを特定できることを示した.これにより,履歴書の情報とソーシャルメディアで開示された情報を統合し,個人の言動を調査することができる.Various types of personal information about individuals are accessible through the Web medias. Linking of the personal information obtained through multiple medias can lead to a serious violation of privacy. To address this problem, we developed a method to identify the author of the short messages of Twitter, known as tweets, by using the information from other medias.
著者
木村 大翼 久保山 哲二 渋谷 哲朗 鹿島 久嗣
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.26, no.3, pp.473-482, 2011 (Released:2011-04-19)
参考文献数
26
被引用文献数
2 12

Kernel method is one of the promising approaches to learning with tree-structured data, and various efficient tree kernels have been proposed to capture informative structures in trees. In this paper, we propose a new tree kernel function based on ``subpath sets'' to capture vertical structures in tree-structured data, since tree-structures are often used to code hierarchical information in data. We also propose a simple and efficient algorithm for computing the kernel by extending the Multikey quicksort algorithm used for sorting strings. The time complexity of the algorithm is O((|T_1|+|T_2|)log(|T_1|+|T_2|)) time on average, and the space complexity is O({|T_1|+|T_2|)}, where |T_1| and |T_2| are the numbers of nodes in two trees T_1 and T_2. We apply the proposed kernel to two supervised classification tasks, XML classification in web mining and glycan classification in bioinformatics. The experimental results show that the predictive performance of the proposed kernel is competitive with that of the existing efficient tree kernel proposed by Vishwanathan et al., and is also empirically faster than the existing kernel.
著者
江村 恒一 安木 慎 宮崎 誠也 久保山 哲二 青木 輝勝 安田 浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. KBSE, 知能ソフトウェア工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.473, pp.61-66, 2007-01-16
被引用文献数
3

Weblogなどの新たなコミュニケーションツールの普及により,個人が容易に情報発信する消費者発信型メディア(CGM: Consumer Generated Media)が急激に増加しており,既存のマスメディアからのパラダイムシフトを引き起こしている.さらに,携帯端末から投稿するMobile Weblog(モブログ)の登場により,時間と場所に制約されない情報発信が可能となっている.しかしながら,大量な情報を受発信できるようになったことで,必要な情報を取り出したり,相手に本当に伝えたい気持ちを表現することが困難となっている.このため,電子メールやWeblogなどの日常的に用いるテキストを対象に書き手の感情を抽出する研究が行われているが,感情を表現した語に基づいて抽出するため,感情語を含ないテキストから感情を抽出するために適した特徴量を扱えないなどの課題がある.本稿では,文末に付与する絵文字が感情を表すという仮定に基づき,SVMを用いて学習,感情モデルを構築し,書き手の感情を抽出する方式を提案する.
著者
杉山 佳奈美 久保山 哲二 三輪 洋文 宇野 毅明
雑誌
じんもんこん2022論文集
巻号頁・発行日
vol.2022, pp.289-294, 2022-12-02

選挙公報のテキストデータに対して文書クラスタリングを適用した. クラスタリング手法には、 文書間類似度により形成されるネットワーク構造から密な部分構造を抽出するマイクロクラスタリン グと、代表的なトピックモデルである LDAの2種類を利用した. クラスタリング結果を比較したとこ ろ, マイクロクラスタリングではトピックの解釈が容易な解像度が高いクラスタ, 特に政党に関して より類似度が高いクラスタが多数得られることが示された. さらにマイクロクラスタリングで抽出さ れた文書クラスタを元に回帰分析を行い, 個人票志向の候補者の傾向を解析した. その結果, LDA を 用いた先行研究にあった人手によるトピック解釈の過程を経ることなく, 選挙制度改革前後の変化や 政党ごとの特色について先行研究の主張を支持する結果が得られた.
著者
宮原 哲浩 内田 智之 久保山 哲二 廣渡 栄寿
出版者
広島市立大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

知識発見と情報融合を実現するため,半構造データからのデータマイニングと機械学習について研究した.厳密には定義されていない構造を持つデータを半構造データという.主に,半構造データとして木構造で表される糖鎖データを対象とし,その構造的特徴を表す木構造パターンを獲得する機械学習手法を提案した.手法として,木構造などの構造的表現を扱うことのできる進化的最適解探索手法である遺伝的プログラミングを用いた.