著者
野沢 健人 若林 啓
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.2, pp.1-10, 2016-06-29

グラフ構造におけるコミュニティ発見手法は,ソーシャルメディアや共著関係,商品の購買データなどから機能的・構造的にまとまりをもったノード群を抽出し分析することを可能にする重要な技術である.特に近年では,非常に大規模なグラフを解析する機会が多くなってきているため,グラフの規模に対してスケーラブルなコミュニティ発見手法が求められている.本研究では,あるノードからの距離が一定以下のノードの集合を文書と見なしてトピックモデルを学習し,トピックごとのノードの予測分布を用いてコミュニティ発見を行う手法について論じたうえで,トピックモデルの学習に確率的変分ベイズ法を適用することで,データの規模に対して高いスケーラビリティを持つ重複コミュニティ発見手法を提案する.実験により,提案手法は6,000万ノード,18億エッジからなる大規模ネットワークに対しても,既存手法と比較して高速なコミュニティ発見を実現できることを示す.
著者
佐藤 哲司 寶珍 輝尚 関 洋平 手塚 太郎 若林 啓 池内 淳 斉藤 和巳 伏見 卓恭
出版者
筑波大学
雑誌
基盤研究(B)
巻号頁・発行日
2013-04-01

リアルとサイバー複合空間を対象に,知識創造社会を支える第3の社会資本と言われるソーシャルキャピタルの形成・変容過程を解明する.我々の実生活と不可分な存在となっているツイッターから,リアル空間における生活を支援するツイート抽出・生活の局面ラベルを付与する手法を提案した.コミュニティのノード機能に着目することで,構造的特性と意味的特性を表す中心性指標も提案した.急速に拡大しているテキストコミュニケーションにおける話者の役割や親密さを推定する手法を提案した.また,テキスト投稿時の意図推定や意見分析に有効な特徴量の考察,変化変容を扱うための系列データを対象とする機械学習手法の考案にも取り組んだ.
著者
若林 啓 竹内 誉羽 平松 淳 中野 幹生
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.1N3J903, 2019 (Released:2019-06-01)

本論文では,音声言語理解の代表的な形式であるスロットフィリングタスクを,入力文の最適分割を求める問題として定式化するアプローチを提案する.この定式化を用いることで,系列ラベリングとして定式化して深層学習を適用する従来の手法に比べ,小さい計算資源で実行可能な言語モデルの学習に基づいた手法を導くことができる.提案手法は,モデルの学習をワンパスアルゴリズムによって高速に行い,最も確率の高い解釈の推定を動的計画法を用いて効率的に行う.実験により,提案手法は深層学習手法と同等の推定精度を達成しつつ,高速かつ省メモリに動作することを確認する.
著者
若林 啓
出版者
筑波大学
雑誌
研究活動スタート支援
巻号頁・発行日
2012-08-31

構文解析は,言語などの系列データから「自然なまとまり」を抽出し構造化する系列解析技術である.従来の構文解析モデルは,対象の系列が長くなると極端に計算時間が増加する問題があり,ビッグデータへの適用は困難であった.本研究では,従来の構文解析モデルを階層的確率オートマトンと呼ばれる,系列長に対して線形な計算時間で解析可能なモデルに等価変換する手法を確立した.この変換によって長い系列の近似構文解析を高速に実行できることを示し,文章の名詞句抽出やフレーズ抽出の応用において高速かつ効果的な解析を実現する手法を確立した.
著者
野沢 健人 若林 啓
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.88-95, 2015-11-17

グラフ構造におけるコミュニティ発見手法は,ソーシャルメディアや共著関係,商品の購買データなどから機能的・構造的にまとまりをもったノード群を抽出し分析することを可能にする重要な技術である.特に近年では,非常に大規模なグラフを解析する機会が多くなってきているため,グラフの規模に対してスケーラブルなコミュニティ発見手法が求められている.本研究では,あるノードから距離 1 以下のノードの集合を文書とみなしてトピックモデルを学習し,トピックごとのノードの予測分布を用いてコミュニティ発見を行う手法について論じた上で,トピックモデルの学習に確率的変分ベイズ法を適用することで,データの規模に対して高いスケーラビリティをもつ重複コミュニティ発見手法を提案する.実験により,提案手法は 6000 万ノード,18 億エッジからなる大規模ネットワークに対しても,既存手法と比較して高速なコミュニティ抽出を実現できることを示す.
著者
若林 啓
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.2, pp.61-69, 2014-06-30

チャンキングは,単語の系列から名詞句や前置詞句といった浅い統語構造を抽出する技術であり,固有表現抽出や機械翻訳などで重要な前処理であると考えられている.これまでに提案されている多くのチャンキング手法は教師あり学習に基づいており,教師データに現れない文章表現を多く含むWeb上の文書には適用が難しい.本研究では,依存構造解析モデルの平坦近似に基づいた平坦近似依存文法モデル(FADG)を用いることで,チャンク間の局所的な統語構造を考慮した教師なしチャンキング手法を提案する.FADGは線形鎖モデルを階層的に接続した階層型隠れマルコフモデル(HHMM)の枠組みで形式化するため,HHMMの効率的な教師なし学習アルゴリズムを適用できる.実験により,提案モデルが局所的な統語構造を効果的に推定し,これによって高い精度で教師なしチャンキングを行えることを示す.Chunking is a natural language processing task to extract shallow syntactic structures like noun phrases or prepositional phrase, and it plays an important role in various applications such as named entity extraction and machine translation. Most chunking algorithms proposed so far are based on supervised learning, but they depend on the domain of supervision documents that often consist of news articles and are not effective for analyzing Web documents or microblogs. In this paper, we propose an unsupervised chunking method based on the Flat Approximated Dependency Grammar model (FADG) to capture local syntactic dependency structures between chunks. The FADG is formalized as a Hierarchical Hidden Markov Model (HHMM) and we can conduct the unsupervised learning of FADG efficiently by using a sophisticated inference algorithm for HHMMs. The experimental results show the effectiveness of the proposed method in chunking accuracy comparison.