著者
大沢 英一 珍田 計幸
出版者
一般社団法人情報処理学会
雑誌
研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.34, pp.23-29, 2009-03-13

近年,複雑ネットワークに関する研究が盛んである. 論文の共著関係,俳優の共演関係やインターネットの端末網,線虫の神経細胞など実世界に存在する多くのネットワークがスモールワールドやスケールフリー性といった特性を持つということが知られている.WWW もその典型的な例であり,WWW のハイパーリンクのネットワークを複雑ネットワークとして捉えた研究が進んでいる.しかし,複雑ネットワークの効率性や集積性といった利点が存在することが判明してきているにも関わらず,これらの利点を実用レベルで活用するまでに至っていない.本研究では,複雑ネットワーク研究の土台とも言える社会学の知見に着目し,その知見を WWW に適用することによる情報抽出手法の提案を行なう.特に本研究においては,弱い紐帯の強みに関わる知見を利用し,WWW における弱い紐帯を手がかりにした情報抽出手法を提案する.また,WWW のハイパーリンクの構造を適度に補正することによって,構造からの抽出法に対して,精度を上げることができる.これらの抽出手法によって,従来のキーワード検索によるウェブ検索システムでは発見が困難であった有用な関連ページの抽出が可能となる.Recently, the research on a complex network is active. Most networks such as paper co-citation network, movie actor collaboration network, Cellular networks and the Internet are known as Complex Networks. It contains features such as Small World, Scale Free and Clustering. The WWW is being rapidly researched as Complex Networks, because the network of hyperlink at the WWW is the typical example of Complex Networks. By contrast, it's not being leveraged the features that is efficiency or clustering of Complex Networks. This research's proposal is the information extraction technique by knowledge of the social science; in addition, it applies the WWW. Especially, we focus attention for the weak ties, and we propose the information extraction technique on the WWW.
著者
珍田 計幸 大沢 英一
出版者
一般社団法人情報処理学会
雑誌
研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.16, pp.99-104, 2009-02-23

近年,複雑ネットワークに関する研究が盛んである.論文の共著関係,俳優の共演関係やインターネットの端末網,線虫の神経細胞など実世界に存在する多くのネットワークがスモールワールドやスケールフリー性といった特性を持つということが知られている. WWW もその典型的な例であり,WWW のハイパーリンクのネットワークを複雑ネットワークとして捉えた研究が進んでいる.しかし,複雑ネットワークの効率性や集積性といった利点が存在することが判明してきているにも関わらず,これらの利点を実用レベルで活用するまでに至っていない.本研究では,複雑ネットワーク研究の土台とも言える社会学の知見に着目し,その知見を WWW に適用することによる情報抽出手法の提案を行なう.特に本研究においては,弱い紐帯の強みに関わる知見を利用し, WWW における弱い紐帯を手がかりにした情報抽出手法を提案する.この抽出手法によって,従来のキーワード検索によるウェブ検索システムでは発見が困難であった有用な関連ページの抽出が可能となる.Recently, the research on a complex network is active. Most networks such as paper co-citation network, movie actor collaboration network, Cellular networks and the Internet are known as a Complex Networks. It contains features such as Small World, Scale Free and Clustering. The WWW is being rapidly researched as Complex Networks, because the network of hyperlink at the WWW is the typical example of Complex Networks. By contrast, it's not being leveraged the features that is efficiency or clustering of Complex Networks. This research's proposal is the information extraction technique by knowledge of the social science; in addition, it applies the WWW. Especially, we focus attention for the weak ties, and we propose the information extraction technique on the WWW.