- 著者
-
大澤 昇平
- 出版者
- 東京大学
- 雑誌
- 特別研究員奨励費
- 巻号頁・発行日
- 2013-04-01
■ウェブマイニングのための検索APIを利用したサンプリング手法に関する研究サンプリングはウェブマイニングにおいて重要な問題であり,アプリケーション・プログラミング・インターフェース(以下,API)を通して効率的にサンプリングする問題を扱う研究が盛んにおこなわれている.本活動ではその中でも特に検索 API に着目したサンプリング問題に焦点を当て,Wikipediaのようなオントロジを活用した辞書ベースのサンプリング手法を提案する.実験では,Facebook からデータを独自にクローリングしたデータに基づき仮想的な APIを構築し,ε-グリーディやε-ファーストなどの強化学習に基づく方策を比較する.■OSS コミュニティおよびクラウドソーシングの統合によるソフトウェア開発者の能力予測に関する研究クラウドソーシングサービスを対象に開発者の能力の推定が行われている.ソフトウェア開発プロジェクトの成功は,開発者の能力に依存するが,こうした能力を推定するのは自明な問題でない.一般に,クラウドソーシングサービスでは,能力はユーザによって評価付けされる.本活動では,オープンソースソフトウェア(OSS)コミュニティとクラウドソーシングサービスを統合することにより,ソフトウェア開発者の能力を推定することを目的とする.まず,能力の推定問題が OSS コミュニティからの素性生成の問題に帰着されることを示し,開発物に基づき開発者の能力を抽象化した値であるs-indexを提案する.具体的には,oDesk (クラウドソーシングサービス)および GitHub (OSS コミュニティ)を統合し,oDesk から得られるデータを教師データする評価値予測モデルを構築する.実験結果では,s-index を用いたモデルが nDCG の観点から用いないモデルよりも上回っていることを示す.