- 著者
-
川口 真司
ガーグ パンカジ
松下 誠
井上 克郎
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
- 巻号頁・発行日
- vol.88, no.8, pp.1217-1225, 2005-08-01
- 被引用文献数
-
6
近年, ネットワークの発達と分散ソフトウェア開発の普及に伴い, 大規模なソフトウェアリポジトリが一般的なものとなってきている. ソフトウェアリポジトリとはソースコードやドキュメント, バグレポート等の各プロジェクトの成果物を蓄積するためのデータベースである. 通常, ソフトウェアリポジトリは膨大な数のプロジェクトを保持しているため, 例えば, 開発者が現在開発中のものと似ているプロジェクトを捜したり, 管理者が会社内で走っている全プロジェクトを俯瞰するといったことに活用できる. しかし, 保持内容が膨大なためにプロジェクト同士の関連を判定して整理するには非常な労力を必要とする. そこで, 我々はソフトウェアを自動的に分類するMUDABlueシステムを作成した. MUDABlueの特長は以下の四つである. (1)分類にはソースコードのみを使用, (2)分類先となるカテゴリー集合も自動的に決定する, (3)ソフトウェアを二つ以上のカテゴリーに分類することを許す, (4)Webインタフェースで分類結果を表示する. 本論文では既存の分類手法との比較を通じてMUDABlueシステムの有効性を議論する.