- 著者
-
角田 雅照
大杉 直樹
門田暁人
松本 健一
佐藤慎一
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.46, no.5, pp.1155-1164, 2005-05-15
- 被引用文献数
-
12
ソフトウェア開発における工数予測を目的として,過去のソフトウェア開発プロジェクトにおいて記録された多種類のソフトウェアメトリクス値を入力データとし,協調フィルタリングにより予測工数を求める方法を提案する.協調フィルタリングは,未計測の値(欠損値)が大量に含まれているデータを入力とした場合でも予測が行えるという特長があるが,ソフトウェア工数予測に適用する方法はこれまで提案されていない.提案方法では,まず,入力となるメトリクス値を正規化し,値域を揃える.次に,正規化したメトリクス値を用いて,予測対象(開発中)のプロジェクトと,過去に行われたプロジェクトとの類似度を計算する.最後に,類似度の高い(予測対象プロジェクトと類似した)プロジェクトの工数を類似度で加重平均した値を,予測対象プロジェクトの工数とする.ケーススタディとして,株式会社NTTデータにおいて1 081件のソフトウェアプロジェクトから計測された14種類のメトリクス(約60%の欠損値を含む)を用いて試験工数を予測した.その結果,提案方法は従来方法(欠損値処理法を用いたステップワイズ重回帰分析)よりも高い精度を示し,予測試験工数の相対誤差の平均値(1プロジェクトあたり)が22.11から0.79に改善された.To predict software development effort, this paper proposes an effort prediction method based on the Collaborative Filtering (CF) which uses as input various software metrics recorded in past software development projects. The CF has an advantage that it can conduct a prediction using "defective" input data containing a large amount of missing values. There are, however, no researches which propose a method for applying the CF to Software effort prediction. Our proposal consists of three steps. In the first step, we normalize values of metrics to equalize their value range. In the next step, we compute the similarity between target (current) project and past (completed) project using normalized values. In the last step, we estimate the effort of target project by computing the weighted sum of efforts of high-similarity projects (that are similar to the target project) using the similarity of each project as a weight. In a case study to evaluate our method, we predicted the test process effort using 1,081 software projects including 14 metrics whose missing value rate is 60%, which have been recorded at NTT DATA Corporation. As a result, the accuracy of our method showed better performance than conventional methods (stepwise multiple regression models); and, the average accuracy per project was improved from 22.11 to 0.79.