文章基本信息
- 标题:工数予測における6種類の欠損値補完手法の実証的評価
- 本地全文:下载
- 作者:戸田 航史 ; 角田 雅照
- 期刊名称:コンピュータ ソフトウェア
- 印刷版ISSN:0289-6540
- 出版年度:2019
- 卷号:36
- 期号:4
- 页码:95-106
- DOI:10.11309/jssst.36.4_95
- 出版社:Japan Society for Software Science and Technology
- 摘要:ソフトウェア開発において,プロジェクトの計画立案,管理支援を目的として,機械学習を用いた開発工数の見積もりが行われている.一般に,見積もりに用いられるプロジェクトデータには欠損(未記録の値)が含まれている.機械学習手法によっては欠損が含まれたままでは予測モデルが構築できないため,見積もりに際しては先に欠損を何らかの値で補完し(欠損値補完),欠損のないデータセットを作成する事が必要となる.本研究では複数の企業で収集された1364件のデータ(欠損率34%)のプロジェクトデータに対し,6種類の欠損値補完法(k-nn法,CF応用法,Miss Forest法,多重代入法(DA, FCS, EMBの3アルゴリズム))およびデータセットに対する対数化実行の可否による計12種類の手法を適用したデータセットに対して6種類の機械学習アルゴリズムによる予測を行うことで,補完性能の比較を行った.160件の実際のプロジェクトの工数予測を行った結果,理想的な条件下であればk-nn法が最も高い精度を示すが,十分な計算コストが確保できない場合にはFCSアルゴリズムを用いた多重代入法を採用すべきであることも示された..