著者
武田 隆之 牛窓 朋義 山内 寛己 門田 暁人 松本 健一
出版者
情報処理学会
雑誌
研究報告ソフトウェア工学(SE) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.8, pp.1-8, 2010-03-11

本稿では,学生の演習課題のような小規模なソースコードを対象とした盗用の検出を目的とする.インデント,演算子などのコーディングスタイルに着目し,59 項目の特徴量として抽出し,盗用の発見に用いる.盗用関係にあるソースコード間において 59 項目の特徴量の差分を測定し,盗用関係にないソースコード間における特徴量の差分と比較したところ,28 項目の特徴量が盗用検出に有効であること,28 項目のうち 8 項目の特徴量はプログラムの内容によらず盗用検出に有効であること,8 項目のうち 3 項目の特徴量はソースコード整形ツールによるインデント整形に対して耐性を持つことが分かった.The goal of this paper is to detect software plagiarism in small-size source code like exercise assignments at school. This paper focused on coding style elements, such as indents and operators, and computed 59 quantitative measures from these elements. To evalute the usefulness of measures for plagiarism detection, we compared measures of suspected pairs (of plagiarism) and nonsuspected pairs. As a result, we found that 28 measures were effective to detect plagiarisms. Especially, 8 of 28 measures were effective for different program specifications, and 3 out of 8 measures were effective even after source code indentation tools were applied.