著者
夛田 武広 戸田 航史
雑誌
研究報告ソフトウェア工学(SE) (ISSN:21888825)
巻号頁・発行日
vol.2020-SE-204, no.11, pp.1-7, 2020-02-24

GitHub はバージョン管理システム Git のホスティングサービスとして広く使われている.ただし,GitHub はソースコードのバージョン管理以外にも,コードレビューや Issue 管理,Wiki 等のシステムも提供している.近年の GitHub のリポジトリ数,ユーザ数の増加に伴い,Git の利用を主目的としない,もしくは readme.md の更新以外には Git を利用しないプロジェクトが現れ始めている.これらのプロジェクトは GitHub を Issue 管理システムの利用やドキュメントの管理として利用することを主目的としている.本研究ではこのようなプロジェクト(Hub プロジェクト)に着目し,分析を行った.分析では Hub プロジェクトを 3 つのパターン (Issue Tracker Type,Document Type,Link Collection Type)に分類し,リポジトリ数の増加の推移や最古リポジトリ等について調査した.分析には GitHub に存在する約 1.2 億のオープンリポジトリのデータである GHTorrent を用いた.分析では,あらかじめ手動で収集した 10 の Hub プロジェクトから導出した共通点を利用し,不要なリポジトリをを除去した.分析の結果,タイプ別のリポジトリ増加推移や最古リポジトリ,そして増加のきっかけとなったリポジトリを発見できた.