著者
イェユンウェン 中小路久美代
雑誌
デジタルプラクティス
巻号頁・発行日
vol.2, no.2, pp.117-124, 2011-04-15

組織やグループで現在開発中の,あるいは既に開発したシステムやオープンソースといった大量のソースコードを,その組織の知財として活用が望まれてている。そのようなソースコードに特化して検索するのが,エンタープライズ検索エンジンCodeDepotである.CodeDepotは,ソースコードを構造化された自然言語の文書とみなし,プログラムの構造情報と意味情報を同時に考慮しながら,正規化処理と重複インデキシングを行なう.これにより,ウェブインタフェースを介して数億行以上の大規模ソースコードを瞬時に検索でき,現場での実用に耐えるシステムとなっている.検索クエリ文字列のバリエーションや複雑な条件検索,さらには文字列をトークンに置換することで,コードクローンと呼ばれる構造的に類似するプログラム断片を,インタラクティブに検索できる.現時点で数十のソフトウェア開発組織で,コーディング作法の学習や保守のような開発作業の様々な局面で利用されている.利用した開発者からは,システムの高速性と簡便性が高く評価されている.