特徴選択のための進化的計算手法の調査

A Survey on Evolutionary Computation Approaches to Feature Selection
IEEE Transactions on Evolutionary Computation, Vol.20, No.4, pp.606-626, 2016
20170424harada

特徴選択は,データの次元を減らし,分類アルゴリズムといったアルゴリズムの性能を向上させるために,データマイニングおよび機械学習において重要な課題である.
しかし,特徴選択は主に探索空間が膨大なために困難な課題である.
特徴選択問題を解決するために,様々な方法が適用されている.
そのうち近年では,進化的計算技術が注目され,成功を収めている.
しかし,代替手法の長所と短所に関する包括的なガイドラインは存在しない.
これは分離・断片化された分野に対して,最終的に性能を改善しアプリケーションの成功させる機会の損失につながる.
本稿では,特徴選択のための進化的計算技術に関する最先端の内容について包括的に述べ,様々なアルゴリズムの貢献を特定する.

パレート最適決定木の開発への多目的遺伝的プログラミング手法

Decision Support Systems Volume 43, Issue 3, April 2007, Pages 809-826

A multi-objective genetic programming approach to
developing Pareto optimal decision trees

classi cation 問題はデータ・マイニングで頻出する問題である.デシジョン・ツリー技術は分類モデルを作る
ために広く使用されてきた.モデルは非常によく人間がおこなう推論に似ており,理解するのが簡単である.異
なるタイプの分類エラーが等価ではないことを意味して,多くの現実世界の分類問題がそのコストに敏感である.
異なるデシジョン・ツリーが異なるコスト・セッティングの下で卓越する場合があるので,異なるタイプの誤った
分類エラーのコストが正確に決定されない場合,1 セットの支配されていないデシジョン・ツリーは開発されてい
るべきであり,考察のための意思決定者に提示されるべきである.本論文では,そのような代替パレート最適決
定木の開発への多目的遺伝的プログラミング手法を提案する.さらにそれは,意思決定者が偽陰性対偽陽性
や感度対特異性のような矛盾する目的上の部分的な優先権を指定することを可能にする.糖尿病予測問題および
クレジットカード・アプリケーション承認問題は,提案されたアプローチのアプリケーションを説明するために
使用される.

pdf