機械学習回帰アルゴリズムとサンプルサイズが機能的接続に基づく行動予測に及ぼす影響

The effect of machine learning regression algorithms and sample size on individualized behavioral prediction with functional connectivity features
Cui, Zaixu and Gong, Gaolang Neuroimage, vol.178, pp.622–637, 2018

機械学習回帰(ML)アプローチを使用した個別の行動/認知予測はますます適用されている.特定のML回帰アルゴリズムとサンプルサイズは,予測精度に重要な影響を与える2つの重要な要素である.しかし,ML回帰アルゴリズムと個別の行動/認知予測パフォーマンスのサンプルサイズの影響は包括的に評価されていない.この問題に対処するために,本研究には一般的に使用される6つのML回帰アルゴリズムを用いる.OLS回帰,LASSO回帰,リッジ回帰,エラスティックネット回帰,線形サポートベクトル回帰(LSVR),および関連性ベクトル回帰(RVR).さまざまなサンプルサイズに基づいて特定の行動/認知予測を実行した.具体的には,Human Connectome Project(HCP)の公開されている静止状態機能的MRI(rs-fMRI)データセットを使用し,特徴量として脳全体の静止状態機能的接続(rsFC)またはrsFC強度(rsFCS)を抽出した.HCPコホート全体からサブサンプリングすることにより,25のサンプルサイズ(20~700の範囲)を調査した.rsFCベースのLASSO回帰は他のアルゴリズムよりも著しく劣っており,rsFCSベースのOLS回帰は他のアルゴリズムよりも著しく劣っていた.アルゴリズムと特徴量の種類に関係なく予測精度とその安定性は,サンプルサイズの増加とともに指数関数的に増加した.用いたアルゴリズムとサンプルサイズの効果の特定のパターンは,fMRIデータの再テスト,さまざまなイメージング前処理スキームで処理されたデータ,さまざまな行動/認知スコアを使用した予測でよく再現されたため,効果の優れた堅牢性/一般化を示している.現在の調査結果は,選択されたML回帰アルゴリズムとサンプルサイズが行動/認知の個別の予測にどのように影響するかについての重要な洞察を提供し,関連する調査でML回帰アルゴリズムまたはサンプルサイズを選択するための重要なガイダンスを提供する.