多重スケール特徴量統合のためのショートカットを備えた深層3 次元畳み込みエンコーダネットワークの多発 性硬化症病変セグメンテーション

Deep 3D Convolutional Encoder Networks With Shortcuts for Multiscale Feature Integration Applied to Multiple Sclerosis Lesion Segmentation
IEEE transactions on medical imaging, vol. 35, no.5, pp. 1229-1239, 2016
20171007_ttamaki

我々は,ショートカット接続を有する深層3 次元畳み込みエンコーダーネットワークに基づく新規のセグメンテーション手法を提案し,それを磁気共鳴画像における多発性硬化症(MS)病変のセグメント化に適用する.我々のモデルは,2 つの相互接続された経路,すなわち,より抽象的で高レベルの画像特徴を学習する畳み込み経路と,ボクセルレベルでの最終的なセグメンテーションを予測するデコンボリューション経路とからなるニューラルネットワークである.特徴抽出および予測経路の共同訓練は,画像タイプおよびセグメンテーションタスクの任意の所与の組み合わせに対する精度のために最適化された異なるスケールでの特徴の自動学習を可能にする.さらに,2 つの経路間のショートカット接続により,高レベルと低レベルのフィーチャを統合することができ,広範囲のサイズにわたる病変のセグメンテーションが可能となる.2 つの公的に利用可能なデータセット(MICCAI 2008 およびISBI 2015 チャレンジ)について我々の方法を評価した結果,我々の手法は,トレーニングに利用可能な比較的小規模のデータのみであってもトップランクの最先端の方法と同等に機能することが示された.さらに,本手法を,MS 臨床試験からの大量のデータセットを使って,自由に入手可能で広く使用されている5 つのMS 病変セグメンテーション法(EMS、LST-LPA、LST-LGA、Lesion-TOADS およびSLS)と比較した.その結果は我々の手法が広範囲の病変サイズにわたってこれらの他の手法より一貫して優れていることを示している.

選択的データサンプリングを用いた高速畳み込みニューラルネットワーク学習:カラー眼底画像の出血検査へ の適用

Fast convolutional neural network training using selective data sampling: Application to hemorrhage detection in color fundus images
IEEE transactions on medical imaging, vol.35, no.5, pp.1273-1284, 2016
20161130_rtamura

Convolutional Neural Networks(CNN) はコンピュータ・ビジョンの分野で最高水準の技術を推進している深層
学習のネットワークアーキテクチャで,医用画像分析において注目されている.しかしながら,CNN のトレーニン
グには時間がかかり困難である.医用画像の分析作業において,多くのトレーニング例は分類することが簡単で,
CNN の学習過程にほとんど意味がない.本稿で,我々は誤分類された陰性サンプルをトレーニング中に動的に選
択することで,医用画像分析作業のためのCNN の学習の改善と素早い収束の方法を提案する.学習サンプルは
CNN の現在の状態の分類に基づいてヒューリスティックにサンプリングされる.重みはトレーニングサンプルに
割り当てられ,有益なサンプルは次のCNN の学習ループに含まれる可能性が高い.我々は選択的サンプリング手
法を使った時と使っていない時のそれぞれのCNN の学習によって,我々の提案手法を評価し,比較した.我々は,
カラー眼底画像の出血探知に注目した.2 人の専門家の平均以上の精度となったトレーニング時間が170Epoch か
ら60Epoch に減少し,2 つのデータセットで受信者動作特性(ROC) 曲線の面積が0.894 と0.972 となった.選択
的サンプリングCNN は独自試験のデータセットによって統計学的に選択的サンプリングなしのCNN よりも性能
が高かった.

畳み込みニューラルネットワークを用いた MRI 画像における脳腫瘍分割

Brain Tumor Segmentation Using Convolutional Neural Networks in MRI Images
IEEE transactions on medical imaging, vol.35, no.5, pp.1240-1251, 2016
20161103_rtamura

脳腫瘍において,神経膠腫は最も一般的で侵攻性が高く,最高レベルの悪性度では余命が非常に短くなる.した がって,治療計画は腫瘍患者の QOL(生活の質)を向上させるための主要段階である.核磁気共鳴画像法(MRI) は,これらの腫瘍を診察するための撮像方法として広く利用されている.しかし,MRI によって撮像される大量 のデータは適切な時間内で手動分割を妨げる.その結果,臨床診療では正確な定量的測定を制限する.そのため, 自動で且つ信頼性のある分割方法が必要とされている.しかしながら,脳腫瘍間の大きな空間と構造的変異は分 割の自動化を困難にさせる.本稿で,我々は 3×3 の小さいカーネルを調査し,Convolutional Neural Network (CNN)に基づいた自動分割手法を提案する.小さいカーネルの使用は,重みの少ないネットワークを構成し,オー バーフィッティングに対する有効な効果がある他に,より深いアーキテクチャを設計することを可能にする.我々 は前処理として明暗度の正規化を用いることも調査した.その正規化は CNN を基にした分割手法では一般的では ないが,データの増加とともに MRI 画像の脳腫瘍分割において非常に有効であることが証明されているためであ る.我々の提案手法は,Dice Similarity Coefficient の測定基準であるコンプリート,コア,エンハンシングの部分 (0.88, 0.83, 0.77)で同時に 1 位を得たことで,脳腫瘍分割チャレンジ 2013(BRATS 2013)のデータベースで正 当性が立証された.また,オンラインの評価プラットフォームによって総合 1 位となった.我々は BRATS2015 の チャレンジにも同じモデルを用いて参加し,Dice Similarity Coefficient の測定基準で同じ部分で 0.78, 0.65, 0.75 で第 2 位となった.

Deep Convolutional Generative Adversarial Networks を用いた教師なし表現学習

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
arXiv preprint arXiv:1511.06434, 2015
20160116_rtamura

近年,Convolutional Neural Networks(CNNs)による教師あり学習は,コンピュータビジョンのアプリケーショ ンで大きな注目を浴びた.それと比較して,CNNsによる教師なし学習は,あまり注目を浴びなかった.本研究で, 我々は教師あり学習と教師なし学習の CNNs の成果の間のギャップを埋めることの手助けになることを望む.我々 は,CNNs の一種である deep convolutional generative adversarial networks(DCGANs) を紹介する.DCGANs は特定の構造的制約を持つ.そして,DCGANs は強力な教師なし学習の候補であることを示す.さまざまな画像 のデータセットでトレーニングすることで,我々は,深層畳み込み敵対ペア (生成器と識別器) は,生成器と識別 器の両方で物体のパーツから場面まで表現の階層を学習するという納得のいく証拠を示す.また,我々は一般的な 画像表現として適用性を示すために,新しいタスクで学習された特徴量を使用した.

畳み込みニューラルネットワークを用いた大規模ビデオ分類

Large-scaleVideoClassi cationwithConvolutionalNeuralNetworks
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014, pp1725{1732

20150902_rtamura

畳み込みニューラルネットワーク(CNNs)は画像認識問題のための強力なモデルの一種として確立されている.我々は,今回の結果から,487クラスに属している100万本のYouTubeの動画の新しいデータセットを用いた,大規模な動画の分類を行うCNNsの広範囲な経験的評価を提供する.我々は,CNNの時間領域での結合を拡張するために,ローカルの時間情報を利用したり,トレーニングの速度を上げる有望な方法として小さな穴のある構造の多重解像度を提案するなど複数のアプローチを研究している.我々の最良な時間ネットワークは高い特徴ベースのベースライン(55.3%63.9%)と比較すると大幅な性能改善を示すが,1フレームモデルとの比較では驚くほどささいな改善になった(59.3%60.9%).我々はさらに,UCF-101の行動識別データセットで,表層の再トレーニングによって得られた最良のモデルの汎化性能を調査し,そして,UCF-101のベースラインのモデルと比較し,大幅な性能改善が見られた(43.9%から63.3%の上昇).

3 次元物体の分類のための再帰的畳み込み深層学習

Convolutional-Recursive Deep Learning for 3D Object Classification

Advances in Neural Information Processing Systems, 2012, pp665-673

20150718_rtamura

最近の3次元検出技術の進歩は,物体の認識を向上させることができるカラーの3次元画像を簡単に記録することを可能にする.現在の主な手法は,新しい3次元の様式に整えるために,非常にうまく設計された特徴を使用している.我々は,RGB-Dの画像の特徴を学習し,分類するためのConvolutionalNeuralNetwork(CNN)とRecursiveNeuralNetwork(RNN)を組み合わせたものを基にしたモデルを提案する.CNN層は,複数の入力として与えられる翻訳的な低次元の不変な特徴量を学習し,固定された木構造のRNNは,より高次元な特徴量を組み立てるための学習を行う.RNNは畳み込みとプーリングを一つの効率的で階層的な操作としてみなすことができる.我々の主な結果は,ランダム重みであっても優良な特徴量を組み立てる.2層CNNに相当するようなアーキテクチャよりも,我々のモデルのほうが標準的なRGB-D物体画像データセットにおいて,トレーニング,テストともにより正確で素早い学習性能を持っている.

人間の行動認知のための3 次元畳み込みニューラルネットワーク

3D Convolutional Neural Networks for Human Action Recognition
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 35, no. 1, 2013, pp221-231

我々は,監視カメラに映るヒトの行動を自動的に認識することを考える.現在の主な手法は,複雑な計算手法でローデータから計算された特徴量を基にした分類器を作成する.畳み込みニューラルネットワーク(CNNs)は,ローデータを直接分類することができる深層モデルの一種である.しかしながら,CNNsは現在2次元の入力を処理することに限定されている.本稿では,行動認識のための新しい3次元の畳み込みニューラルネットワークを提案する.このモデルは,3次元の畳み込みを実行することで,空間的な次元と時間的な次元の両方から特徴を抽出する.そうすることで,複数の隣接するフレームに符号化された動きの情報を捉える.提案されたモデルは,入力フレームから情報の複数のチャンネルを生成し,最後の特徴表現は全チャンネルからの情報を結合する.我々は,実世界の環境である空港の監視カメラに映ったヒトの行動を認識するために,提案されたモデルを使用し,このモデルが従来の基本的な手法と比較して,優れた成績を得る.