医学图像分析中的深度学习调查

一、前言

深度学习算法：由许多层组成的网络，将输入数据（例如图像）转换为输出，同时学习越来越高级别的特征。
迄今为止最成功的图像分析模型是卷积神经网络（CNN）。 CNN包含很多层，可以在很小程度上利用卷积滤波器来转换它们的输入。
在计算机视觉领域，深度卷积网络现在已成为首选技术。医学影像分析界已经注意到这些关键的发展。但是，从使用手工功能的系统转换到从数据中学习功能的系统进度很慢。
在AlexNet的突破之前，许多不同的学习功能的技术很受欢迎：它们包括主成分分析，图像补丁聚类，字典方法等等。
- 第2节：介绍用于医学图像分析的主要深度学习技术；
- 第3节：描述了深度学习对医学图像分析中典型任务的影响：分类，检测，分割，配准，检索，图像生成和增强；
- 第4节：讨论了在不同应用领域获得的结果和开放挑战：神经，眼科，肺部，数字病理和细胞成像，乳房，心脏，腹部，肌肉骨骼和其他杂项应用。

随机梯度下降的最大似然是目前最常用的拟合参数的方法。
以无监督的方式（预训练）逐层训练DNN通过对堆叠网络进行有监督的微调，可以获得良好的性能。以这种方式训练的两种流行体系结构是堆叠自动编码器（SAE）和深度置信网络（DBN）。但是，这些技术相当复杂，需要大量工程才能产生令人满意的结果。
目前，最受欢迎的模型是以受监督的方式进行端对端训练，极大地简化了训练过程。最流行的体系结构是卷积神经网络（CNN）和递归神经网络（RNN）。尽管RNN越来越受欢迎，但CNN目前在（医学）图像分析中应用最广泛。
MLP与CNN的区别：
- 网络中的权重以对图像执行卷积操作的方式共享，这样，模型不需要为在图像中不同位置出现的同一对象分别检测单独的检测器，从而使网络在输入的平移方面等同。它也大大减少了需要学习的参数的数量（即权重的数量不再取决于输入图像的大小）

AlexNet或VGG等其他简单模型很受医学数据的欢迎。尽管最近的标志性研究都使用GoogleNet的一个名为Inception v3的版本
将深度学习技术应用于医疗领域的挑战往往在于将现有架构适应于不同的输入格式，例如三维数据。在CNN早期应用于这样的体积数据时，通过将感兴趣体积（VOI）分成切片并将其作为不同的流馈送到网络来规避全3D卷积和由此产生的大量参数。
分割是自然和医学图像分析中的一项常见任务，为了解决这个问题，CNN可以简单地用于分别对图像中的每个像素进行分类，方法是在特定像素周围提取补丁。

RNN是为离散序列分析而开发的。它们可以看作是MLP的泛化，因为输入和输出的长度都是不同的，这使得它们适用于诸如机器翻译这样的任务，其中源语言和目标语言的句子是输入和输出。
RBMs是一种马尔科夫随机场（MRF），它构成输入层或可见层x =（x1; x2;：：; xN），隐层h =（h1; h2;：：：; hM）携带潜在特征表示。节点之间的连接是双向的，因此给定一个输入向量x，可以获得潜在特征表示h，反之亦然。
最近，引入了两种新颖的无监督体系结构：变分自动编码器（VAE）（Kingma和Welling，2013）和生成对抗网络（GAN）（Goodfellow等，2014）。目前还没有同行评议的论文将这些方法应用于医学图像，但在自然图像中的应用是有希望的。
GPU的发展和开源软件包促进了深度学习在图像处理领域的发展。目前最流行的软件开源包有：
- **Caffe:**提供C ++和Python接口，由加州大学伯克利分校的研究生开发。
- **Tensorflow:**提供C ++和Python接口，由Google开发。
- Theano：提供python接口，由蒙特利尔MILA实验室开发。
- Torch：提供一个Lua接口。
两个重要的深度学习库：
- Lasagne：https://github.com/tqb4342/Lasagne；
- Keras：https://keras.io/。