34

Nature论文解读:深度学习助力毫秒之间识别癌细胞

 4 years ago
source link: https://www.tuicool.com/articles/yIzaEjr
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

yUR7Nrq.gif

论文动机

流式细胞仪作为一种生物医学诊断技术,可以准确测量细胞特性。当前仪器已经实现了细胞的分类识别,但由于数据处理耗时的问题,尚不能对细胞进行实时分选。

基于之前的工作, 本文作者提出采用深度学习来解决这一问题,在流式细胞仪的组成——激光信号上直接进行处理,省略了其他技术中费时的操作。 该仪器可以在几毫秒之内检测出癌细胞,比之前的方法快数百倍。用这样的速度,可以在细胞检测后立刻将癌细胞从血液中分离出去,预防癌症转移。

byqIreQ.jpg!web

YfiIfeB.png!web

技术方法

深度学习

深度学习属于机器学习,是一种采用大量数据来训练算法的人工智能。在深度学习中,神经网络算法用来模拟人的大脑工作。与其他机器学习类型相比,深度学习被证明在识别和生成图像、语音、音乐和影像上尤为有效。

论文采用基于 VGGNet 的卷积网络模型来进行细胞检测和识别。实验所采用的目标细胞为 T 淋巴杂交瘤细胞(OT-II)和人的结直肠癌细胞(SW-480),数据的准备过程以及模型架构如下图所示:

ZJ7rayY.jpg!web

包含细胞信息的数据由高速 ADC 进行采集,每个波形数据先切割成 100 个小的波形片段,各片段之间的重叠率为 50%。 通过进一步处理,使得每个片段包含完整的脉冲。接着,将这些波形片段转换为二维阵列,使得波形分析的过程类似于采用卷积网络进行图像识别。经过处理的波形片段分别是携带 SW-480 细胞、OT-II 细胞以及不携带细胞信息的空白片段。他们被随机打乱后分成三个数据子集:训练集(占比 80%),验证集(占比 10%)和测试集(10%),并且三个子集之间没有交集。每次训练只有一部分数据(batch)参与。

深度神经网络模型由 16 个卷积层组成,其步长为 1,kernal 大小为 3 × 3,生成的特征图像深度从 16 增加到 64 个输出通道。在各个卷积层之间,采用窗口大小为 2 × 2 的最大池化层来进行降采样。 最后一个卷积层的输出被平铺为一维数据后进入三个全连接层:前两个有 1024 个节点,第三个有 64 个节点。并且采用 dropout 进行正则化,以及用 Adam 优化器来更新参数。

时域拉伸

光时域拉伸技术是 UCLA 发明的超高速测量技术。它采用超短激光来实现 1Tbit / s 的数据采样速度,比目前最快的微处理器速度还要快上 1000 倍。这个技术帮助科学家们发现了激光物理中的罕见现象,发明了新型的生物医疗仪器,如 3D 显微镜,光谱仪等。

论文中,采用时域拉伸成像系统快速捕获高通量细胞的空间信息。首先通过光脉冲线性扫描目标细胞,并将细胞的特征编码到这些光脉冲的光谱中,然后让脉冲在色散光纤中拉伸,并将光谱映射到时域上,最后由光电探测器捕获这些脉冲序列并转换为数字波形后,直接通过神经网络进行分析。

结果分析

在每个 epoch 中,对训练集和验证集的性能进行评估,结果如下图所示。比较每个类别的分类性能,发现在第一个训练 epoch 结束时就可以成功识别出 SW-480 细胞和 OT-II 细胞。训练和验证的 F1 score 不断增大,在大约 60 个 epoch 处达到最大值。并且,模型的泛化性能好。

IjiYnaI.jpg!web

下图分析了分类器的输出性能,将模型用于测试集,得到的结果分别通过 ROC 曲线和 PR 曲线来呈现。从图中可以看出,该分类器无论是从灵敏度/特异性,还是精确率/召回率上来看,均表现出良好的性能,且可靠性高。

fi2A32z.jpg!web

应用:深度流式细胞仪

下图展示了深度流式细胞仪的工作机制。首先,微流体通道采用流体动力学聚焦机制,使得目标细胞对准光学相机的视场中心。然后基于时域拉伸成像的光学相机捕获高速流动的无标记的细胞信息,输出波形直接传递到已经训练好的深度神经网络,进行在线实时细胞分析,在细胞到达分选器之前给出准确的分类结果。不同类型的细胞将被赋予不同的极性电荷,使得它们被分选到不同的收集管中。

i2eAv2j.jpg!web

除了时域拉伸成像信号外,深度流式细胞仪还可以应用于其他传感器如 CMOS 或 CCD,PMTs 和光电二极管所捕获的信号。

亮点

论文所提出的深度卷积网络能够直接对流式细胞仪中输出的一维时间序列波形进行训练,自动提取数据特征,省去了图像合成和手动特征提取这些耗时的步骤,大幅缩短了细胞分析的整体用时。并且,直接对原始波形进行训练,可以挖掘出数据中更多的隐藏信息,从而获得更准确的细胞分类结果。

此外,由于采用了 NVidia 公司提供的 GPU,模型的处理时间(训练好的模型推断单个细胞样本的时间)可以进一步缩短,采用不同处理器的耗时对比如下表所示:

eyQbY3F.png!web

总结

本文提出了一种深度卷积神经网络,可以直接处理流式细胞仪的波形数据,从而快速识别细胞。 这个系统 在不到几毫秒的时间内便可实现细胞的精确分类,为实时的无标记细胞分选打开了新的途径。

nmYFBne.png!web

点击以下标题查看更多往期内容:

2a67JfY.gif # 投 稿 通 道 #

让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢? 答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是 最新论文解读 ,也可以是 学习心得技术干货 。我们的目的只有一个,让知识真正流动起来。

:memo:  来稿标准:

• 稿件确系个人 原创作品 ,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向) 

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接 

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

:mailbox_with_mail: 投稿邮箱:

• 投稿邮箱: [email protected]  

• 所有文章配图,请单独在附件中发送 

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

:mag:

现在,在 「知乎」 也能找到我们了

进入知乎首页搜索 「PaperWeekly」

点击 「关注」 订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击 「交流群」 ,小助手将把你带入 PaperWeekly 的交流群里。

IrqMBj7.gif

▽ 点击 |  阅读原文   | 下载论文


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK