癌症检测算法头名_ 附代码

最近,近一万名数据科学家在数据科学方面参与开发机器学习算法,可以更精确地通过CT扫描检测癌变病变

数据科学家正在使用机器学习来解决肺癌的检测。从1月份开始,世界各地近1万名数据科学家在Kaggle上竞争开发最有效的算法,帮助医疗专业人员更早地准确地检测肺癌。

2010年,国家肺癌筛查试验显示,使用低剂量计算机断层扫描(CT)进行年度筛查,让计算机处理X光篇产生高对比度3D图像,可以减少肺部癌症死亡人数达20%。然而早期检测与更传统的X光片相比,该技术也导致了相对较高的误报率。

来自NCI的匿名高分辨率肺扫描

机器学习公司Kaggle的首席执行官Anthony Goldbloom说:“这是一个非常强大的方法,可以将癌症死亡率降低20%,但是误报率非常高。”

所以对于今年的数据科学竞赛,Kaggle与合作方Booz Allen 决定引导数据科学和机器学习的能量来解决误报问题。合作方获得了由劳拉和约翰·阿诺德基金会资助的100万美元的奖金,分为前十名参赛选手。

数据科学为社会做好事

Booz Allen高级副总裁兼首席数据科学家Josh Sullivan说,Booz Allen和Kaggle在2015年创建了数据科学竞赛,努力将数据科学家重点放在社会上。

他说:“我们想创造出一些让人们聚集在一起为社会做出贡献的东西。”

我们如何为社会福利做一些实质的事情?我们希望它能够让科学进步,对公众开放,虽然不利于我们的利益或客户的利益,但开源会让更多人受益。

Sullivan说,为了第三届年度数据科学竞赛(以前的数据科学竞赛专注于确定海洋健康和检测心脏病的算法),提交了300多个方案。最终他决定帮助美国国家癌症研究所(NCI)与拜登癌症月刊商讨,努力加速癌症研究,为更多的患者提供更多的治疗方案,并改善癌症预防和早期检测。

NCI为数据科学竞赛提供了2000个匿名的高分辨率CT扫描,每个图像包含千兆字节的数据。Sullivan说,1500个图像是训练集,伴随着最终的诊断。剩下的500张图像是问题集。使用训练集,竞争对手的机器学习算法必须学会如何正确地确定其余500幅图像中肺部病变是否癌变。根据正确诊断的百分比对算法进行评分。

数据已在Kaggle平台上传。谷歌在3月份收购的Kaggle由Goldbloom于2010年成立,专门负责预测建模和分析竞赛。公司和研究人员发布数据,使数据科学家能够竞争生产最好的模型。该公司拥有成千上万的跨越近200个国家的注册用户。

在这场比赛中,Kagglers是卷积神经网络(CNN)的专家,这是一种由生物体内视觉机制启发的深层学习神经网络。虽然CNN对许多不同类型的问题很有用,但CNN擅长计算机视觉问题。在以前的Kaggle比赛中,Kagglers竞争创建基于CNN的算法,可以在社交媒体上区分狗和猫的图片。

Goldbloom说:“这个数据很新奇,NCI提供的CT图像“。它真的把卷积神经网络推向了前所未有的高度,因为数据集的大小,医疗数据集总面临挑战,互联网上有多少猫和狗的图像呢?图像收集都非常昂贵,CT扫描数据更少。

而Goldbloom解释说,CNNs很容易出现称为“过度拟合”的效应,统计模型倾向于描述噪声而不是基本关系,因为相对于观测次数参数太多。

Goldbloom说:“构建不过分的卷积神经网络是困难的,数据集越小越难。“这真的是技术活,它必须在相对较少量的图像上进行泛化。”

近10,000名Kagglers参加了数据科学碗。他们总共花了15万多小时,提交了近18,000个算法。许多放射科医师在Kaggle的论坛上自愿提供专业知识,帮助竞争对手完善工作。

数据科学碗获胜者

最终,中国清华大学的两位研究人员廖方舟和李哲获得第一名。荷兰的软件和机器学习工程师Julian de Wit和Daniel Hammack取得了第二名。由位于荷兰的公司工作的成员组成的团队Aidence占据了第三名。

Sullivan说:“NIH [美国国立卫生研究院] 将最终与FDA [美国] 食品和药物管理局合作,并希望能够管理这些数据,以便他们可以进入实际阅读这些CT扫描的软件。这是我们试图推动的最大回报。”

他指出,他希望NIH和FDA能够查看一些顶级算法。顶级队伍的得分相差不到百分之几,有的可能会带来更多的技术可能性。

Kaggle竞赛地址:

https://www.kaggle.com/c/data-science-bowl-2017

第一名团队代码:

https://github.com/lfz/DSB2017

Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: the LUNA16 challenge

https://arxiv.org/abs/1612.08012

时间: 2024-10-12 16:13:24

癌症检测算法头名_ 附代码的相关文章

音频自动增益 与 静音检测 算法 附完整C代码

前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. 不过在项目实测的时候,其实真的很难定标准, 到底在什么样的环境下,要增大音量,还是降低. 在通讯行业一般的做法就是采用静音检测, 一旦检测为静音或者噪音,则不做处理,反之通过一定的策略进行处理. 这里就涉及到两个算法,一个是静音检测,一个是音频增益. 增益其实没什么好说的,类似于数据归一化拉伸的做法. 静音检

音频自动增益 与 静音检测 算法 附完整C代码【转】

转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. 不过在项目实测的时候,其实真的很难定标准, 到底在什么样的环境下,要增大音量,还是降低. 在通讯行业一般的做法就是采用静音检测, 一旦检测为静音或者噪音,则不做处理,反之通过一定的策略进行处理. 这里就涉及到

车道线检测文献解读系列(一) 基于机器视觉的高速车道标志线检测算法的研究_李晗

作者背景 基于机器视觉的高速车道标志线检测算法的研究_李晗 东北大学车辆工程硕士学位论文 2006年 [GB/T 7714]李晗. 基于机器视觉的高速车道标志线检测算法的研究[D]. 东北大学, 2006. DOI:10.7666/d.y852642.` 论文结构一览 预处理 灰度化 [亮点]模式判别 选择日间模式还是夜间模式: 在每个检测周期开始时,首先判断采用日间模式还是夜间模式工作.摄像机视野中的上半部分为天空背景,天空亮度可以显著区分日间和夜间环境.由于天空的颜色为蓝离,日间天空的蓝色分

【代码相似论文笔记】基于序列聚类的相似代码检测算法

摘要: 为了提高源程序代码之间相似性的检测效率,提出一种基于序列聚类的相似代码检测算法. 算法首先把源代码按照其自身的结构进行分段提取,然后对各个分段进行部分代码变换,再以带权重的编辑距离为相似度量标准对这些符号进行序列聚类,得到相似的程序代码片段,以达到对源程序进行相似功能检测的目的. 应用: 可以通过检测源程序中的相似代码对源程序进行简化,也可以查找出多个程序之间的相似功能,还能用于抄袭检测. 步骤: 1.提取出源代码中的功能段 2.以带权重的编辑距离为相似度量标准 3.通过聚类源程序代码序

SSE图像算法优化系列十:简单的一个肤色检测算法的SSE优化。

在很多场合需要高效率的肤色检测代码,本人常用的一个C++版本的代码如下所示: void IM_GetRoughSkinRegion(unsigned char *Src, unsigned char *Skin, int Width, int Height, int Stride) { for (int Y = 0; Y < Height; Y++) { unsigned char *LinePS = Src + Y * Stride; // 源图的第Y行像素的首地址 unsigned char

球体的双目视觉定位(matlab,附代码)

球体的双目视觉定位(matlab,附代码) 标签(空格分隔): 机器视觉 引言 双目视觉定位是我们的一个课程设计,最近刚做完,拿出来与大家分享一下,实验的目的是在拍摄的照片中识别球体,并求出该球体到相机的实际距离吗,我们要求需要用matlab,但是matlab调用双目摄像头(一个USB口)却老是只能调用双目摄像头中的一个,但是利用Python的OpenCV库却可以同时调用两个,因此我们选用了Python用于拍摄图片. 1.基本流程 备注:因为根据得出的视差图识别出圆球略困难,我们没有采用视差图深

深度学习 目标检测算法 SSD 论文简介

深度学习 目标检测算法 SSD 论文简介 一.论文简介: ECCV-2016 Paper:https://arxiv.org/pdf/1512.02325v5.pdf  Slides:http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf 二.代码训练测试: https://github.com/weiliu89/caffe/tree/ssd  一.论文算法大致流程: 1.类似"anchor"机制: 如上所示:在 featur

时空上下文视觉跟踪(STC)算法的解读与代码复现(转)

本文转载自zouxy09博客,原文地址为http://blog.csdn.net/zouxy09/article/details/16889905:在此,仅当笔记mark一下及给大家分享一下. 时空上下文视觉跟踪(STC)算法的解读与代码复现 [email protected] http://blog.csdn.net/zouxy09 本博文主要是关注一篇视觉跟踪的论文.这篇论文是Kaihua Zhang等人今年投稿到一个会议的文章,因为会议还没有出结果,所以作者还没有发布他的Matlab源代码

3D空间中射线与轴向包围盒AABB的交叉检测算法

引言 在上一节中,我讲述了如何实现射线与三角形的交叉检测算法.但是,我们应该知道,在游戏开发中,一个模型有很多的三角形构成,如果要对所有的物体,所有的三角形进行这种检测,就算现在的计算机运算能力,也是无法高效的完成.所以,我们需要通过其他的手段来提早剔除一些不可能发生交叉的物体,这种早退的思想,大量的运用在3D游戏技术中.在本篇文章中,我将像大家讲述如何实现射线与轴向包围盒AABB的交叉检测.如果读者不明白什么是轴向包围盒,请看这篇文章. Ray-AABB交叉检测算法 现如今,有很多的Ray-A