澳门银河主页,AI医疗场景化业务:如何用AI技术做食管癌识别和辅助诊断?

2020-01-11 13:05:05  

澳门银河主页,AI医疗场景化业务:如何用AI技术做食管癌识别和辅助诊断?

澳门银河主页,ai运用于医疗,通过机器学习的特点,可以辅助诊断。笔者分享了运用ai技术做食道癌识别和辅助诊断的经历,阐释了各阶段的难点。

影辅助诊断主要做两件事情:

今天我们来分析如何用ai技术做食道癌识别和辅助诊断。

食道癌是世界五大恶性肿瘤之一,我国又是食道癌的高发地区。这个项目的目标是通过影像判别病人是否可能患有癌症。

项目的整体流程如下:

整个流程大致可以分为这样三个阶段,接下来我会简单介绍每个阶段的难点。

通常的图像分类任务动辄几十万、上百万,甚至上千万的数据量相比,医疗影像它的数据量是非常少的。同时,由于设备参数、医生的拍照手法或拍摄角度、光照的明暗不同,食管的表观变化非常复杂。

那么,我们怎样才能在这样的条件下得到一个可靠稳定的模型?

采用feature map。feature map是卷积核卷出来的,你用各种情况下的卷积核去乘以原图,会得到各种各样的feature map。你可以理解为你从多个角度去分析图片。而不同的特征提取(核)会提取不同的feature,模型想要达成的目的是解一个最优化,来找到能解释现象的最佳的一组卷积核。

在同一层,我们希望得到对于一张图片多种角度的描述,具体来讲就是用多种不同的卷积核对图像进行卷,得到不同核(这里的核可以理解为描述)上的响应,作为图像的特征。

他们的联系在于形成图像在同一层次不同基上的描述。下层的核主要是一些简单的边缘检测器(也可以理解为生理学上的simple cell)。

在拿到食管数据之后,如何判别这个食管属于健康正常食管还是病变食管呢?

这个问题跟前面的问题比较类似,也是一个判别模型。

它们的不同之处在哪呢?

当我们判断一个食管是否异常食管时,只需要找到一个病变区域,就能够说明这个食管是异常的。

但是反过来,在正常图像中,并不能说找到一个正常特征,就说明这个食管是正常的。只能说在这张图像中我们没有找到异常特征,它可能是见正常的。

因此,在正常特征和异常特征之间,我们更倾向于提取病变特征,抑制正常特征。

我们是怎么做到呢?

病变和正常的case都会经过神经网络,以得到特征向量。对于这个向量,我们希望尽可能凸显异常特征,让正常特征趋近于0。

我们是如何把这种信息建模到模型中的呢?

我们对模型进行了重新建模,最后准确率大概在97%左右。

前面的模型相对来说比较简单,第三个模型主要是区分炎症和癌症,它与前两个问题不大一样。

一般情况下,病变的食管图像里都会伴随着一些炎症的特征。

我们对癌症的判断往往是通过一个纹理特别小的区域得出的,因此需要提取出更加精细化的特征。比较好的做法就是让很多专家把病灶区非常严谨地标注出来,这样我们只需要对这个区域进行识别就好了。

这个标注量非常大,因此数据异常匮乏。我们没有癌症区域的标注数据,但又希望得到非常精细化的特征,如何解决这个矛盾呢?

幸运的是,我们虽然无法获取到非常精准的病变区域标注影像,却能够相对容易地知道一张图像是否包含癌症,因为只需要跟病例对应关联起来就好了。这样一来,我们可以更容易地得到图像全局的标签。

如果一张图像包含了癌症,必然会有一个或几个区域包含了癌症的特征。也就是说,如果我们把图像切分成几个patch,必然会有某个或某几个patch包含癌症特征。基于这样一种思路,我们采取了多序列的学习方式。这个方法的内在思想很简单,就是把图像切分成若干个patch,然后对每个patch建模,判别这个patch发生癌症的概率。

我们最后把所有patch里面癌症概率最高的那块,作为图像是否包含癌症的标签。

做的过程当中,我们会逐渐积累精准标注的数据,这些数据非常少,不足以虚拟一个模型。但图像中的特征都是最精准的,是经过人为校验和标注的。

我们怎样才能把这种少量的、精准的数据强化到癌症识别中去呢?

这是个非常有意思的问题,如果能解决这个问题,即使只有少量标准数据,我们也能不断提升。

这里主要采用了多任务学习的方法,这个方法需要完成两个任务:

这两个模型共享特征提取网络,特征提取网络必须同时满足两大任务,这样才能把精准标注的特征强化到癌症识别中去。

以上是我们食道癌项目的简单介绍,下面再简单介绍一下我们在辅助诊断方面做的一些工作。

我们希望机器最终能够像临床医生一样具备诊断疾病的能力。

在介绍辅助诊断项目之前,我们先来看看一个医生或者一个普通的学生是如何成长为一名专家的:一个学生从刚入学开始,学习了大量专业课程,阅读了大量专业医学文献后,就可以积累一定程度的医学知识。

当医学知识达到一定程度之后,就可以去医院里面实习,由临床医生结合一些真实案例,指导他去学习诊断的技能。

当我们具备了这些技能,就能够成为一名普通的医生,医生可以看到大量的病人,学习大量经验,经验足够丰富之后就成了专家。

机器成长的过程与人类大致相似。

我们可以将其分为三个阶段:

医疗知识图谱的构建过程中,我们首先要对文本数据进行处理。文本数据分成两类,一类是半结构化数据,一类是非结构化数据。

这里我列举一个例子,说明我们如何把非结构化的文本变成结构化文本,也就是计算机可以理解的形式。

我们可以把病史分为几个部分:疾病的情况、入院的治疗经过、入院的依据等;把病史分为这样几部分信息后,再对每一类信息进行细化和提取;经过提取之后,非结构化的文本就变成了计算机能够理解的结构化文本;我们会把这些信息转化为医学知识图谱存在电脑里,于是计算机就把这个知识学会了。

以上就是医学知识图谱的构建过程。

第二步我们会有一个诊断模型。

诊断的过程是这样的,首先把一段人类语言描述的病情转化成计算机可以理解的结构化知识。有了结构化的知识以后,机器就能理解这个人的情况,把知识推送到疾病诊断模型当中,模型将给出一个疾病列表,诊断模型的流程大致就是这样。

下面我们来看一个病情理解的实例。

通过技术对病人病情的理解可以得到一些基本信息,其中包含性别、年龄,这个人的主动描述、现病史和既往史等。

主动描述里会提到症状以及持续的时间,甚至一些更复杂的信息,比如说唾沫是什么样子的,咳嗽是否带痰。这些信息都会详细刻画出来,按照前面提到的模式画出病历,完成对病情的理解。

理解病情以后,将其输入诊断模型当中。

诊断的demo包含几个部分:对病情的人类语言的描述,通过病情理解后得到结构化的病情表示,之后得出机器诊断的结果,按照概率从高到低给出5个结果。

我们还给医生留了一个接口,医生可以对诊断结果评分,通过评分将结果反馈到模型当中。

通过医生和机器之间的交互,可以将模型迭代得越来越好。

我们在实验室数据里选择了大概10万个真实病例进行测试,top1的结果与医生的一致率大概是92%,top3是90%,但这种模型还需要更多临床病例做验证。

本文由 @pms-rolia 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 unsplash,基于 cc0 协议

随机推荐
  • 弹劾案对于美国2020年大选影响有多大?专家回应

    当地时间12月18日,美国国会众议院通过了针对总统特朗普的两项弹劾条款,正式以“滥用职权”“妨碍国会调查”两项罪名弹劾特朗普。3名民主党人反对弹劾、共和党全员反对当地时间12月18日晚,在经历长达10个小时的激烈辩论后,由民主党控制的众议院表决通过了针对特朗普的两条弹劾条款。在“滥用职权”弹劾条款中,共有230票赞成、197票反对;在“妨碍国会调查”弹劾条款中,共有229票赞成、198票反对。弹劾[详情]

    发布时间:2020-01-03 13:33:37
  • 共计揽金超11亿,出让面积近28万方!启东市6宗地块同日成交

    来源:凤凰网房产12月23日上午,启东市6宗地块成功出让,共计揽金约11.19亿元,出让面积约27.94万方。上海汇衍置业有限公司3.09亿元底价竞得,成交单价4500元/㎡,楼面价2616元/㎡。1951地块1951地块位于启东市沿江公路南侧,土地面积62926㎡,1.0≤容积率≤1.5,规划为科研用地,产权年限50年。[详情]

    发布时间:2020-01-02 11:18:51
  • 软银6亿美元投资被拒,引7家资本争相入局,ACU究竟花落谁家?

    2019年11月初,有媒体爆出日本软银欲向亚元acu的主体公司亚洲数字货币有限公司注资超6亿美元,以此换取该公司60%的股份,但随后就被亚洲数字货币有限公司拒绝。软银被拒后表示,不排除进一步提高注资额度进行第二次磋商的可能。但据有关人士透露的消息,亚元acu的发行范围似乎并不包括日本。在日本软银谈判失败后,据了解有多达7家投资机构蜂拥而上,想要在亚元acu的发行过程中分一杯羹。投资者据此操作,风险[详情]

    发布时间:2020-01-07 08:56:17
  • 俄驻日大使发声:日本应承认二战结果

    在18日的讲话中,加鲁京说,为建设一个能决定双方都可接受的解决方案的环境,两国需进行长期且细致的工作,“我们认为日本方面需承认第二次世界大战的结果,包括俄罗斯对南千岛群岛四个岛屿主权的合法性”。关于日俄领土争端,日本首相安倍晋三曾多次表示要尽快解决,不将问题留给下一代。[详情]

    发布时间:2019-12-30 18:38:23
  • 中超首轮积分榜综述:八姐妹有喜有忧,国安鲁能或重回争冠集团!

    中超联赛首轮战罢,各支球队有喜有忧,被球迷称为中超八姐妹的山东鲁能、北京国安、上海上港、广州恒大、天津权健、上海申花、江苏苏宁和河北华夏轮番登场,为了各自的目标捉对厮杀,可以说中超首轮精彩纷呈,为球迷带来了一道周末盛宴。[详情]

    发布时间:2020-01-03 18:56:19
  • Stan Scott:英国大学高等工程教育改革的最新探索

    由中国高等教育学会主办的中国高等教育博览会在南京国际博览中心盛大开幕,第四届中国高等工程教育研讨会作为本届博览会的主旨论坛同期举办。英国贝尔法斯特女王大学国际合作学院院长、工程教育专家 stan scott本届研讨会由中国高等教育学会副秘书长王小梅主持。现在,英国的工程教育有一些新的趋势和措施,通过它们可以了解到现在整个英国工程教育专业的革新和演变。[详情]

    发布时间:2020-01-10 10:50:11
  • 北京图书博览会开幕,30万种最新图书和千余场主题活动等你来看

    昨日,第26届北京国际图书博览会暨第17届北京国际图书节在中国国际展览中心(新馆)开幕。在北京国际图书节现场共展出30多万种全球最新出版的图书,将举办1000多场丰富的出版文化活动。据了解,本届图博会由国家新闻出版署、科学技术部、北京市人民政府、中国出版协会、中国作家协会主办,中国图书进出口(集团)总公司承办。展览总面积达10.68万平方米,再创历史新高。[详情]

    发布时间:2020-01-05 11:48:34
  • 江一燕把几十万的礼服穿出土味,杨幂一身黑却抢了全场女星的风头

    昨晚,在颁发最佳女演员奖的时候周迅惊喜现身,四十多岁的周公子,依旧那么精灵可爱。周迅甚至没有穿礼服,没有穿裙子,只穿了一件白色挂脖露肩上衣搭配了黑色紧身裤和黑色高跟鞋,黑白配简单大气。[详情]

    发布时间:2019-12-25 13:33:30
  • 毛主席主持起草第一部大法:数易其稿修《宪法》

    6月8日,宪法起草委员会举行第六次全体会议,将宪法草案(初稿)的修正稿又讨论了一遍,正式形成《中华人民共和国宪法草案》修正稿。6月11日,宪法起草委员会举行第七次全体会议,讨论通过宪法草案。9月20日,第一届全国人大一次会议通过中华人民共和国宪法,并由大会主席团发布公告,宪法正式生效。12月27日,毛泽东率宪法起草小组到达杭州。2月17日,起草小组提出草案初稿。[详情]

    发布时间:2019-12-31 18:09:59
  • 因“太阳花学运”被控杀人未遂 马英九首次出庭

    2014年台湾发生太阳花学运,期间有抗议者自称遭警方不当驱离,向法院起诉台湾地区前领导人马英九、前行政机构负责人长江宜桦等人涉嫌杀人未遂等罪。台北法院30日下午开庭审理,首次传唤马英九出庭。台北地方法院原本认定马英九等人并未逾越法定职权,两次驳回起诉。[详情]

    发布时间:2019-12-27 20:01:41