微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 业界动态 > 融资1100万,他设计出人工智能与影像诊断相结合的医生界阿尔法狗

融资1100万,他设计出人工智能与影像诊断相结合的医生界阿尔法狗

文章来源:科讯医疗网发布日期:2016-06-15浏览次数:1300

          “阿尔法狗就这么下出个碾压式的3:0,开发者们也很震惊。”在芝加哥大学就读经济金融双博士的陈宽,早在2011年便在经济领域接触人工智能和深度学习。 

          “它使原本大家觉得还要几十年才能成熟的技术,成为了现实。”他感叹道,“深度学习效率的提升就像自行车变成了汽车。” 
          搭着深度学习这列快车,2015年初,陈宽成立推想科技,正式进军医疗行业创业,利用影像识别算法模型,为医生提供辅助诊断方案。 
          其原理为一部分影像数据作为测试数据,而模型学习剩余部分数据(训练数据),诊断测试数据,生成初级诊断报告,后与医生正确的诊断报告做对比,得出诊断的准确率。 
          去年9月,在肺部X光的诊断环境中,后生成诊断报告与医生的诊断报告匹配率在90%以上。“换一个测试环境,换一家医院的数据,结果可能又不一样。” 
          目前,推想科技已有的诊断模型数据源涵盖与心肺相关的超10种X光影像,如心影增大、肺部积液、肺炎等。


 

          注: 陈宽已确认文中数据真实无误,铅笔道愿与他一起为内容真实性背书。 
          脚踏两只船 
          陈宽刚参加完硅谷的一个创业比赛,台下坐着Reid Hoffman(li[x]nkedIn创始人)等科技圈大拿。第二天,他匆忙飞回芝加哥大学上课,听诺贝尔奖教授James Heckman 讲授计量经济学里的Bias Correction…… 
          彼时,正在芝加哥大学就读经济金融双博士的陈宽,经常徘徊在创业与学术之间,“觉得两个世界差得非常远”。 
          在做学术之余,他尝试寻找创业机会。“我从高中起,就陆续做过项目,赚过一些小钱。” 
          2011年,陈宽在经济领域接触到人工智能和深度学习,他感觉这些技术的应用场景可以更加广泛。“人工智能早应用在金融行业,到2013年,美国超过70%的二级市场交易都是由计算机自动完成的。” 
          他打算在美国试水。2012年,他和朋友根据Twitter上网民发布的状态数据,建立模型来预测奥巴马和罗姆尼的大选结果。“人工智能和深度学习能大程度把特定场景中的数据关联性挖掘出来。” 
          期间,美国很多媒体企业找上门来,愿意花钱购买他们的成果,把数据可视化展现在媒体平台上。 
          陈宽有些吃惊,“随便做的一个模型,没想到还能赚钱”。他决定继续在里面挖掘机会。此后,一有时间他便参加美国和国内的创业活动。 
          他常常一个人,一只包,一台MacAir,逮住机会就和别人去聊,展示模型Demo。“我觉得技术背景的人创业,大的瓶颈是不接地气。陷在小圈子里闭门造车,自己觉得产品很炫酷,推出后可能离市场十万八千里。”
深入了解后,他更倾向于国内市场。“每次放假都跑回来了解形势,觉得国内市场还没那么饱和,机会更多。”
2014年暑假结尾,在深圳的一次闭门会议上,陈宽打开电脑展示一系列算法模型,包括深度学习、人脸识别等。在场的一位放射科医生表示很感兴趣,并提议“这些技术能否做成医疗影像的辅助诊断产品?” 
          当时,陈宽没太在意。“接触的行业太多了,金融、政府、农业、安保等,一时拿不定主意要应用于哪个行业。” 
          12月底,他返回美国修完一学期的课程后,再次回国摸索方向。巧合的是,某医院负责信息部门的高层再次提出同样的需求。“两个渠道认识的人,诉求一模一样,这可能是真实存在的需求。” 
          当时,陈宽距离博士毕业还差一篇论文。回美国完成学业还是立马创业?他曾摇摆不定。 
          终,他留了下来。“把深度学习用于医疗影像诊断,既贴近市场需求,又可以持续做研究。”他笑道,“很幸运找到这样的契合点,相当于脚踏两只船。” 
          2015年年初,陈宽在深圳成立推想科技。 
          替代医生的重复劳动 
          影像诊断涉及多种病种,陈宽打算通过调研确定从何处切入。 
          和医生们打起交道,他觉得国内的放射科医生很苦,早上8点上班,忙到晚上10点还在写诊断报告。“中午和医生聊天,他们一边吃盒饭,一边看片子。” 
          一个放射科医生可能每天要写300~400份诊断报告。“如果是CT,照一次就200多张影像,要换角度来回看。” 
          医院基本依靠医生人工诊断,医生要对诊断报告签字负责。他可能到下午疲劳,注意力不集中,片子上的症状看漏了,容易产生误诊。“患者再过几个月来复查,可能就是患症晚期了。” 
          此外,医生们还要承受科研、资质考试等压力。 
          放眼整个行业,大多数医院的放射科医生资源稀缺。“深圳一家较大型社区医院,放射科医生不到十位,每天可能面对几百个病人。” 
          陈宽发现,医生们每天诊断的病症80%以上为常规病,而这些病症相通性高,诊断对于人的依赖性较弱。“其余的疑难杂症,需要医生根据经验联想来诊断。这种非正常状态的东西,再好的机器学习模型也很难模拟出来。” 
          他决定先从肺炎、肺积液等X光诊断常见病切入,用算法模型来代替医生的重复劳动。“先帮他们解决小问题,让他们有时间解决更难的问题。” 
          首先,他需要与医院合作,利用医院的影像数据验证技术的可行性。“光有模型不行,还要用海量数据去验证准确率,需要医院有较大的门诊量和足够高的诊断水平。” 
          但出师不利,他经常被医生扫地出门。“有些医院没听说过这些技术,还有医院采购了国外的辅助诊断设备,但因为准确率低,闲置一旁不使用。” 
          陈补充道,“包括IBM、R2 Technology均曾高调进入中国市场,但都不成功,很大原因是他们的数据源是基于美国人的,和中国人相差挺多的。” 
          于是,他一遍一遍给医生灌输技术理念。此外,陈宽找到其它临床科室的医生,各个击破。“医院里使用影像技术的不只放射科,相关部门我都去尝试说服。”
过          程中,偶尔碰到反馈较好的医院,陈宽就在附近找个宾馆直接住下,一大早跑去接着聊。
如此,他还是一个人,一只包,奔波半年,跑了近40家医院,终与几家医院达成合作。因双方签有保密协议,合作医院名字暂不透露。 
          90%诊断准确率 
          与医院谈判的同时,陈宽和美国的朋友不断在优化算法模型。“算法从12年起便在优化,但还需要花几个月时间针对医疗行业特点做调整和改变。”


 

          陈宽(右)与联合创始人兼 COO 王少康 
          7月,陈宽组建起小型团队,将他们开发出的一组算法模型拿到合作医院做测试。“还没有所谓的界面,只是技术人员能使用的一个程序。” 
          他把所需的肺部X光影像留一部分作为测试数据,相当于让模型学习剩余部分的影像数据(训练数据),然后诊断测试数据,后与医生正确的诊断报告做对比。 
          个月,影像数据放进去,却未跑出结果。其中大的挑战是图像识别的准确率。 
          陈宽的模型中部分使用的是开源的图像数据库“ImageNet”,其模型是基于低分辨率数据源优化的,识别的准确率能达到97%,而X光影像数据量大且非常高清。 
          一边是模型,一边是数据,他要在其中寻找平衡点。“一个模型识别的参数超过一亿,如颜色反差、边角、形态等,要在尽量不损耗画质的情况下处理图像。” 
          除优化算法调整模型外,陈宽还加强了数据清洗、整理功能。 
          在已有模型的基础上,根据医疗行业的特点,他们需把结果转化为文字报告。 
          大约两个月后,在肺部X光的诊断环境中,后生成诊断报告与医生的诊断报告匹配率在90%以上。“换一个测试环境,换一家医院的数据,结果可能又不一样。”
陈宽对结果感到吃惊。“一个月前的诊断基本还是乱猜。” 
          随后,他带着算法模型去更多医院做测试。“吃喝拉撒睡都在医院,跟医生们打成一片。” 
          期间,模型会遇到各种问题干扰。比如一部分训练数据跑到测试数据里面,导致结果不准确。“相当于这个病人来了两次医院,这样的模型诊断的不是病变,而是两次的病症相似度。” 
          针对此情况,陈宽带着团队在测试前先去除相同数据,然后让模型重新学习。 
          更多时候,团队的精力花费在完善模型上。例如,医生诊断肺炎患者有没有肺部积液,还要考虑其有无家族肺癌病史等其它因素。“不同病症之间的关联性需要不断挖掘,模型随之升级。” 
          终,陈宽希望算法模型可转化为产品,帮助医生生成初级诊断报告。“医生如果不满意,可在此基础上做修改;如果满意可直接使用。” 
          今年2月,陈宽接触到英诺天使基金。过去两年,英诺一直在布局人工智能领域,恰好医疗行业也有所涉猎。基于此,双方很快达成融资意向,推想科技获得英诺天使基金1100万天使轮融资,此外还有部分个人投资者跟进。 
          目前,推想科技已有的诊断模型涉及数据源涵盖与心肺相关的超10种X光影像,如心影增大、肺部积液、肺炎等。