英特尔想做基因行业的数据管家:这块骨头不好啃



“我们已经可以在24小时内实现 精准医疗 的主要过程,包括数据采集、分析、找出病因、给出个性化的靶向药等等。但是,目前成本还是太高,不适合普通用户使用。”

面对记者的提问,英特尔公司医疗和生命科学集团亚太区总经理李亚东很坦白。

在精准医疗领域,“24小时精准医疗”更像是一个数据管家。但是对于英特尔来说,这个“管家”并不好做。如何控制产品成本?如何加快解读速度?谁才是产品的买单方?一个个问题摆在英特尔相关团队的面前。

英特尔想做基因行业的数据管家:这块骨头不好啃

英特尔公司全球副总裁兼中国区总裁杨旭

近日,在第三届英特尔生命科学信息技术论坛上,英特尔公司全球副总裁兼中国区总裁杨旭给出了关于“24小时精准医疗”进展的时间节点,即:“2020年把24小时内完成一个人全基因分析的费用降到500美元。”

杨旭表示,精准医疗是数据驱动的科学,是生命科学、医学技术和计算技术融合的前沿领域。作为一家数据公司,英特尔可以为精准医疗提供大数据、云计算、人工智能以及网络存储等方面的技术支持。

目前,在基因检测领域,计算依旧是瓶颈。据英特尔公司医疗与生命科学集团总经理Kay Eron介绍,目前,精准医疗领域存在四大数据方面的挑战,这也是英特尔要着力解决的问题。

数据规模。基因组涉及的数据量是TB级的,要实现这些数据在不同用户之间平滑、及时地传输和分享,对很多数据科学家来说都是挑战。

解析速度。通常情况下,全基因组分析需要花几周的时间,这个时间对很多临床医疗服务来说太长了,所以必须要加速临床或者门诊对基因组的分析速度。

信息分享的安全。基因信息关系到人最根本的隐私和个人的数据,所以一定要保证它的安全性。

数据的可扩展性。基因组数据爆炸式的增长速度已经超过了摩尔定律的速度。因此,产品的后台技术需要确保有足够的扩展性来支撑超过摩尔定律的爆炸增长速度。

目前,数据处理正是华大基因所遇到的瓶颈之一。“我们国家基因库现在每年要处理的数据由10PB(较高级的存储单位,等于250个字节),这么大的数据量处理起来非常困难,但是自己建一个巨大的计算机机房,时间、精力又都不够。” 华大基因副总裁王洪琦表示,这种困难一方面是存储困难,另一方面是解读的困难。正是基于这样的考虑,华大基因与英特尔成了合作伙伴。

过去几年,为了解决上述提到的四个问题,英特尔在中国 精准医疗 领域做了很多尝试。

“从2015年10月份发布1.0产品,到2016年底, BGI Online已经完成了170TB数据的处理,并将平台上的170余个应用程序进行开放。” 李亚东提到。在提高数据分析速度方面,2015年,英特尔与华大基因、阿里云成为合作伙伴,共同打造基因组数据分析云计算平台BGI Online。

2017年5月,英特尔宣布与博德研究所 (Broad Institute)、华大基因及阿里云达成协议,将通过BGI Online为用户免费提供最新版的基因组分析工具箱GATK4(Genome Analysis Toolkit 4)使用授权。据了解,过去完成3000份的全基因组数据分析至少需要6个星期,而通过GATK4,在两个星期内就可以同时完成1.5万个全基因组的数据分析。

产品再好,不合水土也是不行的。为了能够使产品更加本土化。2017年6月,英特尔精准 医疗 伙伴计划的下属联盟“基因组一体机联合实验室”宣布成立。浪潮、UEC、华大基因、聚道科技、阿里云、Falcon和安诺优达等上下游公司将与英特尔合作,为医院和研究机构开发基因组学设备,以便处理本地数据分析需求。

李亚东表示,“与国外不同的是,中国的基因数据大多存储在本地,我们的产品必须要适应中国特色。”

对于英特尔来讲,产品的本土化不仅体现在数据分析方面,更体现在数据的交换方面。

“数据量越来越大,数据拥有者不太愿意或者不太方便进行数据完全共享。”李亚东表示。在这种情况下,怎么样才能不移动数据,却可以实现最大程度上地分析数据?这是英特尔在数据交换方面要着力解决的问题。

目前,英特尔在这方面的尝试就是与上海市儿童医院共同启动儿童健康协作云中心。据了解,儿童健康协作云中心是一个开放式平台,是双方针对儿童遗传基因组研究和数据交换应用于临床的范例。目前,这个数据交换框架已在上海市儿童医院、联盟医院和上海交大生物医学转化中心上线。上海市儿童医院和联盟医院利用该框架,在不同站点之间对儿童发育迟缓案例进行基因变异识别和比较。

具体来说,在这个数据交换框架内,各医院的数据仍然保留在本地,但可以根据自身要求通过查询的方式,异地发起查询。




上一篇:常保活力原来是基因问题?揭秘精力与遗传的关系_央广网
下一篇:自动化操刀,克隆成功率翻倍