大数据初创公司Tamr,为白宫抗癌行动建言献策
今年1月末, 美国总统奥巴马宣布成立Moonshot特别小组,由副总统乔·拜登领导。这一举措旨在通过扫除官僚政治的一些障碍来缩短癌症治愈研究的时间,加快癌症预防,治疗,治愈的进程。 拜登表示最大的困难是解决是临床数据的孤岛问题,他呼吁整合整个科学界的数据和研究结果。这一呼吁得到了Tamr的回应,因为这正是这家整合大数据的初创公司正在做的事情。
美国政府网站新闻处发布了一篇主题为White House Cancer Moonshot Task Force的倡议书。文中谈到发起这次行动的原因:“癌症是现在引起死亡的主要原因,全球癌症发病率预计在未来的几十年持续增长。现在,癌症研究面临重大突破。这对于我们全国来说都是至关重要的。”
响应这一行动的Tamr,是一家致力于商业级的大规模、迅速且高效地解决连接和多样化整合数据问题的初创企业。总部设于麻省剑桥市,由数据库行业的几位“老兵”成立于 2013年。创业团队包括 Andy Palmer, Mike Stonebraker 以及 Ihab Ilyas 几位联合创始人,原来都是 MIT CSAIL(麻省理工学院计算机科学与人工智能实验室)的成员。其中, Mike Stonebraker 更是现代数据库领域的大佬,获得了2014年的图灵奖。
3月21日,Tamr在官网上发布了一封给副总统拜登的公开信,希望为Moonshot助力。Tamr提出了数据标准化和数据整合是美国这一抗癌计划的两大障碍。今年年底,美国FDA 将会要求医疗实验的数据记录要遵循CDISC标准,这一标准将有利于帮助临床研究数据和元数据的提交、获取、交换以及存档。但是历史证明,把诊疗数据转变为CDISC形式需要消耗大量的人力和财力,这会大大降低数据的分析与解读。为此,Tamr在公开信中给白宫提出了三点建议:
一、对于数据的监管要避免常规打法。
成立一个像美国食品药品监督管理局或者美国卫生和公众服务部那样的联邦机构来实现数据获取和交互这样的想法是是过时的。可以成立一个“SpaceX”计划,与无论公营还是私营的政府实体,癌症中心,制药和科技实业公司进行合作。让Moonshot成为符合各方利益的行动,以最优化的速度和创新能力获取数据。
二、先解决操作性与统一性的问题。
大多数癌症研究机构甚至不能查看所有他们已经在研究的数据,更不能有效地与外部进行数据交互。所以这个行动计划需要打破数百个,甚至数千个企业间信息孤岛的状态。
三、为明天,投资今天的科技。
从操作性方面来看,我们利用像Tamr这样的机器学习技术可以在浩如烟海的数据中,实现自动化的数据准备和整合。当有机器不能自动解决的问题时,数据专家可以进行人工干预,获取信息反馈,进一步优化系统。这样,可以帮助在成千上万的科学研究员和团体进行数据分类和整合,让他们更理解自己的信息“宝库”。
Tamr称,希望把自己在大数据领域的专家和科技优势能为Moonshot计划添油加薪,最后实现白宫的抗癌计划:“to end cancer as we know it.”
Tamr的技术可以应用到包括信息服务商、药商和零售商在内的多种组织机构。已于去年6月完成了第二轮的融资,投资方包括Google Ventures , New Enterprise Associates在内的九家机构,总融资金额为4120美元。