盘点:世界前十 超人气基于Hadoop的大数据初创企业
这已经不再是什么秘密了,全球的数据正在以几何数字增长,借助这股数据浪潮在全球范围内迅速成长起来一大批Hadoop的初创型公司。作为Apache的一个开源分支Hadoop几乎已经成为了大数据的代言词。据Gartner估计,目前的Hadoop生态系统市场价值大约为77,000,000; 该研究公司预计,这一数字到2016年将迅速增加到8.13亿美元。
在Hadoop市场快速发展的大环境下,出现了大量的初创型企业来分这将近十亿美元的大馅饼。
超人气Hadoop初创公司前两名
1、Platfora
他们做什么:Platfora主要为企业提供相关的大数据解决方案,并且将Hadoop的袁术数据进行转换,为企业提供更智能的商业指导。
总部:加州San Mateo。
负责人:本·维特,谁曾在DataStax出任产品副总裁。
成立时间: 2011
资金实力:6500万美元。最新一轮由TENAYA资本主导的融资38000000美元。并且花旗风险投资公司,思科,Allegis资本,安德森霍洛维茨,Battery Ventures公司,萨特山风险投资公司等多家知名风投参与了本轮融资。
上榜原因:Platfora成立的目的在于简化Hadoop。虽然企业采用了Hadoop作为大数据的解决方案,但并不能快速从这些数据中获取价值。Platfora的解决方案在Hadoop上做了一个壳,让企业数据分析师可以更好的利用组织数据与相关结果。
关键客户包括:康卡斯特,迪斯尼,Edmunds.com和华盛顿邮报。
竞争格局: Platfora竞争对手Datameer,IBM,SAP,SAS,高山数据等。
不同之处:Platfora声称拥有了第一个基于Hadoop的可向外扩展的内存大数据分析平台,Platfora的重点在于简化Hadoop与大数据分析之间的复杂过程,让数据更清晰更快速的展现在需要它的人面前。
2、Alpine Data Labs
他们所做的事情:提供一个基于Hadoop的数据分析平台。
公司总部:加利福尼亚州旧金山
执行总裁:乔奥托,销售和服务于Greenplum的原高级副总裁。
成立时间:2010
资金实力:350万美元的资金总额,包括16美元的B系列融资,从Sierra Ventures公司,风险投资公司的使命,UMC资本和罗伯特·博世风险投资。
上榜原因:多数高管和经理没有时间或技能代码,以便搜集数据的见解,也没有时间去学习复杂的新的基础设施像Hadoop。相反,他们希望看到大画面。麻烦的是,复杂的高级分析和机器学习通常需要编写脚本和编码的专业知识,这可以限制对数据的访问科学家。通过使预测分析通过SaaS访问的高山数据缓解这个问题。
Alpine Data Labs据提供了一个可视化的拖放和拖放的方式,允许数据分析员(或任何指定的用户)在整个组织与大型数据集工作,制定和完善模型,并在大规模协作,而无需代码。数据是在现场环境分析,不迁移或取样,通过一个Web应用程序,可以在本地托管。
Alpine Data Labs利用Hadoop和MPP数据库的并行处理能力和实现了MapReduce和SQL数据挖掘算法。用户使用其数据交互,直接在那里已经坐。然后,他们可以设计分析工作流程,而不必担心数据移动。所有这一切都是在Web浏览器中完成,和阿尔卑斯数据然后转换这些可视化的工作流为在数据库或MapReduce的任务序列。
主要客户包括:索尼,哈瓦斯媒体,斯卡拉,签证,Xactly公司,全国广播公司,停住,黑莓,和摩根士丹利。
竞争格局:高山将争夺两个大型老牌(SAS,IBM,SPSS,以及SAP),而该初创公司如Nuevora,Platfora,晴空塔,革命Analytics(分析),和快速我。
关键的区别:Alpine Data Labs认为,大多数竞争方案要么是基于桌面或没有任何协作能力的单点解决方案。相比之下,Alpine Data Labs提供了一个“的SharePoint样”的感觉。在协作和搜索外,还提供了在同一屋檐下的建模和机器学习。高山也是无数据移动阵营的一部分。无论如何,如果一个公司的数据是在Hadoop的或MPP数据库,高山发出指令,通过其在群集分析,而没有移动数据。
提供Hadoop平台与服务的企业
3、Altiscale
主营业务:提供的Hadoop作为一种服务(HAAS)。
总部:帕洛阿尔托,加利福尼亚州
执行总裁:Raymie Stata的,谁曾雅虎首席技术官。
成立时间:2012年3月
资金实力:Altiscale由1200万美元从通用催化剂和红杉资本首轮投资的支持,已经来自个人的资助者。
上榜原因:Altiscale的服务的目的是Hadoop的抽象的复杂性。Altiscale的服务主要目的是解决Hadoop的抽象性与复杂性,为工程师搭建一个完整的Hadoop环境,并且对其进行维护与管理。让用户可以更专注于他们的数据与应用。当客户的需求发生变化的时候,Altiscale也会做出相应的调整与变化。
主要客户:MarketShare公司。
主要竞争对手:微软Azure、Qubole与Xpleny等。
关键业务区别: Altiscale认为自己是“唯一一家真正提供了一个完整的Hadoop生产环境的方案服务商。
4、Trifacta
Trifacta中国专区>>>
主营业务:为企业提供整体服务平台,将原始数据进行转换与整理,将结构化数据进行分析处理。
公司总部:加利福尼亚州旧金山
执行总裁:乔Hellerstein,谁在除了作为Trifacta的CEO也是计算机科学的教授在伯克利。
成立时间:2012
资金来源: Trifacta由16300000美元的注册资金,由Accel Partners公司,XSEED资本,集体的数据,Greylock合伙和个人投资者前后两轮的资金支持。
上榜原因: Trifacta有一个在数据链技术平台。为企业解决大数据与分析工具之间的瓶颈问题,为业务分析师节省大量的时间与精力。
为了解决这个问题,Trifacta使用“预测互动”技术,以提升数据处理成视觉体验,使用户能够快速,轻松地识别感兴趣或关注的功能。分析师强调视觉特征,Trifacta的预测算法同时观察用户行为和数据的性质来预测用户的意图,并提出建议,而不需要用户的规范。因此,数据转换的繁琐的任务就变成一个轻量级的体验,更为灵活,效率比传统方法。
主要客户:洛克希德·马丁公司、强生集团。
竞争格局: Trifacta将与Paxata,Informatica和CirroHow竞争。
关键的区别: Trifacta认为,数据转换的问题,需要一个全新的互动模式-一个用机器智能,夫妻人类的商业洞察力。Trifacta的平台结合了智能推理与“预测互动”技术视觉交互,收人与数据之间的差距。
秒级别的大数据处理速度
5、Splice Machine
他们所做的事情:为客户提供基于Hadoop的兼容性数据库设计方案。
公司总部:加利福尼亚州旧金山
负责人:Monte Zweben,谁以前曾在美国航空航天局艾姆斯研究中心,在那里他担任人工智能科副主任。后来,他创办并担任蓝尼软件公司首席执行官。
成立时间: 2012
资金:他们是由1900万美元的主语合作伙伴和莫尔多风险投资公司的资金支持。
上榜原因:企业的应用程序与Web开发人员一直远离传统的关系型数据库,由于快速发展的数据量以及不断变化的数据类型,需要更加灵活的解决方案来解决架构的问题。
现在,随着新兴的数据库解决方案,功能,使得RDBMS如此受欢迎了这么久,如ACID兼容,事务完整性,以及标准的SQL,可在成本效益和可扩展的Hadoop平台之上。熔接机认为,这使开发人员能够得到最好的两个世界在一个通用的数据库平台。
Splice Machine为企业提供了关于NoSQL所有的数据库有点,比如自动切片,可扩展性以及容错性与高可用性。并且为企业优化了复杂的数据库查询,而且不需要重写所有的数据应用以及BI工具。
通过利用分布式计算,Splice Machine可以通过简单地增加更多的商品服务器从TB级到PB级规模。Splice Machine是能够提供这种可扩展性,而不会牺牲SQL功能或酸合规是RDBMS的基石。
竞争格局:竞争对手包括Cloudera的,MemSQL,NuoDB,Datastax和VoltDB。
关键的区别:Splice Machine声称拥有在数据库中利用Hadoop解决实时时间分析的能力。
6、DataTorrent
他们做了什么:提供基于Hadoop的实时流处理平台。
总部:加利福尼亚州圣克拉拉市
负责人:富晃,谁是以前的工程团队在雅虎,在那里他担任工程执行副总裁的创始成员之一。
成立时间:2012
资金来源:该公司关闭了800万美元的系列2013年6月A轮August Capital公司领导的一轮,并加入了由AME云创投。该公司此前取得75万美元的种子资金来自莫拉多风险投资公司和法扎德Nazem。
上榜理由:DataTorrent认为,他们可以很好的解决数据延迟问题,尤其是对实时数据分析要求很高的环境中。
对于一些见解,到时候的数据存储到磁盘上,进行分析,并回答了 ?它已经太晚了。举例来说,如果一个黑客挟持了信用卡帐户,并设法使一些购买,即使在几分钟内切断信用卡,但这个时候持卡者已经遭受了重大的损失。DataTorrent认为,企业需要掌握实时数据,并且对其进行快速分析与判断。
不同于传统的批量处理,可以采取小时,DataTorrent声称能够数亿每秒的数据项的执行。这使企业处理,监控,并根据其在实时数据做出决策。
竞争格局:DataTorrent的主要竞争对手来自IBM(InfoSphere流)和风暴开源项目。
关键的区别:DataTorrent最关键的地方就是在于它的数据分析速度。
大型的Hadoop托管平台
7、Qubole
他们做了什么:提供大数据作为一种服务有一个“真正的自动缩放Hadoop集群。”
总部:加州山景城
执行总裁:Ashish Thusoo。
成立时间: 2011
资金来源:该公司是由700万美元的风险投资公司光速和查尔斯河风险投资公司A系列融资支持。
上榜理由:由于Hadoop是一个相对较新的技术,完全掌握并且可以熟练运用是一个非常困难的事情。通过托管的解决方案Qubole希望使Hadoop成为一个易于使用的技术。
Qubole为企业提供Hadoop的初始设置与维护工作。为企业达到削减成本与项目自动化管理的相关事情。
客户包括:Pinterest,MediaMath,Saavn。
竞争格局: Qubole将与Altiscale,亚马逊电子病历,宝数据成为竞争对手。
关键的区别:Qubole指向其专有技术,提供真正的自动缩放和存储优化。
8、Continuuity
他们做什么:提供一个基于Hadoop的大数据应用托管平台。
总部:帕洛阿尔托,加利福尼亚州
负责人:乔纳森·格雷,谁是以前的HBase的软件工程师的Facebook。
成立时间:2011
资金来源:12500000美元从Battery Ventures公司,启明创投,安德森霍洛维茨,数据集合和放大的合作伙伴。
上榜理由:Continuuity想出了一个巧妙的方法来解决Hadoop的专家的缺乏:他们提供了针对Java开发人员应用程序开发平台。较低级别的基础设施是由Continuuity平台的所有抽象出来。
该公司的旗舰产品,电抗器,是一个基于Java的集成数据和应用程序框架层在Apache Hadoop,HBase的,和其他的Hadoop生态系统组成部分的顶部。它表面经过简单的Java和REST API的基础设施的能力,从不必要的复杂性屏蔽的最终用户。
竞争格局:截至目前,Continuuity具有独特的优势。间接的竞争对手来自哈斯营(AWS电子病历,Altiscale,InfoChimps这类,迫击炮数据等)。
关键的区别: Continuuity是针对Java开发人员的大数据解决方案。
大数据的可视化平台
9、Xplenty
他们所做的事情:提供HaaS。
总部:以色列特拉维夫
执行总裁:Yaniv Mor。
成立时间: 2012
资金来源:资金来源不详。
Xplenty提供了基于Hadoop的云环境,里面有自由编辑器与设计环境,使企业可以节省大量的硬件投入,并且在软件与相关的维护人员上也有大量的预算节省。
采用拖拽的操作界面,无需编写复杂的脚本或任何类型的代码。凭借其服务器自动配置功能,用户可以简单地指向一个数据源,配置数据转换任务,并告诉该平台在哪里写的结果。Xplenty的平台使用SQL术语。因此,对于数据分析,学习曲线应该是最小的。
客户包括DealPly技术,Fiverr,铁源,WalkMe。
竞争格局:主要的竞争来自亚马逊的电子病历。其他哈斯竞争对手包括Altiscale,迫击炮数据,Qubole,以及最近与微软的Hadoop在Azure上。Rackspace公司即将推出基于Hortonworks’分配自己的哈斯产品。
关键的区别:根据Xplenty,竞争性服务还是针对开发人员,而Xplenty目标的数据和商业智能(BI)的用户谁不知道如何编写代码,但谁需要将数据转移到一个大的数据平台。
10、Nuevora
他们所做的事情:提供大数据分析应用。
总部:加州圣拉蒙
执行总裁: Phani Nagarjuna。
成立时间: 2011
资金:300万美元的风险投资Fortisure早期资金。
上榜理由: Nuevora的nBAAP (大数据分析及应用服务)的平台功能基于最佳实践驱动的预测算法的专用分析应用程序。 nBAAP是基于三个关键大数据技术: Hadoop的(数据处理) , R(预测分析) ,和的Tableau (可视化) 。
在这一切之上, Nuevora的算法上的数据(事务,社交媒体,移动,战役)中不同来源的合作,以快速识别,以配合特定的目标,个人的营销策略模式和预测。
该平台包括预构建的应用程序,为客户的营销业务流程 ?获取,保留,向上销售,交叉销售,盈利能力和客户生命周期价值( LTV ) 。随着对个别客户的情况下,唯一的“最后一英里”的配置, Nuevora的应用程序,能让企业组织预测客户的行为。
竞争格局:当Nuevora评估的竞争格局,它在零上的大型咨询公司,如埃森哲,和其他预测性分析的公司,如高山数据实验室。
然而,由于在阳光下几乎每一个营销平台,目前包括某种形式的分析引擎,我也希望他们能与主要的营销自动化供应商,如ExactTarget (使用Pentaho的其大数据分析)竞争。
关键的区别: Nuevora给最终用户使用“闭环校准引擎”,它可以帮助企业跟上仅基于最新数据的最中肯的见解,不断地重新调整他们的预测能力。