多位大佬大胆预测:Hadoop将死,图数据库成为新趋势!
科技行业向来是以技术发展速度快著称,时值岁末,我们和多位数据库领域的业内大佬进行了深度交流,分享了他们眼中2017年的小惊喜和2018年的大展望。
Endpoint Systems创始人Lucas Vogel
2017年:最大的惊喜应该是Oracle Autonomous Database Cloud,其次,是Google Cloud Spanner,Google全球可用分布式关系数据库平台,第三是Microsoft CosmosDB,全球可用的JSON数据库平台。
2018年:数据库的未来是会变得更加小。随着微服务和容器的发展和稳定,开发人员将意识到,他们可以在Docker化的微服务中运行嵌入式数据库,而不是使用Docker式数据库服务器来运行。Oracle Berkeley DB系列产品提供了一些优秀的嵌入式和自我复制的数据库解决方案,为云以及物联网解决方案架构提供了很好的案例。
我认为关系数据库服务器定价会变得糟糕,因为仍然有大量应用程序和平台被锁定到一个或两个数据库供应商的应用程序中。我们希望看到厂商能够利用云中可用的更便宜的数据库产品。
CYBRIC首席技术官Mike Kail
2017年:从单一数据库向扩展的数据库即服务(DBaaS)解决方案的转变仍然缓慢,但是这些解决方案提供了一些额外的功能,例如运行hadoop等大数据stack的Docker容器环境,或者需要裸机硬件来保证性能。
2018年:DBaaS供应商将继续为客户提供更多的定制解决方案,包括支持深度学习和GPU加速。其他架构趋势方面,单片解决方案将转变为微服务模式。
Datical联合创始人兼首席技术官Robert Reeves
RDBMS将会继续增长,NoSQL无法取代RDBMS。目前,顶级的关系数据库管理系统(RDBMS)供应商是Oracle,Mircrosoft,IBM,SAP和Amazon。根据Gartner的数据显示,Amazon的2016年年增长率为107.9%,远远超过其它RDBMS厂商。排在第二位的是阿里巴巴,增长率为99%,420万美元上升到840万美元。当然这和云RDBMS有很大关系。
在过去的几年里,我们常听到NoSQL会取代RDBMS,因为它更适合云计算。但到了现在,这种情况也没有发生,因为RDBMS解决了真正的业务问题,所以所有NoSQL应用范围之外的预测都不会实现。
简而言之, SQL是程序员使用的第一语言。
YugaByte首席执行官兼联合创始人KannanMuthukkarupan
2017年:Kubernetes作为一种手段让企业应用程序在本地,混合和共有云中的移动性获得了突飞猛进的进展,其在2017年迸发出的超乎想象的增长空间令人震惊。在快速发展的云环境中,任何可以自动化部署,扩展和管理Docker应用程序的系统,都会获得持续进展。
2018年:尽管2017年基于云的技术取得了诸多令人瞩目的进步,但是数据层仍然是一个挑战。想要推动这一领域发展,首先要解决的问题就是——一个基于意图的,跨云可移植的数据层,零停机时间配置。2017年11月2日,业界第一次看到YugaByte,YugaByte是关键任务应用的开源云本地数据库,可满足这一需求。
到2018年,数据层将成为值得关注的空间。
Neo4j产品副总裁Philip Rathle
2017年:采用图数据库技术的企业数量激增,甚至超出了分析师的预期。根据最近Forrester Research的报告,全球51%的数据和分析技术决策者已经实施或者正在实施、升级或扩展企业中的图形数据库。另外,以图数据库为重点的会议、活动等等也有了明显的增加。例如,十月份的Neo4j GraphConnectNew York City就有各行各业超过1000人参与其中。另外,
纽约市就有超过一千名参与者,代表着各种各样的行业。另外, Cypher现在已经成为图数据库的首选SQL。其它图数据库厂商也在积极加入到这个行业中,这个领域正在不断成熟。
2018年:图技术最令人兴奋的新用例是知识图与机器学习和人工智能的配对。机器学习将有助于推动公司的下一波竞争优势,但摆在我们面前的难题是,它如何落到实处,哪些公司可以成功地使用图,机器学习和AI。无论是与客户联系,降低欺诈风险,提高员工工作效率,还是做出更好的投资决策,企业对于如何选择使用图数据库技术的探索都是无止境的,同样这也是企业在未来取得差异化竞争先机的关键。
SAP全球副总裁,产品营销云平台和数据管理主管Ken Tsai
2017年7月下旬,Gartner发布了“Hype Cycle for Data Management 2017”,其中Hadoop发行版被标记为“obsolete before plateau”。Gartner正在呼吁大型全栈Hadoop发现的到来,以及与之相关的新功能更新,更简单的基于SQL的数据平台技术和托管云服务,从而更加经济高效地处理大数据。
2018年:2018年,数据平台技术将在日益增的全球劳动力中发挥作用。为了遵守明年实施的新合规措施,公司将需要超越数据屏蔽并实施创新的数据匿名策略,以保护隐私。同时,我们还可以预见下一代HTAP的使用和增长将会扩大,换一种说法,其在交易中超越OLAP的分析处理(即运行OLAP)来运行各种实时分析工作负载,例如,机器学习,空间,时间序列,图表,同时不会牺牲事务完整性,性能,规模,并为每个分析引擎提供需要的单独SQL框架。
数据库即服务(DBaaS)将继续扩展到多云支持之外,还将扩展到内部部署的私有云,以实现以前不可用的新型增值数据处理方案。数据集成和转换工具也将焕然一新,因为企业正在寻找超越ETL和数据争夺的解决方案,以在不同的数据系统环境中创建逻辑集中的数据治理和数据流水线管理功能。因此,我看到企业数据操作(DataOps)的兴起成为数据库分析师,数据工程师,数据分析师和数据科学家们更重要的学科。
另外,区块链仍然是一个没有独特用例的热门话题(除了加密货币之外)。我预计,到2018年,除了更多集成的区块链和DBMS平台技术外,我们还将开始看到加密货币以外的用例。
我预计,未来数据隐私将被视为一个全球性问题,并且不能通过数据安全(AKA消除数据使用或数据访问)来充分解决。未来的数据库平台需要整合新的技术和算法来保护数据隐私,同时仍然能够共享数据而不违反隐私合规性。
Instaclustr首席技术官Ben Bromhead
2017:2017年,我比较期待AWS re:Invent,因为Amazon总是有一些很酷的东西,在趋势方面,我认为行业正在向数据库即服务快速发展,很多云供应商也证实了这一点。我认为过去的一年中,最棒的事件就是Kafka 1.0和在Kafka Stream上引入KSQL。
2018年:随着数据库与云融的合更好,未来在动态可扩展性方面将会有更多探索。企业开始期待从数据层进行即时缩放。最重要的是,NoSQL数据库正在不断成熟,流处理成为了数据库的重要组成部分。随着数据库项目的成熟,我们将看到Apache Cassandra的一系列新功能,其对底层存储机制有一系列的改变,能够提供显着的性能改进。
TigerGraph首席执行官兼创始人Yu Xu
2017年:10月份MongoDB IPO是数据库的大事件,同时也进一步验证了一种尺寸不能适合所有的数据管理,今天的数据更加复杂,并以惊人的速度增长,这意味着企业需要超越传统的关系数据库来管理数据。
2018年:作为新一代数据库的下一个阶段,我们正在快速地将实时图形分析技术发展起来。图数据库技术非常适合为企业AI,机器学习,网络安全和物联网应用提供支持,未来图数据库必将得到广泛采用。
IDERA产品管理副总裁Robert Anderson
2017年: 数据库蔓延已经司空见惯,数据库管理员(DBA)常常要根据需要来轮换数据库。最近,我们已经看到了一些企业已经在长期规划并承诺增加数据库性能工具许可证的数量,以便在未来的两到三年内支持他们的数据库需求。
2018年: 数据库环境将变得更加多样化,DBA越来越多的担当数据专业人员的角色,所以对于他们在数据开发和数据科学方面的技能也提出了更高的要求。由于GDPR调控的出现,数据治理将上升到top 5,同时在线存储的继续增长,会导致越来越多的数据安全漏洞。Docker支持将解锁Microsoft SQL Server支持到更多的应用程序团队。随着MySQL使用量的减少,SQL Server的市场份额将会增加。最后,人工智能(AI),机器学习甚至深度学习将在数据库管理中成为主要推动力。
VoltDB总裁兼首席执行官David Flower
2017年:我们看到了数据库市场的持续发展。虽然发生了一些转变,但是真正能够推动市场变化的可能会发生在2018年:
Hadoop死亡:当然这个说法有点夸张,Hadoop之所以能够在企业中占有一席之地,主要是因为存储静态数据,但接下来围绕这一技术的炒作将会明显减少。Strata数据会议现在更侧重于数据科学和人工智能,而Hadoop峰会已经发展成为DataWorks峰会。另外,Hadoop的先驱Cloudera,Hortonworks和MapR已经在缩减Hadoop中心消息。
开源的真正成本:虽然开源技术仍然是测试,开发和预生产环境中最流行的选择,但企业现在已经更密切地在关注开源技术的真正成本。毕竟,MongoDB在2017年上市,其理由是收入接近1亿美元,收入必须来自某个地方。
(实时)时间机器已经到达。时间是资产。现在技术的实时性仍然很差,对于很多应用程序来说,批处理和接近实时是不可被接受的,而且分析也正从后端(事件后)开始转移到前端(事件中或正在处理中),尤其是5G,ML和AI更加强调这一点。对于我们来说,现在的时间价值不再是一天之内、在一个小时内,甚至是一分钟之内。而是现在,此刻!
Red Hat JBoss Middleware产品经理Kim Palko
2018年:受欧盟“通用数据保护条例”(GDPR)的推动,将重新关注数据安全性,尤其是公有云。随着物联网(IoT)产生的数据量不断增加,企业将继续将更多的数据迁移到云中,以获得可扩展性,灾难恢复,灵活性等方面的优势。2018年我们将需要更严格的安全保证。
RealmCMO Paul Kopacki
2018年:经过多年对关注大数据集中式存储库的关注,2018年的重点将朝着网络边缘、移动设备、物联网数据库和数据处理技术的新类别转移。每个设备和每个人都在捕获,处理和同步越来越多的数据,而旧的数据技术无法应对这一挑战。
Datos IO营销与业务开发副总裁Peter Smails
MongoDB IPO 是2017年最大的事件。云已经颠覆了传统的数据库市场。现代数据库(包括MongoDB,Apache Cassandra,Redis和DynamoDB)的新一代正迅速成为云本地应用程序部署的标准平台。MongoDB的估值和IPO证明了这些新数据库在整个企业IT中正在激增。
Couchbase工程和CTO高级副总裁Ravi Mayuram
2018年的预测:
以对数据基础设施的重新思考为基础,数字化转型将加速。企业已经开始了解客户参与和数字化转型之间的联系,他们已经意识到,使用旧的基础设施将无法帮助他们实现这一转变。因此,越来越多的企业将从根本上重新考虑数据来演变业务模式,例如如何管理数据,如何移动数据,以及如何向客户呈现数据。这种基本的重新思考始于数据基础设施层面,实现了企业最终数字化转型目标的灵活性。企业数据库基础设施向现代数据平台的重新平台化,数据移动的流畅性和从边缘到云端的安全管理平台将以前所未有的速度加速。
包含数据库蔓延将是一项任务。解决单一客户问题的一招技术解决方案将开始剥离。为了保持持久的商业战略,企业需要成为持续创新的真正合作伙伴,而不是指向能够解决问题的解决方案。将众多解决方案整合到一个平台上的做法将会摒弃,而提供满足多个客户需求的一个平台的业务将会蓬勃发展。企业需要适应客户的期望,对技术采取敏捷的方法将是关键的区分因素。