一图以蔽之:Hadoop在大数据企业应用中的崛起
对于试图分类和整理大数据科技,特别是 Hadoop的那些企业,这是一个振奋人心的全新信息图。这个对Hadoop的分析,也许能帮助公司的决策领导者更好地了解该技术平台。
1什么是Hadoop?
Apache Hadoop是2005 年(由Apache Software Foundation)开发的开源软件框架,特别为大数据和大规模数据处理量身定制。它包含四个主要模块:
1. Hadoop Common: 包含其它Hadoop模块所需的所有库和功能。
2. Hadoop 分布式文件系统(Distributed File System),简称HDFS。它是一个文档储存系统,能够在数据集群间提供高带宽。
3. Hadoop Yarn: 管理计算机集群中计算资源的平台,并利用这些资源做应用调度。
4. Hadoop MapReduce:处理大规模数据的程序模块。
小贴士
超过170家公司正在致力于发展Hadoop,当前Hadoop框架的估值为20亿美元。
2企业中的Hadoop
使用Hadoop管理数据,2014年,每4家企业就有1家;2012年,每10家公司才有1家。
前5大应用行业:计算机制造业、商用服务、金融、零售和批发、教育和政府部门。
使用Hadoop的5大原因:低成本,计算性能,规模可伸缩性,存储灵活性,数据保护。
超过60%的公司表明,Hadoop补充或取代了他们现有的数据环境。
3Hadoop的未来
61%的机构计划在不远的未来部署、或已经部分部署了Hadoop。
对基于Hadoop技术的全球销售额:截至2020年将达到50.2亿美元。
高德纳咨询公司(Gartner)表示:
“对Apache Hadoop使用对增长,正在促进着结构化数据的增长,引领企业去理解如何再利用数据,赋予数据新的用途,并从数据中获得至关重要的深入理解 。”
4
完整信息图
来源:
http://insidebigdata.com/2014/10/18/current-state-hadoop-inforgraphic/
【译者简介】
有意联系译者,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢!
孙沁(Kiki):美国留学五年,现Emory University生物统计硕士在读。对Clinical Trails,Cancer Prevention, HIV/AIDS以及Food Science/Nutrition的领域很感兴趣。毕业后希望在Pharmaceutical/ Biotechnological/ Healthcare Industries/ Hospital工作,也想尝试医疗健康方向的咨询工作(Life Science Consulting)。希望结交对医疗数据有兴趣的朋友,也希望大家帮忙推荐此方向的实习和工作机会给我。
康欣:博士,西门子中国研究院高级研究员。多年从事图像及数据处理和分析、计算机视觉、模式识别、机器学习、增强现实等领域的技术研究和创新应用。希望借此平台,与大数据分析爱好者以及专家学者交流。
大数据文摘翻译作品
翻译:孙沁
校对:康欣
欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权