Hadoop大数据平台安全问题和解决方案的综述

hadoop大数据平台安全问题和解决方案的综述

陈丽,黄晋,王锐

大数据时代的到来, 更强的计算机和更成熟的大数据平台工具让企业从海量数据中挖掘数据价值成为了可能, 尤其是基于Hadoop的大数据平台, 甚至利用廉价的商业硬件处理TB、PB级别的数据. 在最初Hadoop大数据平台落地建设的过程中, 往往功能先行, 而忽略了安全的管控策略, 直到2009年Yahoo团队提出了基于Kerberos的身份验证方案, 才带动了Hadoop大数据平台安全管控工作的全面开展. 本文介绍了Hadoop大数据平台的基本历程, 描述了2009年之前Hadoop大数据平台存在的传统安全问题, 并尝试着将目前行业内Hadoop生态系统组件的安全性和每个组件的安全解决方案做一次系统的梳理, 希望为构建Hadoop大数据平台管控方案时提供参考意见, 以便合理利用先进的安全管控方案保护好企业、用户的隐私数据.

Hadoop大数据平台安全问题和解决方案的综述

;