在您企业的业务中整合NoSQL数据库的10项小贴士

现如今,数据正推动着企业的创新及其业务的增长,但这只是针对那些为有效处理数据做好了充分准备的企业组织而言的。

尽管关系型数据库仍然拥有其一席之地,但鉴于今天的数据的复杂性、庞大的数据量以及企业对于数据处理的需求,使得关系型数据库已然无法很好的适合于某些应用程序的处理需求了。在许多这样的情况下,NoSQL这一技术便开始发挥其用武之地,并很好的填补了这一空白。尽管如此,在您企业组织内部署NoSQL系统可能并不是一件很容易的事情。

而在您企业组织内部署NoSQL系统显然是值得的,但这需要提前进行精心周密的策划,以及组织化的采购——而这一关键点往往被许多IT企业组织所忽视了,MarkLogic公司产品执行副总裁Joe Pasqua如是说。MarkLogic公司的schema-agnostic企业NoSQL数据库曾帮助拯救了Healthcare.gov。

Pasqua分享了10大贴士,希望能够有助于您的企业组织顺利实现NoSQL系统的整合。

1、开发一个用例

通往成功的NoSQL项目的第一步并不是什么秘密,Pasqua说。您只需要开发一套坚实的用例,并明确地了解您想实现什么样的目标。

“如果缺乏了这一点,企业几乎注定是要失败的。” Pasqua说。“我们在大数据领域已经看到太多太多类似的失败案例了。我曾经在与人们交谈时听到他们说,\&\#39\;我们需要Hadoop,而且我所在的企业也已经部署了Hadoop技术\&\#39\;,但事实上,这些人并不知道他们为什么要部署Hadoop技术,或者说他们试图要通过Hadoop技术来完成什么任务,这些企业的CIO们只是单纯的表示说,他们需要Hadoop技术,那么,我们只能说,或许只有靠最好的运气才能使得他们的Hadoop部署项目顺利完成了。他们希望能够在企业董事会上讨论Hadoop项目,但有时这一愿望真正需要的是要充分理解Hadoop项目的部署能够为其所在的企业带来怎样的商业价值。”

对于那些需要庞大的规模和巨大的数据量的项目而言,NoSQL往往是正确的选择,其具备了:个性化、用户配置文件管理、实时从运行数据中提取信息、内容管理、目录、360度全方位的客户视图、移动应用、物联网应用、数字通信和欺诈检测。

2、确定NoSQL模型将如何实现与您企业现有的数据库的适应

一旦您了解了您企业的使用情况,您便可以确定NoSQL数据库是否是您企业项目的最合适的方案了。可能您的团队的现有工具已经熟悉将需要适应的新的管理模式了。但Pasqua 仍然警告说,不要试图强行将方形螺钉嵌入圆孔螺母。

“我们曾在相当多的企业业务中看到过类似的情况。” Pasqua说。 “他们已经找出了他们的使用情况,并明确的知道他们想要完成的工作任务是什么。然后他们可能会说,’让我来尝试使用我们企业已经拥有的工具和技术吧。’对于大量的项目,特别是那些需要大数据或数据灵活性的项目来说,他们往往会发现他们现有的工具是不起作用的。有时候,他们会尽力尝试使用那些现有的工具长达数年的时间,最终才不得不承认其并不起作用的现实。”

其中的一个例子便是在帮助处理Healthcare.gov崩溃的问题期间,Pasqua说。该服务最初是建立在甲骨文数据库上的,但其需要一个严格的数据模式,从而给系统带来了巨大的处理压力。该用例所需的是NoSQL架构的灵活性。MarkLogic公司则是被聘请来提供帮助的供应商之一。

“了解企业组织现有这些工具在何时是不适用的,而NoSQL数据可在何时用于处理您企业的问题更为适合,是非常重要的。”Pasqua补充说。

3、承认NoSQL数据库将是具有颠覆破坏性的

如果您企业做出了在您的业务基础架构上来实现NoSQL数据库的决定,那么,就必要承认其所带来的影响将是具有颠覆破坏性的,并同时需要为这些相应的影响做好充分的计划和准备。

“NoSQL是具有颠覆破坏性的。” Pasqua说。”其颠覆破坏性表现在很多的方面。从开发者的角度来看,人们希望使用其现有的工具和技术。即使当他们已经决定他们想做一些不同的事情的时候,他们对于如何构建应用程序和使用数据库已经有了一个整体性的心态。而尝试他们已经具备的相关经验、和相同的工作方式去体验和使用NoSQL数据库,是很自然的。但事实并非如此。他们尝试像使用SQL一样来使用NoSQL,其结局只会非常糟糕。您需要退一步想想使用NoSQL数据库的正确的方式是什么。不要试图与其进行斗争,并使之成为关系数据库。这是一个新的模式,它是一个具有颠覆破坏性的模式,让我们好好利用这个优势吧。”

例如,传统的基本原则是,您企业组织必须配备专业的数据库管理员(DBA)团队来管理您企业的相关重要应用程序, Pasqua说。但他指出,在NoSQL的世界,您可能会看到以前需要10个DBA来执行的工作量,现在可能只需要1个DBA了。这样您企业就可以解放出更多的员工人手出来,把他们安排到别的工作岗位上。

同样,成本模式也将发生变化。NoSQL的是向外扩展的,基于硬件的技术商品。

“客户购买了我们的方式,使用我们的方式,真的是非常不同的,” Pasqua说。 “您真的可以从我们这里采购到高性价比的硬件,并根据您企业业务的需求来进行扩展。这确实影响了采购过程,如果您企业不购买1000万美元或2000万美元的硬件,其可以让您企业能够通过采购周期的到非常快速的发展。而大多数客户也都充分的利用了这一优势。”

4、从小规模做起,然后逐步发展

很难从小规模开始关系型技术。如果您企业是一家大公司,您企业可能会有成千上万的客户,而这些客户可能是个人或是其他企业组织,因此,这会导致您企业会经常需要面临很多不同的数据政策的处理或者需要与您企业已经收购的另一家公司进行数据的合并。

“您需要将每一天都在不断增长的不同的数据孤岛的数据整合到一起。” Pasqua说。

而借助关系型技术来解决这些问题,则意味着您必须从所有不同的数据孤岛找出您想把哪些数据结合在一起,创建一个架构,开发和部署ETL进程,将所有数据结合到一起。这个过程可能需要几个月或更长的时间。

“然后,您就像在隧道的尽头看到了光明一样,您将创建一款新的产品或收购新的公司或面临新的监管要求,并再次从零开始。” Pasqua说。 “您必须预先做所有的数据建模。”

NoSQL的横向扩展规模,基于商品的架构及其架构的灵活性意味着您可以从小规模开始着手,从您认为是非常必要的一些数据和扩展努力开始。您可以用那些凌乱的,非结构化的数据开始,并能够马上从中获得价值, Pasqua说,然后在必要时添加结构化数据。

5、在您企业组织内确定决策者和执行者

这一要点并不是唯一针对NoSQL的。当涉及到具有颠覆性的变化处理时,变更管理可能是您最大的障碍。

“没有决策者,您就一事无成,“Pasqua说。”但您也必须在董事会有执行者。”

而具体实施过程中的细节可能会促进或打破您的行动,所以务必确保有真正能够将这些技术应用落实到位的人。这样才能真正使得这些技术发挥其应有的价值。

6、确定将抑制和促进该倡议的过程

重要的是要重新思考您在NoSQL的世界的流程,惯性可能是您最大的抑制剂之一。

“了解企业组织的现状、并凭借内在渴望去执行时企业一直在做的方式——但如果您不改变您的流程,其会使得改革的步伐放慢。” Pasqua说。

了解您的使用情况,以及新技术的采用所将带来的颠覆破坏性的变化将有助于您塑造您的流程,以充分利用新的功能优势。主要架构师和技术领导能帮助您塑造这些流程,因此应该积极争取他们的支持,并让他们参与进来。

7、确定您企业是否有合适的技能

企业组织具备相应的能力,以修改应用程序的设计和系统应用程序架构,进而适应NoSQL数据库是相当关键的, Pasqua表示说。

“拥有适当的技能是至关重要的,”他说。 “这并不是说NoSQL数据库技术是有多么特别的复杂性。事实上,其通常比较简单,但它是不同的。很多人已经在数据库业务领域从业30年了,但他们曾唯一使用过的东西就是关系型数据库。他们在学习NoSQL数据库方面没有任何麻烦,但必须真的花时间去学习。”

培训是该学习过程的一个重要组成部分。 Pasqua 指出,而MarkLogic公司则免费提供了所有的培训课程,无论您是否是我们的客户。

8、理解NoSQL数据库管理系统和查询语言

请务必要衡量您的企业组织对于NoSQL数据库及如何使用有充分的理解。

“您企业已经有的相关人员都是非常聪明的数据库方面的人才,”Pasqua说。 “他们对于NoSQL的理解不会有任何的问题,从技术的方法上来说,这不是一个难以逾越的问题,其更多的是文化方面的东西。”

9、建立一种紧迫感

要让企业的所有利益相关者都充分了解您企业实施NoSQL数据库必要性,以及他们可以期待从中获得什么样的回报。

如果您的企业组织转向采用NoSQL数据库,而在您企业组织内部是会有人抵制的,那么恐怕您很难看到该项目顺利前进的方向。

“而这些反对抵制的人通常是那些在已经遭遇了问题的人——如在大数据或数据集成方面,他们在试图使用他们现有的工具来解决他们所面临的问题方面遭遇到困难了,并花费了大量的时间在这上面。” Pasqua说。“鉴于已经花费了那么多的时间却未见成效,他们已经有相当大的压力了。而我们所面临的挑战是,将紧迫感传达给利益相关者们。”

可能业务部门已经有一些面向企业或监管导向的最后期限的紧迫感压力了,Pasqua说。您必须确保您的技术人员和采购人员有也具备这方面的紧迫感,以满足这一最后期限。

他说:“从小规模快速开始着手,然后逐步扩大规模。”他说。把紧迫感传达给所有的利益相关者。”

10、向有经验的人请教,包括同事和顾问

经验产生了所有的差异,Pasqua说。

“正是因为像诸如MarkLogic公司这样的技术真的是具有颠覆破坏性的,会很容易使的企业用户落入一些陷阱。” Pasqua说。 “您需要能够走出去,并真正与那些使用这些类型的新技术、并且从中获益的人请教,这一点是至关重要的。看看是否有人正在使用MarkLogic的服务,而他们是用它来运行其银行或作为其培训体系的一部分。例如,Healthcare.gov就是用其来运行他们的交易系统。真的,您能做的最好的事情之一就是走出去,与已经部署了该技术、或者与这方面的技术大牛沟通交流,包括在技术方面、文化方面、和流程方面的交流。找出您如何能够让这一数据库在您企业组织顺利部署,将为您的企业组织带来最好的优势。”

Pasqua说,如果您企业聘请了第三方顾问,寻找那些能够将结构化带到专业服务中的架构师和顾问,这会让您企业从正确的基础开始,这会让您企业之后能够更加自立,而不是依靠专业服务,他说。

欢迎加入本站公开兴趣群

软件开发技术群

兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流

QQ群:26931708

Hadoop源代码研究群

兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop

QQ群:288410967

;