RapidMiner 发布新的平台创新,增强了大数据的安全性、协作性以及扩展性能

新版本为全球用户们带来了数据授权、工作流程注释、一个软件开发包、 Python 集成以及Splunk 连接器等

Graeme Noseworthy 发布于 RapidMiner 博客

全球RapidMiner用户们,

大家好!

我们再次激动地宣布:RapidMiner 发布了一系列的更新!一直以来,数据科学家们和商务分析师们都在寻求从大数据中获取更深层次、更直接的、可行动的的洞察力,而这次创新之处主要从这些方面增强了性能。

最新版本的 RapidMiner 现代分析平台包括支持 Apache Sentry,让企业可以作为他们的分析计划的一部分在 Hadoop 里执行数据授权。由于数据科学是团队工作, RapidMiner 通过在他们协作过程中添加工作流程注释来增加强分析流程和整体输出。这次平台的更新让用户们可以更高效地开发他们的扩展-通过添加由拥有丰富知识的 RapidMiner 社区贡献的开发包-并通过新的 Python 和增强的 R 集成从而更容易地运用脚本语言。

让公司行政管理层的头疼的大数据最大的问题是如何在获取洞察力的时候保证数据安全,通过我们最新的企业级解决方案,RapidMiner 让用户可以安全放心地进行预测性洞察的挖掘。RapidMiner 让用户可以通过识别模式和输出更多可行动的预测完全地释放了大数据的价值。通过引导性的分析,RapidMiner 让它的用户可以运用来自 RapidMiner 社区25万多用户的智慧来建立预测性分析,缩短获得洞察力的时间。协作是我们在 RapidMiner 里做一切工作的中心。我们相信群体的智慧应该被分享,无论是在社区里或是企业中。

关键更新包括:

大数据

Apache Sentry
最新版的 RapidMiner Radoop 支持 Apache Sentry。该功能让用户可以控制对基于管理或功能角色的数据子集的访问。Sentry 是一个执行数据授权的实际标准,它让用户可以在行和列层面进行访问控制。

Apache Spark 机器学习库
RapidMiner Radoop 新增了一个基于 MLlib 的 Hadoop 线性回归算法-Apache Spark 的机器学习库。由于所有的模型都在 Hadoop 上以分布式方式被进行训练,线性回归模型的结果可以通过 RapidMiner 平台在 RapidMiner Server 上的内存中、在使用 RapidMiner Radoop 的 Hadoop 上或采用 RapidMiner Streams 的流数据中被无缝使用以及评估。

Splunk 连接器
RapidMiner 现新增了连接到 Splunk 的连接器,一个广受好评的、可以用做搜索、监测以及分析机器产生的数据的平台。数据通过连接器可被直接获取到 RapidmMiner Studio 进行深度分析。

企业

工作流程注释

RapidMiner 通过在 RapidMiner Studio 里面提供可视化注释来对工作流程进行注释,从而让协作更加容易。用户可以通过注释功能对作为一个整体的流程,流程的一部分甚至流程的单个步骤添加评论。

扩展性
RapidMiner Marketplace 与 RapidMine Studio 的集成更加紧密,用户通过一键点击即可下载扩展程序并安装到 RapidMiner Studio。

社区

新的 Python 和 增强的 R 集成
任何在 R 和 Python 里能执行的脚本都可以在 RapidMiner Studio 里面被执行,让数据科学家们和商业分析师们可以无缝集成 R 和Python , 以用于数据转化、模型建立和应用。

Mac 安装
由于几乎1/3的 RapidMiner 用户们都用 Mac 工作, RapidMiner 发布了一个单独的项目让 RapidMiner 在 Mac 上的安装更加容易。

软件开发包
通过新的开发包,建立扩展的流程从头到尾都变得更加容易。该开发包自带一个社区成员使用的快速开始的开发流程模版。

在 RapidMiner, 我们一直以来都认真倾听来自我们25万多用户的声音,并提供他们想要的东西。我为我们全球工程师和产品团队为壮大社区作出的辛勤劳动而骄傲。

期待能听到您们对这个激动人心的宣告的评论和反馈。

Ingo Mierswa

CEO, RapidMiner

;