亚马逊推出三大机器学习云服务,AI成为云计算之战天王山
亚马逊一直在其零售业务中使用深度学习和人工智能来提高客户体验。该公司声称,它有数千名工程师专门从事人工智能相关开发,以改善搜索、物流、产品推荐和库存管理。亚马逊现在正在将相同的专业知识带给云,展示了开发人员可以用来构建智能应用程序的API。被称为 “亚马逊AI”的新服务提供了强大的AI功能,如图像分析,文本到语音转换和自然语言处理。
直接提供AI Saas服务,亚马逊与谷歌的云之战
云计算是企业计算的未来,而云计算的巨人是一家从未有人想到过的公司——亚马逊。
那还是在谷歌和微软为了办公软件彼此掐架的那一年,亚马逊推出了 Amazon Web Services(AWS),AWS 体现出了亚马逊这家公司的本身:它具有很强的可扩展性和清晰定义的强化接口。用户——首先是亚马逊自己,然后是世界各地其他公司——可以使用“原语”(primitives)并将其混搭,从而构建一个更高效、可扩展并且安全的后端,这是几乎任何一家公司靠自己都无法建立的。
AWS 的产品现在已经远远不止(虚拟)处理器、硬盘驱动器和数据库等基础架构,其成功的基础是亚马逊“纯平台的方法”:它们为企业提供了几乎任何企业想要的东西。
另一方面,谷歌则是一家产品公司;实际上,谷歌常常被作为苹果的对手——区别是前者提供的是服务,后者提供的是产品——没有人把谷歌真正视为一家平台公司。但是,当你把产品定义为“为终端用户提供的最终解决方案”时,你就会发现亚马逊跟谷歌实际上十分相似。
产品公司和平台公司的区别是很大的,前者无论是提供智能手机还是搜索引擎,都需要拥有极高的用户体验和设计,其后端工程理论上是不为终端用户所见的。
但是,亚马逊还有微软这两家 IT 时代的卓越平台公司,采取的恰好是与此相反的模式:没有集成多个部件交付最终产品,AWS 将构建后端服务的所有部件分解为完全模块化的部件;在这方面微软对其 Win32 API 的做法也一样。是的,这意味着在设计上 Windows 的最终用户体验比 Mac OS 更糟糕,但 Windows 更强大、更具可扩展性,就靠这一个方法,Windows 拥有数以百万计的商用App,甚至在今天也仍然处于操作系统的中心。AWS 为后端服务做了与此完全相同的事情,AWS 的灵活性和模块化是它击败谷歌 2008 年推出的最初的云产品 Google App Engine的主要原因。使用Google App Engine,你必须接受大量谷歌代你做出的决定;而使用 AWS 让你能构建自己真正所需要的东西。
现在,机器学习将越来越多地被云服务所主导:两者都涉及处理可扩展的和大量的数据,只有极少数的巨头才拥有巨额资金,不仅建立所需要的基础设施,并且雇用世界上最好的机器学习工程师。这就意味着,对于大多数企业来说,机器学习所产生的差异,首先取决于他们的数据是否在云中(当然也会有内部部署的解决方案,但预计随着时间的推移,内部部署会越来越落后),其次就是它们选择哪家云服务供应商。
优秀的机器学习产品不仅可以作为一项差异化,而且是可持续的:更好的机器学习将吸引更多的客户,从而获得更多的数据,而数据是机器学习不断改进的燃料。正因如此,拥有海量数据的谷歌是AWS在云计算中的最大威胁。
谷歌的巨大优势是,这家公司在近二十年的时间里已经使用了大量的数据,并在过去几年开发了功能强大的机器学习算法。尽管如此,数据仍然是最重要的,最好的证据是去年,谷歌开源了TensorFlow——谷歌意愿与世人分享它的方法和知识产权,从侧面表明谷歌拥有优越的数据和信息处理基础设施,而这些都是可持续的优势。
就在感恩节之前,谷歌发布了一系列产品公告,明确利用其数据优势:
Cloud Natural Language API,能够使用机器学习分析文本
Cloud Translation API 的高级版本,使用机器学习,大幅提高了 8 种语言翻译的准确性(相比支持超过100种语言的标准版本性能要高级很多)
使用机器学习分析图像的 Cloud Vision API 大幅降价
新的Cloud Jobs API,使用机器学习将职位与潜在员工匹配起来
谷歌花了很多年的时间磨炼其算法,因此在将这些算法应用于企业数据集时,其结果非常可能得到更好的结果,或者至少远远低于训练时的漏洞。我认为这一优势将持续下去,并且影响巨大。
尽管如此,谷歌仍然需要做更多的工作,这也是为什么谷歌要挖来李飞飞和李佳,让她们带领新成立的云端机器学习小组:这个小组将负责开发新的商用机器学习API。换句话说,其任务是将谷歌的机器学习功能产品化。
这一点显示了谷歌在战略上的精明:谷歌在第一波云计算时显然落后于亚马逊,因为当时成功取决于哪家公司有最好的平台;通过开源Kubernetes,谷歌正在试图将竞争平面转向产品。毕竟,改变竞争规则通常比改变公司的根本性质更容易。
谷歌的成功并不确定:该公司不得不面对“销售vs广告”的新业务模式,并建立一个不仅对销售,而且对整个企业的支持必不可少的组织。这些都是亚马逊占优势的领域,亚马逊还有一个相当规模的的合作伙伴生态系统和更大的特征集。
当然,AWS 还有自己的机器学习 API,类似 IBM 和微软。微软可能在这方面更强:不仅公司内已经在这方面有了多年的研究,而且也有产品化的经验。谷歌长期以来的“消费者焦点”有时也会是障碍,而且谷歌也还不使用自家产品。
不过,谷歌将是强大的竞争对手:其战略相当合理,而且更重要的是,其开发新业务的想法相比10年前更显急切。最重要的是,云计算仍处于刚开始的阶段,虽然亚马逊似乎已经走出了挺远,但未来仍然是未来。谷歌将如何改变未来的规则,让我们拭目以待。
亚马逊三大人工智能产品
这个新平台将把亚马逊多年来在其内部开发的许多机器学习应用开放给外部开发者。当前,该服务提供了三种工具,但未来还将增加更多工具。
亚马逊公司 CEO Andy Jassy 强调说,亚马逊本身在机器学习方面已经深耕多年,“我们公司内已经做了很多 AI 的研究,”他说:“我们上千名专注于 AI 的研发者。”
亚马逊 AI 平台推出的这些新服务中的第一个是名为“Rekognition”的图像识别服务。该服务类似于谷歌、微软等公司的同类服务,能够识别图像中的物体和场景。亚马逊强调它的系统非常智能,例如能够识别图像中狗的品种。虽然很厉害,但其他竞争对手公司也能做到。Jassy 说这项服务很有成本效益,但他没有公布价格。
第二个是名为“Amazon Polly”的语音合成服务,该服务同样使用了机器学习技术。Jassy 指出,Polly 能合成非常生活化的语言,说“Polly 专门为语音合成中的非常具有挑战性的方面而设计,例如,‘I live in Seattle’和‘Live from New York’,这两句话中‘live’虽然拼写相同,但发音不同,而 Polly 能理解这些并正确发音。”Polly 支持24种语言,有47种声音,包括男声和女声。
第三个新服务,也是最重要的一个,名为“Lex”。Jassy 说,Lex 本来是支持亚马逊自己的 Alexa 服务的技术,能用于构建具有多步对话功能的聊天应用。开发者可以在 Lex Console 上设计对话,仅用几个对话样本即能训练聊天机器人。
Lex 与 Lambda 以及其他 AWS 的服务深度集成,而且也有与其他一些企业服务的接口。此外,它还与 Facebook Messenger、Slack 和 Twilio 集成,使得它不局限于亚马逊自己的设备,能够嵌入其他任何设备中。
亚马逊在今天的发布中说:“Amazon Lex 可以用来构建聊天机器人(chatbots)以及其他形式的网页/移动应用,支持非常生动的、生活化的互动。”“建成的聊天机器人能够为用户提供资讯、管理应用程序、简化工作、甚至能作为机器人、无人机、玩具等的控制程序。”
投资MXNet
亚马逊还投资了MXNet,这是一个可在各种环境中运行的深度学习框架。除此之外,亚马逊还在优化EC2图像,以运行流行的深度学习框架,包括CNTK,TensorFlow 和 Theano。
关于这件事,MXNet的创建成员之一李沐不久前在知乎上写道:能够让AWS放弃自己造的轮子,并且明确的表示会支持一个主要由开源社区开发的系统,其实非常不容易。对于AWS来说,最关心的是用户体验,然后是买资源赚钱。这里最保险的是支持所有流行的DL框架。但AWS能够强调说未来会大力投入MXNet,主要是对框架的发展前景和小伙伴们工作的肯定。
MXNet最早就是几个人抱着纯粹对技术和开发的热情做起来的兴趣项目,既没有指望靠它毕业,也没想着用它赚钱。能够一步一步慢慢的扩大,我觉得最重要的是每个小伙伴对这个事情的投入,和抱着降低深度学习门槛的使命。也是让大家只需要关心“数据量和运算量”,而不是如何有效实现利用硬件;只需要“数学公式写好,根本就不想知道你支持哪些layer,分别是干什么的”,不用管自动求导如何训练;只需要“把手上的数据交出去给云即可,然后花钱租算力”,而不是云上如何管理如何优化。
欢迎加入本站公开兴趣群
软件开发技术群
兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流
QQ群:26931708
Hadoop源代码研究群
兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop
QQ群:288410967