纵深与横向,亚马逊云科技如何扩大自己的云服务版图?

原创
2021/12/17 10:29
阅读数 921
AI总结

亚马逊云科技 reInvent 2021 刚刚结束,今年的大会以“探路者”为主题,系统性地回顾了亚马逊云科技15 年来在云计算领域的探索之路,同时发布了多项创新成果。

我们把本次大会的内容重点分为两个方向来看,可以一窥这家云服务巨头在云计算领域纵横多年的发展基石。

突破云服务纵深极限

15 年以来,亚马逊云科技(Amazon Web Services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过 200 项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面。在这些丰富的云服务实例背后,离不开亚马逊云科技多年来对用户需求的敏锐发掘,以及其在软件和硬件方面的持续创新和大力投入。

拥抱开源持续创新

云计算的诞生源于互联网基础设施的进化,分布式系统模型的诞生为算力带来了前所未有的可伸缩性,也为风靡全球的 SaaS、IaaS 等云服务提供了技术基础。而这些技术核心的基础软件,都离不开来自开源社区的贡献。

从 2006 年提供第一个云服务开始,亚马逊云科技一直是开源社区的重要参与者和支持者,贡献涵盖代码、运营、基础等诸多方面。作为一家云服务厂商,亚马逊云科技为了给开发者提供符合其习惯的开发工具与服务,积极致力于以技术助力开源社区的蓬勃发展,采用“上游优先”的策略,为 Linux,Xen,Kubernetes,Redis,Rust,Redis,GraphQL,ROS 等开源社区贡献了大量的代码,涵盖错误修复、安全性、可伸缩性、性能和功能增强等方面。

与此同时,亚马逊云科技还与包括 MongoDB、Databricks 和 Redis Labs 等在内的领先开源 ISV 合作,为其构建和优化云服务,同时参与到这些客户发起的多个开源项目之中,帮助开发者更容易地从专有技术转移到开源技术并作出贡献。

Redis 联合创始人兼首席技术官 Yiftach Shoolman 称赞亚马逊云科技为该开源商业公司提供的最新实例:“我们非常高兴看到,全新低延迟 Amazon Nitro SSDs 的 Amazon EC2 I4i 实例提供比上一代实例更快的交易速度。我们预计 I4i 实例更强的存储性能和更快的网络和处理器速度将为我们那些基于 I4i 实例使用 Redis-on-Flash 的客户带来显著改善,获得更具吸引力的 TCO。”

通过积极参与开源社区,与原生开源厂商合作的方式,亚马逊云科技得以提供超过 200 项包括各主流开源软件功能在内的丰富服务,惠及全球开发者。

自研硬件提升核心竞争力

另一方面,为了帮助自身和客户实现降本增效,亚马逊云科技在硬件方面也有很大的投入。

近年来,云服务厂商自研芯片成为了一大趋势,国内的头部云厂商也开始纷纷跟进,例如华为云的鲲鹏系列芯片,阿里云的倚天系列芯片等。亚马逊云科技可以说是最早开始自研服务器芯片的云服务厂商。早在 2013 年,亚马逊就开始推出三大自研芯片产品线,包括承载网络和安全功能的 Nitro 系列,基于机器学习推理和训练的芯片产品线 Inferentia 以及基于 ARM 架构的 CPU Graviton 系列。

2018 年,亚马逊云科技发布了第一代 Amazon Graviton 处理器,支持该处理器的 A1 也成了其云服务上第一个基于 Arm 的实例。第一代 Graviton 处理器基于 ARM Cortex-A72 内核,最大时钟频率达到 2.3 GHz,可降低 45% 的成本使其成了很多入门用户的首选。

2020 年,亚马逊云科技发布了第二代自研处理器 Graviton2,这款处理器基于 64 位的 Arm Neoverse N1 内核,加入了很多针对基础设施工作的强化特性。Graviton2 采用了台积电的 7nm 制程工艺,集成了 64 颗核心,300 亿个晶体管。相较于第一代 Graviton 处理器,Graviton2 提供了 4 倍的计算核心,7 倍的计算性能。基于 Graviton2 的实例与同等级的 x86 实例相比,性能要高上 40%,成本却要低上 20%。

而亚马逊在今年的 Re:Invent 大会中发布的 Graviton3 搭载 500 亿个晶体管,比 Graviton2 的性能快 25%,并在科学计算、生物工程、深度学习等 HPC 场景进行了深度优化,获得更大的性能提升。据介绍,针对科学类的计算负载,Graviton3 的浮点运算性能比 Graviton2 提升高达2倍;在加密相关的工作负载,如产生密钥加密、解密,这部分性能比 Graviton2 会提升 2 倍;针对机器学习负载,则可以提升高达 3倍。在能耗方面,搭载 Graviton3 CPU 的实例相比能够提供同等计算性能的其它 Amazon EC2 实例,可以减少多达 60% 的能源消耗。

谈及亚马逊在自研芯片方面的创新与突破,亚马逊云科技大中华区产品部计算与存储总监周舸表示,在过去的 20 年里,业界提升 CPU 性能主要有两个方向,第一是提高频率,第二是增加内核的数量。而亚马逊云科技在单芯片晶体管有限的情况下,充分利用积累下来的大量客户使用经验,在增加内核数量的同时也增加 CPU 内存的带宽和降低它的延迟,使两个方向的提升达到平衡,从而达到最佳的芯片优化效果。

除了自研处理器外,亚马逊云科技还在本次大会中推出了最新的自研机器学习训练芯片 Amazon Trainium 以及自研固态硬盘 Amazon Nitro SSD,并基于这些自研硬件都推出了对应的实例,在硬件层面进一步巩固了自身的核心竞争力。

拓展云服务横向边界

除了在软件和硬件研发领域投入大量资源,深入挖掘客户需求,提供最全、最深的云服务体验之外,亚马逊云科技也利用自身积累多年的资源优势,致力于横向拓展云服务的边界,让云服务覆盖到更广泛的场景和更多的用户。

开拓云服务覆盖场景

作为全球覆盖最为广泛的云服务商之一,亚马逊云科技基础设施遍及 25 个地理区域的 81 个可用区,并计划新建 9 个区域和 27 个可用区,有 14 个本地扩展区域、17 个 Wavelength 区域,有 108 个 Direct Connect 光纤直连站点,有 310 个边缘站点和 13 个区域缓存站点。

亚马逊云科技利用自身庞大的资源将云服务横向扩展,从覆盖国家的中心 Region,到服务城市级的 Local zone,再到现场部署的 Outpost,提供全方位的云服务。在今年的大会中,亚马逊云科技发布了新产品 Cloud WAN,该产品可以帮助企业实现总部、分支、云上 VPC 的互连,实现区域内的统一网络管理、监控。

周舸介绍,Cloud WAN 服务使客户能够就近接入到亚马逊云科技的接入点,无论是企业的办公室还是工厂等各种不同的站点,一旦接入以后,可以通过整个亚马逊云科技的 Cloud WAN 服务,部署一个企业私有的软件定义网络,用户可以在一个中央的控制面板上控制自己的一切,包括网络里的分层、QoS 等。而通过亚马逊云遍布全球的强大资源,可以让客户在全世界任何地方接入这个专有网络系统,享受亚马逊云服务带来的强大便利。

“我们和很多合作伙伴在配合,包括很多 SD WAN 的供应商,他们可以把他们已经在部署的 SD WAN 接入到 Cloud WAN,继续衍生。很多电信运营商也会把他们的基础骨干网接入进来,继续衍生。很多集成商和服务商会帮助企业更容易的完成部署,实现私有网络的建构和管理。”周舸说。

据了解,目前已有 Cisco、Aruba、Fortinet、Paloalto 等头部网络安全基础设施厂商与亚马逊云科技达成了合作,实现云上、线下网络的统一管理,无限拓宽云服务的边界。

降低云计算使用门槛

另一方面,亚马逊云科技近年来也在不断致力于降低云计算的使用门槛,让更多的人体验到云服务带来的便利。

IDC 中国助理研究总监卢言霞指出:“在大数据方面,亚马逊云科技在数据融合、统一治理等方面帮助用户管理数字化旅程,并加速将机器学习和人工智能加入到数据旅程。在机器学习方面,发布了 Amazon SageMaker Canvas,无需代码,通过简单点击即可完成整个机器学习工作流,值得没有技术背景的分析师,以及聚焦业务分析层面但希望实时数据洞察的分析人群关注。”

新发布的 Amazon SageMaker Studio Lab 是一项免费、无需配置的服务,开发者、学者和数据科学家,只要有创新的想法,立即就可以动手实践机器学习。它也让客户将能够专注于实践机器学习与数据科学,无需设置或配置任何环境与机器。

为了将机器学习能力交到更多的人手中,亚马逊云科技还将通过 DeepRacer 冠军杯赛、培训与认证、机器学习大学、机器学习纳米学位等项目,计划到 2025 年全球培训 2900 万人。

亚马逊云科技也宣布了 1000 万美元亚马逊云科技人工智能和机器学习奖学金(Amazon AI & ML Scholarship),用于奖励全球范围内弱势群体和服务设施欠缺地区的学生,帮助他们做好准备,在未来从事机器学习相关工作。

结语

随着全球云服务市场格局逐渐成型,存量市场竞争日趋激烈。亚马逊云科技凭借先发优势不断深挖市场客户的需求,在云服务的纵深方向上不断推陈出新,以海纳百川的姿态融合最新前沿技术,为广大客户、开发者以更低的成本提供更丰富的服务;与此同时,亚马逊云科技也通过自身庞大的物理资源优势,将云服务的横向边界不断拓宽,开拓出更广阔的市场空间,让更多的用户群体和更多的场景能够获得云计算带来的技术红利。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
1
分享
AI总结
返回顶部
顶部