云计算新十年,重塑计算体系

作者 | 陈法善 2022-11-11

「核心提示」

云计算正在改变IT硬件和终端设备。

作者 | 陈法善

编辑 | 刘杨

云计算来到了新关口。

在刚刚结束的2022杭州云栖大会上,阿里云智能总裁张建锋表示,历经十多年的发展,云计算带来的变革依然被严重低估,它正在重构整个IT软硬件和终端世界,形成一个全新的计算体系。

在过去很长一段时间里,IT产业的快速发展长期依赖于芯片技术的升级迭代。在摩尔定律的铁律下,整个社会的算力飞速增长,并推动了PC互联网和移动互联网的普及。

而现在,云计算正在改变游戏规则。过去十年,云计算逐渐成为IT软件和硬件技术的定义者,从操作系统到数据库,再到终端、芯片,一个以云计算为中心的IT计算体系正在形成,为整个社会输送智能、高效的算力。

1、触云生智

2022云栖大会现场,国产车企红旗,展示了一条等比例缩小的真实生产线。

红旗展示的等比例缩小的生产线

这条产线由阿里云、机械九院共同参与研发,在线下,共接入上百万个数据采集点,在线上,则通过数字孪生、云计算、人工智能技术,进行设备预测性维护、产品质量监测,提高了产线运转效率。

例如,通过国产自研的数据采集与监控平台,算法帮助焊装车间将焊点合格判定准确率提升到了97%,涂装车间的空调能耗节约了9%,漆膜质量预测准确率提升到91%。

同时,所有信息汇总到“云钉一体”平台,让公司决策层、各部门实时了解产线运转情况。任何设备出现异常,都会通过钉钉提醒相关责任人,设备维修更及时。钉钉低代码开发是一汽红旗工厂的一大亮点。钉钉上的制造业看板,让每个人可以实时在手机上就看到生产计划、经营数据等,数据反哺决策更及时。

红旗并不是孤例。在2022云栖大会同时参展的,还有上汽、小鹏、腾势等众多车企。车企上云,已是大势所趋。

阿里云副总裁、汽车&制造行业总经理李强观察到,车企的数字化是一件非常难的事,营销、制造、研发等部门相互“打架”的情况时有发生。“当我们把这几个部门放到‘云’上,就帮车企打造了让数据流转做决策的能力,而不是靠一些人为的协调。”

经过两年多实践和迭代,目前阿里云已服务国内超过70%的汽车企业,小鹏、一汽、吉利、长城、长安、地平线等均已上云,参与云端改造的主机厂、上下游供应商超过400家。

本届云栖大会,升级的“汽车云”首度亮相。阿里云在研发、制造、流通三个业务场景形成了“自动驾驶云”“智造云”“营销云”解决方案,提供“产研供销服”全生命周期的技术支持。

当初,特斯拉的创业团队主要来自硅谷,用IT理念造车,而不遵循以底特律为代表的传统主机厂的思路,被解读为硅谷正在抢底特律的蛋糕。如今,阿里正用“云”帮车企转型升级,一起把蛋糕做大。

被阿里做大的蛋糕远不止这一块,千行百业正因云而变。

在长江三峡,阿里云用数字孪生技术参与长江治理,让雨雪冰雹、白昼黑夜全天候可把控,将防洪抗旱的分寸拿捏从依靠经验变成了精准调节,有力守护长江两岸的万家灯火。

在宁波梅山港,阿里运用边缘云计算能力,持续优化码头装卸效率,每年将至少提升码头5%的装卸能力。

在北京,阿里云参与解决城市交通拥堵、监测大气质量、进行垃圾分类等智慧城市建设,仅在试点路段,就将单个红灯等待时间平均下降10%以上,帮助居民“少堵10分钟”。

2022云栖大会上,阿里巴巴董事会主席兼首席执行官张勇表示,如今云计算已经成为全社会普惠、绿色发展的重要基础设施。

2、因云而生

在阿里云智能总裁张建锋看来,历经十多年发展,云计算带来的变革依然被严重低估,它正在重构整个IT软硬件和终端世界,形成一个全新的计算体系。

全新的计算体系,回应的是全新的算力需求。比如自动驾驶的发展,就对云计算的算力提出了更高的要求。

汽车正从过去拼马力,过渡到拼算力。据行业专家预测,当前新车中L2、L2+的辅助驾驶渗透率已超过20%,预计到2025年,每卖出10辆车,会有7-8辆搭载L2+的自动驾驶系统。智能化是汽车业百年大变局的一个重大机遇。

自动驾驶对算力的要求非常高,所需的投入也最大,上云成了提高自动驾驶研发效率的重要手段。李强介绍,一个汽车的自动驾驶团队,对云的消耗如果是10块钱,算力大概占6块钱,存储占3块钱,网络占1块钱。当算力、存储效率提升后,钱就花在了刀刃上。

今年8月,阿里云与小鹏汽车合建了自动驾驶智算中心,将自动驾驶模型训练提速近170倍。基于飞天智算平台,资源虚拟化利用率提高3倍,存储吞吐比业界20GB/s的普遍水准提升了40倍,模型训练部署、推理优化等AI工程化工具也让开源框架训练性能提升了30%以上。

业内普遍认为,自动驾驶水平每提升一个级别,车载算力需求将提升一个数量级,而训练研发所需算力则要提升两个数量级。目前,小鹏汽车、吉利汽车、路特斯、长城汽车、上汽集团都基于“自动驾驶云”加速自动驾驶的模型训练,降低训练成本。

算力大幅跃升,除了依靠算法,还依赖更强的芯片。只有通过软件硬件一体化的创新,才能进一步挖掘整体的算力能力和效率,于是,“云+芯片”应运而生。

在2022云栖大会上,阿里云智能总裁张建锋表示,阿里首款“为云而生”的芯片倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。

在2021年双11期间,天猫“双11”核心交易系统已平滑迁移至倚天710。未来两年,阿里将继续扩大自研CPU的部署规模,对倚天710委以重任,预计两年内20%新增算力将使用自研CPU芯片倚天710。

倚天710的大规模部署,不仅支撑了阿里核心电商业务,还向汇量科技、智能手机和互联网等多家企业提供服务。例如,在使用倚天710后,汇量科技广告推理业务性能和网络带宽双双提升,性价比提升40%以上。

汇量科技首席人工智能官朱小强表示:“随着在线推理模型不断升级,我们对CPU性能和内网带宽要求更高,倚天710云实例满足了我们业务升级的需求,实现了降本与增效。”

过去十三年,阿里云在操作系统、数据库、存储、网络和芯片等技术领域持续深耕并取得一系列重要成果,已成为国内唯一一家拥有完整自研软硬件技术体系的云服务商。云计算与芯片的全自研,再次放大了阿里云的科技想象力。

“云计算的发展进入了全新的阶段,未来十年,软硬件一体化的自研计算体系是云服务商的立身之本,只有在核心技术和产品的研发上持续创新才能抢占定义权。”张建锋说。

3、云生万物

在上述数字工厂、电动汽车的实例中,万物互联、智能感知是联通全局的关键因素。端云一体,正照进现实。

万物互联也为新的芯片架构的成长提供了沃土。此前,X86架构在PC时代独领风骚,ARM架构称王移动互联,如今,开源架构RISC-V凭借架构灵活、易于定制、可扩展性高等特点,有望与前两者三分天下有其一。

2018年,阿里平头哥研发其首款RISC-V芯片玄铁E902,随后“玄铁家族”不断发展壮大。在2022云栖大会上,阿里平头哥发布了全新的RISC-V高能效处理器玄铁C908。平头哥副总裁孟建熠表示,玄铁C908较业界同性能处理器能效提升超20%,特别是在AI加速性能方面,嵌入式系统推理性能较同类产品最优性能提升2-3倍。

据悉,嘉楠科技已与平头哥围绕C908展开合作,相关中高端立体视觉AI芯片解决方案预计于明年上市,可广泛用于智能家居硬件、智能辅助驾驶、机器人感知、智能教育硬件等领域。

目前,“玄铁家族”已推出C、E、R系列,在工业控制、车载系统、智慧视觉、5G、智慧交通、智能交互、多媒体终端等有广阔的应用前景。

随着高性能RISC-V芯片的不断成熟,预计将覆盖3亿多智慧视觉、1亿多智能交互、5000多万多媒体终端设备。

张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。

例如,Rokid在推出的AR眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有85克重量的眼镜,就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做3D渲染、大数据编程等复杂工作。

Rokid推出的AR眼镜

在PC电脑端,阿里云也继续将RISC-V芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。

放眼全球,RISC-V成了云计算巨头圈地跑马的一致目标。2021年3月,亚马逊决定支持RISC-V,以探索用新架构的更多可能性。据行业专家分析,亚马逊云数据中心服务器芯片、Alexa Echo扬声器和Kindle电子书中使用的Arm芯片,都是RISC-V的机会。

在平头哥的强力推动下,谷歌安卓也已开放对RISC-V的官方原生支持。在孟建熠看来,RISC-V兼容谷歌安卓后,无疑会吸引更多厂家参与,社区生态会更活跃,“之前更像是在场外热身,如今是进入了更大的赛场正式比赛去了。”

巨头间的竞争与合作,为阿里探索新技术提供源源动力。张勇直截了当地指出,先进性要在竞争中获得,在你追我赶中获得。

目前,阿里云在计算、存储、网络、安全四项核心技术上,取得全球第一,市场占有率全球前三、亚太第一。而在RISC-V国际竞赛中,阿里正领导RISC-V国际基金会数据中心、存储管理、安全等11个技术方向,推进RISC-V国际标准的制定。

阿里巴巴董事会主席兼首席执行官张勇

正如张勇所说,对技术先进性持之以恒的追求是阿里从过去走到现在,并且更好地走向未来的基石。

“更先进的技术是为了承担更大的责任,技术的不断演进让我们有能力为社会经济发展和人们的美好生活作出更大贡献。”张勇说。