​All in AI云基建,阿里云“不想在迟疑中错过”
创始人
2024-09-24 21:41:54
0

“新技术应用早期,渗透率比较低,大部分人会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。”

去年并未登台的阿里云智能集团董事长兼CEO的吴泳铭,在2024年云栖大会上,不仅分享了其这两年对AI行业的看法,也对外释放了阿里云要坚决投入AI云基建的决心。

吴泳铭表示,当前新增算力需求中,超过50%由AI驱动,而且规模持续扩大。“过去一年,阿里云投资新建大量AI算力,还是远远不能满足客户的旺盛需求。”阿里云会持续以前所未有的强度投入AI技术研发和基础设施建设。

在吴泳铭看来,现在仍处于AGI变革的早期:“生成式AI最大的想象力,绝不是在手机上做一两个新的超级App,而是接管数字世界、改变物理世界。”这意味着,几乎所有行业都需要性能更强、规模更大、更适应AI需求的基础设施。

围绕这些判断,阿里云宣布了一系列新动作,除继续全方位建设更有效率的AI大模型计算设施;还开源了性能逼近GPT-4o的大模型Qwen2.5,涵盖能用到多种场景的0.5B到72B参数规模的多个版本;以及再次大幅降价——Qwen系列主力模型降价85%,百万tokens价格低至0.3元。阿里云CTO 周靖人说,这些新动作会进一步刺激开发者和各行各业客户使用大模型的需求。

作为业内最早布局大模型和生成式AI技术的科技公司,阿里云在2023年4月发布首个大语言模型通义千问后,在2024年的云栖大会上,阿里云通义模型家族全新亮相,产业链不断完善,生态日益壮大,正成为行业新的风向标。

AI云时代需要硬件重构

相比传统的云计算,AI时代支撑大模型的云基建也发生了翻天覆地的变化,其中最明显的则是算力芯片从CPU时代转向GPU时代,这也会直接引发一系列的技术革新和挑战。

阿里云CTO周靖人就表示:底层硬件只是计算基础设施转变的一部分。AI 技术变革,触达计算体系的方方面面,是全栈、全系列的技术革命。

实际上,在AI大模型时代,要解决好GPU网络架构,系统存储调度,海量文件处理,都需要巨量的资金和资源投入,以亚马逊,微软云,谷歌和阿里云为代表的企业均进行了百亿级别的资金投入。

在云栖大会上,周靖人介绍了一批阿里云 AI 基础设施的升级:

磐久AI服务器可以支持单机16卡、显存1.5T,提供AI算法预测GPU故障,准确率到92%;

高性能网络架构HPN7.0可支持10万个GPU稳定互连,模型端到端训练性能提升10%以上;

CPFS文件存储的数据吞吐20TB/s,为 AI 智算提供指数级扩展存储能力;

人工智能平台PAI,可以实现万卡级别的训练推理一体化弹性调度,AI 算力有效利用率超90%。

对于AI云服务基础设施的价值,周靖人表示“云优化一点,大模型才能发展一点,模型发展到一定程度又遇到挑战,又需要云去升级。大家表面上看到的是一句 ‘AI 的基础设施’,但中间有很多重要创新。正是这些重要创新,才让大模型的训练、大模型的创新变成了可能。”

实际上,包括零一万物,百川智能等大模型企业都表示,阿里云为其大模型提供了大量帮助。

升级+降价,规模效应才是AI云的答案

搞好基建只是做到云服务提供商的起点,云服务作为一个规模效应极其明显的行业,如何获得大量客户基本决定了一家云服务商的生死,而在大模型时代,所有厂商似乎又回到了同一起跑线。

值得注意的是,阿里云早就意识到了这个信号,在去年的云栖大会上宣布了要做AI时代最开放的一朵云的战略,在2024年杭州云栖大会上,阿里云依然强调开放与生态。

阶跃星辰创始人姜大昕、月之暗面Kimi创始人杨植麟、生数科技首席科学家朱军的圆桌对谈被安排在大会上午的第二场演讲,仅次于在阿里巴巴集团CEO吴泳铭的演讲之后。而阿里云自身的通义大模型的发布则被安排在下午举行。

在云栖大会的展馆,月之暗面Kimi、百川智能、零一万物、智谱AI等大模型企业也位于主场馆的显著位置。

KIMI展台位于云栖大会主场馆核心位置

除了给与了合作伙伴们C位的待遇,阿里云在本次云栖大会也发布了一系列产品吸引更多的用户使用大模型基建。

周靖人昨天发布阿里最新的旗舰模型 Qwen-Max,称在多个数据集上的评测结果超过或接近 GPT-4o。同时,他们升级针对不同场景开发的大模型,比如数学领域的 Qwen-Math、编程领域的 Qwen-Coder、具备视觉理解能力的 Qwen-VL,以及生成图片的通义万相 Wanx,还新增视频生成功能。

阿里云是中国大模型开源力度最大的大型科技公司,开源战略仍在持续。据周靖人介绍,当前阿里云开源的 Qwen 系列大模型,下载量突破 4000 万,衍生出超过 5 万款大模型,成为仅次于美国 Llama 的模型群。

云栖大会上,阿里云开源最新的大模型 Qwen 2.5 系列,囊括 0.5B 到 72B 的不同参数版本。在周靖人看来,参数 3B 及以下的模型和能够理解视觉的 Qwen-VL,将能够扩大大模型的应用范围,前者能让大模型在终端硬件中运行,后者可以让硬件具备理解物理世界的能力。

在这些大模型的基础上,阿里云用两种方式把它们产品化,降低客户使用门槛:

一方面开发百炼平台,向企业客户和开发者提供大模型服务。百炼平台中内置提示词优化、检索增强生成(RAG)、模型微调等一系列工具,让那些对开发大模型应用有兴趣、有需求的客户,只在阿里云就能调用多种模型开发和部署产品。

“(客户)不需要关注模型背后的 GPU 资源,不需要去关注如何去拉几个模型。只需要一个简简单单的 API,就可以随心所欲调用模型。” 周靖人说。

阿里云还开发了各种面向个人消费者的大模型应用,比如辅助编程的通义灵码,辅助语音转写总结、阅读长文档、生成 PPT 等功能的多种 AI 助手。

阿里云扩大需求的另一个举措是持续降价。今年 5 月以来,中国的大模型公司开启一轮价格战。当时阿里云把对标 GPT-4 的 Qwen-Long API 输入价格降到 0.5 元 / 百万 Tokens。现在阿里云再次降价,幅度达到 85%,同时给新用户赠送 5000 万免费 tokens 和 4500 张图片生成用量。

“相对未来庞大的应用来说,今天的价格还是还太贵了。大量开发者无法有效、大规模使用。” 周靖人说,只有降低价格,才能推动 AI 应用爆发。

过去两年,阿里云还在持续搭建开源模型社区魔搭,目前已经上架上万款各类开源模型供开发者下载,开发者数量超过 690 万。

周靖人说,当前一共有 30 万企业客户接入了通义大模型。其中不仅有对大模型更热情、大众容易感知到的移动互联网客户,如微博、携程、喜马拉雅等;还有饮料公司三得利(中国),以及中国一汽、联想、OPPO 等制造业公司。也有一些公司与阿里云合作建设智算中心,训练大型 AI 模型,如阿里云透露,阿里云与小鹏在乌兰察布合作建设的数据中心,2022 年以来,规模已扩大了 4 倍。

普通人也能玩转AI

值得注意的是,在AI时代,阿里云也在努力降低大模型门槛,让每个人都可以玩转AI,编程能力不再成为阻碍人们使用AI的门槛。

在本次云栖大会上,通义大模型家族重要成员——模型应用,则扩展到通义灵码、实时记录、阅读助手、PPT创作、翻译助手、语音通话等不同的应用,服务更多企业和用户。

作为阿里云大模型的一大应用,通义灵码于 2023年首次亮相。它是智能编码辅助工具,可生成和续写代码、生成单元测试、优化代码与注释、进行研发问答及排查异常报错,提升开发效率与代码质量。

目前市场上的AI辅助编码工具不少,如GitHub Copilot、Code GeeX、Bito、Amazon Code Whisperer等,可生成代码、添加注释、创建测试用例等,提升开发效率。

而阿里云的通义灵码进入Gartner首个AI代码助手魔力象限,成为唯一进入挑战者象限的中国科技公司。

在2024杭州云栖大会上,阿里云通义灵码完成升级,从以前只能完成基础的辅助编程任务,进化到用自然语音就能完成需求理解、任务拆解、代码编写、修改BUG、测试等开发任务,最快几分钟可从0到1完成应用开发,提升数十倍开发效率。

全新升级的通义灵码模拟了人类程序员的能力,可完成更复杂、更全面的任务;可以脱离专业IDE软件,在Web端直接执行缺陷修改、需求分析、代码实现、问题排查等任务工作流,兼具架构师、开发工程师、测试工程师等多种岗位技能,大幅缩短了应用的开发周期。

在应用上,通义灵码已入驻中华财险、哈啰集团、长安汽车等公司,累计生成代码超10亿行,广泛应用于金融、制造、互联网、交通、汽车、能源等行业,是国内最受欢迎的辅助编程工具。

阿里云表示,未来只要有创意,不懂代码也能开发应用和软件。

云栖大会展馆和产品演示中,AI辅助编码的示例屡见不鲜。一位13岁的中学生在通义灵码上输入几句话,2分钟就生成了一个python~A语言编写的倒计时网页。

还有参会者,用通义灵码修改开源魂斗罗游戏代码,在9个代码文件2000多行代码里,几分钟就精准修改了游戏角色的生命值、跳跃高度等参数。

云栖大会自2009年以来已连续举办15届,始终站在云计算发展的前沿,见证中国云计算发展三次浪潮的每个重要时刻。

在第一届云栖大会举办时,国内对于云计算尚未形成共识——不乏有互联网、科技公司高管抛出 “云计算是新瓶装旧酒”“还需要很长时间才能普及” 或者 “私有的算力中心才是重点” 的论断。而正是阿里云持续不断的早期大额投资,最后才抓住了移动互联网时代的机遇,一举占据了中国云市场的头把交椅。

十五年后的云栖大会上,吴泳铭在展望AI时代的前景时表示:“从历史经验来看,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们的个人经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但它会在你的怀疑中成长,在你在迟疑中错过大趋势。站在AI时代浪潮的开端,我感到无比兴奋。”

如果如其判断,等到生成式 AI 应用爆发,作为基础设施供应商的云计算公司显然会从中获得更多收入。ALL in AI的阿里云未来会如何,值得我们拭目以待。

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
邓宏魁、张涛、李亚栋、孙斌勇获... 出品 | 搜狐科技 作者 | 周锦童 8月16日上午10时,2024未来科学大奖新闻发布会在北京、香...
小米14T Pro海外定档9月... 【ITBEAR】9月23日消息,小米今日在X平台上宣布,旗下新款手机小米14T Pro定于9月26日...
华为发布ICT人才实训解决方案... [中国,上海,2024年9月19日] 华为全联接大会2024期间,在以“助力ICT人才培养,共赢数智...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
微波传输赋能空管保障联合创新实...   鲁网9月30日讯近日,济南联通与民航山东空管分局共同开展双路由光缆中断后的微波系统保护演练,系统...
湖南各地广泛开展“传承红色基因... 为庆祝中华人民共和国成立75周年,湖南各地积极组织开展“传承红色基因·向国旗敬礼”主题实践活动,引导...
我国成功发射首颗可重复使用返回... 记者从国家航天局获悉,9月27日18时30分,我国在酒泉卫星发射中心采用长征二号丁运载火箭,成功发射...
原创 首... 9月20日iPhone 16系列正式开售,当天预订的用户已经可以拿到新机。现在很多第一批购买的朋友都...
抖音老阳分享的Temu项目是真... 近年来,随着社交媒体的发展,抖音成为了许多人获取信息和进行消费的主要平台。其中,抖音博主老阳分享的T...