大模型从卷价格走向卷性能
创始人
2024-09-25 14:20:48
0

字节跳动正式宣布进军AI视频生成。9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

火山引擎总裁谭待说,“在我们努力下,大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能,卷更好的模型能力和服务。”

谭待表示,视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。

此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

据介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法还攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性。

经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和。深度优化的Transformer结构,大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。

目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。剪映和即梦AI市场负责人陈欣然认为,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,即梦AI希望成为用户最亲密和有智慧的创作伙伴。

此次,豆包大模型不仅新增视频生成模型,还发布了豆包音乐模型和同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。

据火山引擎披露,截至9月,豆包语言模型的日均tokens(文本中的最小单位)使用量超过1.3万亿,相比5月首次发布时增长十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

此前,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大规模应用,大模型支持更大的并发流量正在成为行业发展的关键因素。

据谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,还可根据需求灵活扩容。(经济日报记者 黄鑫)

相关内容

热门资讯

华为发布ICT人才实训解决方案... [中国,上海,2024年9月19日] 华为全联接大会2024期间,在以“助力ICT人才培养,共赢数智...
微波传输赋能空管保障联合创新实...   鲁网9月30日讯近日,济南联通与民航山东空管分局共同开展双路由光缆中断后的微波系统保护演练,系统...
湖南各地广泛开展“传承红色基因... 为庆祝中华人民共和国成立75周年,湖南各地积极组织开展“传承红色基因·向国旗敬礼”主题实践活动,引导...
我国成功发射首颗可重复使用返回... 记者从国家航天局获悉,9月27日18时30分,我国在酒泉卫星发射中心采用长征二号丁运载火箭,成功发射...
华为Mate XT刷屏,东莞走... 华为Mate XT刷屏,东莞走到台前。 在Mate XT发布之际,东莞发布“骄傲”地宣布:火爆全网的...
“解码未来:全球数智趋势”专题... 中新网上海新闻9月26日电(记者 姜煜)“解码未来:全球数智趋势”专题论坛25日在上海浦东成功举办。...
大跳水!华为三折叠手机黄牛价暴... 来源:科技新知V 华为首款三折叠手机Mate XT上市初期受到黄牛热炒,但由于实际需求不足和定价过...
西南油气田:智能化建设推动气田... 7月24日,西南油气田铁山坡智能气田建设项目经中国石油专家组评审,以综合评价为“优”的成绩顺利通过验...
荣耀品牌手机哪款性价比高质量好... 大家好!在智能手机的浩瀚星空中,荣耀100与荣耀200无疑是两颗璀璨的明星。今天,我们就来聊聊这两款...
华为与威努特正式签署鲲鹏全面合... [中国,上海,2024年9月19日] 在华为全联接大会2024(HUAWEI CONNECT 202...