AMD 推出自家首款小语言模型“Llama-135m”
创始人
2024-09-29 20:00:45
0

IT之家 9 月 29 日消息,AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,IT之家附模型地址如下(点此访问)。

据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升

AMD 表示,这款模型在四个 AMD Instinct MI250 节点训练了六天,其“编程专用版本”变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。

相关内容

热门资讯

华为发布ICT人才实训解决方案... [中国,上海,2024年9月19日] 华为全联接大会2024期间,在以“助力ICT人才培养,共赢数智...
微波传输赋能空管保障联合创新实...   鲁网9月30日讯近日,济南联通与民航山东空管分局共同开展双路由光缆中断后的微波系统保护演练,系统...
湖南各地广泛开展“传承红色基因... 为庆祝中华人民共和国成立75周年,湖南各地积极组织开展“传承红色基因·向国旗敬礼”主题实践活动,引导...
我国成功发射首颗可重复使用返回... 记者从国家航天局获悉,9月27日18时30分,我国在酒泉卫星发射中心采用长征二号丁运载火箭,成功发射...
华为Mate XT刷屏,东莞走... 华为Mate XT刷屏,东莞走到台前。 在Mate XT发布之际,东莞发布“骄傲”地宣布:火爆全网的...
“解码未来:全球数智趋势”专题... 中新网上海新闻9月26日电(记者 姜煜)“解码未来:全球数智趋势”专题论坛25日在上海浦东成功举办。...
大跳水!华为三折叠手机黄牛价暴... 来源:科技新知V 华为首款三折叠手机Mate XT上市初期受到黄牛热炒,但由于实际需求不足和定价过...
西南油气田:智能化建设推动气田... 7月24日,西南油气田铁山坡智能气田建设项目经中国石油专家组评审,以综合评价为“优”的成绩顺利通过验...
荣耀品牌手机哪款性价比高质量好... 大家好!在智能手机的浩瀚星空中,荣耀100与荣耀200无疑是两颗璀璨的明星。今天,我们就来聊聊这两款...
华为与威努特正式签署鲲鹏全面合... [中国,上海,2024年9月19日] 在华为全联接大会2024(HUAWEI CONNECT 202...