AMD 推出自家首款小语言模型“Llama-135m”_科技动态

创始人

2024-09-29 20:00:45

0次

IT之家 9 月 29 日消息，AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m，该模型具有推测解码功能，拥有 6700 亿个 token，采用 Apache 2.0 开源许可，IT之家附模型地址如下（点此访问）。

据介绍，这款模型主打“推测解码”能力，其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少 RAM 占用，实现效率提升。

AMD 表示，这款模型在四个 AMD Instinct MI250 节点训练了六天，其“编程专用版本”变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。

原创苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别？该选择哪一款更好？各自...

2024年OPPO手机全攻略：... 手机已不仅仅是通讯工具，它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展，O...

2025年值得入手的2款智能手... 在科技飞速发展的今天，智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒，还是时尚搭配...

原创 2... 从去年华为用上了麒麟芯片开始，华为的市场份额就蹭蹭的往上涨，当时抢购的人特别多，一时间还买不到现货，...

第五轮学科评估对比：西安交大突... 在之前的文章中，我们已经提及西安交通大学第五轮学科评估的表现可圈可点，新晋的3个A+学科：机械工程、...

vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...

解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用，广泛应用于iPhone、iPad和Mac等设备上。...

steam官网无法访问？这个办... 对于广大游戏爱好者而言，Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...

原创直... #热点周际赛# 随着科技的进步，儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...

原创麒... 为了普及原生鸿蒙（鸿蒙5.0），抢占更多的中端手机市场份额，华为nova系列今年开始计划一年两更，n...