AI模型:约250份恶意文档或可将其入侵
创始人
2025-10-12 11:03:52
0

【最新研究发现:仅约250份恶意文档就可能入侵最大体量AI模型】Anthropic、英国AI安全研究院和艾伦·图灵研究所开展最新研究,发现即便体量最大的AI模型,大约只需250份恶意文档,就可能被入侵。 大语言模型的训练数据大多取自公开网络,这让其能积累庞大知识库、生成自然语言,但同时也使其暴露于数据投毒风险中。 过去普遍觉得,随着模型规模增大,风险会被稀释,因为投毒数据的比例需保持恒定,即污染巨型模型需要极多恶意样本。然而,发表在arXiv平台的这项研究颠覆了这一假设,攻击者仅需极少量恶意文件,就能造成严重破坏。 为验证攻击难度,研究团队从零构建多款模型,规模从6亿到130亿参数不等。每个模型都用干净的公开数据训练,研究人员还分别在其中插入100到500份恶意文件。 随后,团队尝试通过调整恶意数据的分布方式或注入时机来防御攻击,并在模型微调阶段再次测试。 结果令人震惊,模型规模几乎不起作用。仅250份恶意文档就能在所有模型中植入“后门”。即便那些训练数据量比最小模型多出20倍的大模型,同样无法抵御攻击。额外添加干净数据既无法稀释风险,也无法防止入侵。 研究人员指出,这意味着防御问题比预想更迫切。AI领域不应盲目追求更大的模型,而应聚焦安全机制的建设。有关论文提到:“我们的研究显示,大模型受到数据投毒植入后门的难度并不会随规模增加而上升,这说明未来亟需在防御手段上投入更多研究。”

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...