0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”
2025-08-21 10:08 中央广播电视总台中国之声
可见,数据投毒早已不再是技术话题,而是切实的社会风险,比如:金融领域,虚假信息操纵股价,有可能构成新型市场欺诈;公共安全领域,谣言传播会引发社会恐慌,扰乱舆论秩序;医疗健康领域,AI正广泛应用于诊断,甚至手术环节,如果出现错误诊疗建议有可能危及患者生命;当然,最关键的,频繁“AI造假”最终将侵蚀公众对技术的信任基础。
刘吉介绍,目前,行业对于大模型的“中毒”现象已经在引起重视,有些企业已经有一批人在从事AI的对抗性训练工作。
那么,面对数据污染问题,从国家安全层面,我们应该如何防范风险呢?中国网络空间安全协会人工智能安全治理专业委员会委员薛智慧表示,应加强源头监管,防范污染生成。
2017年,国务院印发的《新一代人工智能发展规划》首次在国家层面确立人工智能发展战略地位,明确提出“构筑我国人工智能发展的数据先发优势”。2024年《关于促进数据标注产业高质量发展的实施意见》则系统规划了数据标注领域的技术创新、标准建设和人才培养等发展路径。同时,《网络安全法》《数据安全法》《个人信息保护法》设定了安全底线和法律红线。可见,我国对数据标注行业的管理思路是清晰的:一方面通过战略和专项政策鼓励发展,将其作为数字经济的核心支撑产业;另一方面通过基础性法律严格规范,确保其在安全合规的轨道上运行,最终目标是为人工智能产业提供高质量、高可信度的“数据燃料”。刘吉表示,高质量数据集的建设和行业规范对于人工智能的发展至关重要。