人工智能训练数据良莠不齐国安部提示警惕AI“数据投毒”

2025-08-05 08:31 国家安全部

　　国家安全部今天（5日）发布安全提示文章，人工智能的训练数据存在良莠不齐的问题，其中不乏虚假信息、虚构内容和偏见性观点，造成数据源污染，给人工智能安全带来新的挑战。

　　数据是人工智能的基础

　　人工智能的三大核心要素是算法、算力和数据，其中数据是训练AI模型的基础要素，也是AI应用的核心资源。

　　提供AI模型的原料。海量数据为AI模型提供了充足的训练素材，使其得以学习数据的内在规律和模式，实现语义理解、智能决策和内容生成。同时，数据也驱动人工智能不断优化性能和精度，实现模型的迭代升级，以适应新需求。

　　影响AI模型的性能。AI模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提；高准确性、完整性和一致性的数据能有效避免误导模型；覆盖多个领域的多样化数据，能提升模型应对实际复杂场景的能力。

　　促进AI模型的应用。数据资源的日益丰富，加速了“人工智能+”行动的落地，有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力，更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

　　数据污染冲击安全防线

　　高质量的数据能够显著提升模型的准确性和可靠性，但数据一旦受到污染，可能导致模型决策失误甚至AI系统失效，存在一定的安全隐患。

12 3 4 下一页

人工智能训练数据良莠不齐 国安部提示警惕AI“数据投毒”