AI 安全风险全景总览

跳出应用层攻防视角，从模型层和供应链层全面认识 AI 系统面临的安全风险

模块概述

模块二和三带你完整经历了 LLM 应用层的攻防对抗，从提示词注入到纵深防御，你已经掌握了应用层安全的核心技能。但如果把视野局限于应用层，你对 AI 安全的认知就像只看到了冰山一角。本模块将"拉高视角"，带你认识 AI 系统在模型层（对抗样本、隐私泄露）和供应链层（数据投毒、开源模型风险）面临的更深层威胁，这些风险往往更加隐蔽，一旦发生影响也更为深远。

与前两个模块的"重实操"风格不同，本模块以理解概念和建立风险意识为核心目标。四个章节从模型层到供应链层递进展开，建议按顺序阅读以建立完整的风险图谱，也可根据兴趣选择性深入。这些知识将直接支撑模块五的安全评估实践。只有全面了解 AI 系统可能面临的各类威胁，才能在安全评估中做到不遗漏、不偏颇。

模块定位

本模块以理解概念和认识风险为目标，不涉及复杂的算法推导或模型训练代码。实验通过文本对抗、系统提示模拟等方式让你直观体验这些风险，所有实验仍然只使用 Python + Qwen 模型。

AI 安全风险全景总览

模块概述

章节概览

第1章：对抗样本

第2章：隐私泄露

第3章：数据投毒与后门

第4章：供应链安全

配套实验

实验 4.1：文本对抗攻击体验

实验 4.2：隐私泄露检测

实验 4.3：后门攻击模拟

实验 4.4：模型卡片安全审计

本模块与其他模块的关系

常见问题

目录导航

AI 安全风险全景总览

模块概述

章节概览

第1章：对抗样本

第2章：隐私泄露

第3章：数据投毒与后门

第4章：供应链安全

配套实验

实验 4.1：文本对抗攻击体验

实验 4.2：隐私泄露检测

实验 4.3：后门攻击模拟

实验 4.4：模型卡片安全审计

本模块与其他模块的关系

与模块二（攻击技术）的关系

与模块三（安全防御）的关系

与模块五（安全评估）的关系

常见问题

本模块需要深度学习基础吗？

实验 4.3 的后门攻击是真正的后门吗？

目录导航