GenAI 安全攻防实战课程
模块四 AI 安全风险全景

AI 安全风险全景总览

跳出应用层攻防视角,从模型层和供应链层全面认识 AI 系统面临的安全风险

模块概述

模块二和三带你完整经历了 LLM 应用层的攻防对抗,从提示词注入到纵深防御,你已经掌握了应用层安全的核心技能。但如果把视野局限于应用层,你对 AI 安全的认知就像只看到了冰山一角。本模块将"拉高视角",带你认识 AI 系统在模型层(对抗样本、隐私泄露)和供应链层(数据投毒、开源模型风险)面临的更深层威胁,这些风险往往更加隐蔽,一旦发生影响也更为深远。

与前两个模块的"重实操"风格不同,本模块以理解概念和建立风险意识为核心目标。四个章节从模型层到供应链层递进展开,建议按顺序阅读以建立完整的风险图谱,也可根据兴趣选择性深入。这些知识将直接支撑模块五的安全评估实践。只有全面了解 AI 系统可能面临的各类威胁,才能在安全评估中做到不遗漏、不偏颇。

模块定位

本模块以理解概念和认识风险为目标,不涉及复杂的算法推导或模型训练代码。实验通过文本对抗、系统提示模拟等方式让你直观体验这些风险,所有实验仍然只使用 Python + Qwen 模型。

章节概览

配套实验

本模块与其他模块的关系

常见问题

🛡️ AI 安全助教

随时为你解答 AI 安全相关问题