注册
|
登录
|
举报
首 页
公告沙龙
公告中心
活动沙龙
课程学习
项目交流
项目招募
问答中心
信息展示
项目展示
往年项目展示
校内导师
校外导师
使用指南
文件下载
常见问题
×
举报该页有违规/非法信息
网址:
附加说明:
最新版
最新
面向大模型的自动生成提示攻击研究
网络空间安全学院
Research on automatic generation of attacks for large models
终检评审通过
创新训练
520计算机科学技术
其他
市级
大模型,如ChatGPT,已在科研、编程等领域显示出极大潜力,被广泛采用于生成文本与图像。然而,它们的普及也带来了挑战,比如存在生成有毒或误导性内容的风险,攻击者通过设计精巧的提示绕过保护措施,可能导致违规内容。当前,大多数攻击研究依赖手动制作的提示,这种方法虽能精准修改,但存在应用范围窄、人力要求高的问题。因此,本项目研究自动化攻击系统以提高攻击的效率和准确率,并探索对应的防御方式。研究支撑资源有:大模型api、高性能服务器等。
项目分数
项目信息
项目动态
项目相关人员
项目荣誉
留言
重要程度:
全部信息
细节信息
正常信息
重要信息
项目负责人
何俊涛
2021级 网络空间安全学院 网络空间安全
项目成员
冯皓
2021级 网络空间安全学院 网络空间安全
陈万桥
2021级 网络空间安全学院 网络空间安全
指导老师
袁雪敬
网络空间安全学院 讲师
社交媒体
华为专项
小米专项
评审老师
郭凯
国际学院 高级工程师
电子商务
数字娱乐
文化创意
武斌
网络空间安全学院 讲师
社交媒体
通信网络
付俊松
网络空间安全学院 讲师
通信网络
暂无留言
留言
提交
该项目暂无荣誉