课程
大语言模型的安全研究
本课题将深入研究和开发更高效的攻击方法,以提升攻击方法的隐蔽性、攻击的成功率,达到SOTA的performance。
工科
SCI
CCF
计算机科学与技术
大语言模型
自然语言处理
申请匹配
咨询客服
课题详情
【课题推荐发表期刊】
【课题背景】
大语言模型面对各种对抗攻击和Prompting攻击,往往展现出了脆弱性。这些攻击手段能够误导模型,使其输出错误或不期望的结果,对模型的安全性和可靠性构成严重威胁。
本课题将深入研究和开发更高效的攻击方法,以提升攻击方法的隐蔽性、攻击的成功率,达到SOTA的performance。
【课题方向参考】
Low-resource NLP
Efficient Attacks in NLP downstream tasks
【适合人群】
计算机相关专业,希望读博或申请国外博士的学生,有基础的科学论文写作经验和编程基础。
【课题收获】
高质量论文一篇(SCI/CCF定向期刊)
SCI期刊投递与发表指导
结业证书
【导师介绍】
Yan老师,985高校博士,研究员
发表论文36篇,SCI一区10余篇,包括 IEEE TNNLS, IEEE TII,IEEE TCSVT,ACL, EMNLP, AAAI等期刊和会议
获国家发明专利授权3项、实用新型专利授权1项
曾辅导14名CSC/新加坡政府奖学金的本科/研究生/博士生,其中多人被NTU,NUS录取或发表SCI一区和顶会论文,具备丰富的英文写作经验和论文指导经验
【课题安排】
研究周期预估六个月左右,具体视学员情况调整。
【推荐阅读】
课题导师
查看详情 >
Yan研究员 KY09293
985高校博士,海外研究员
自然语言处理医学图像分析
立即添加好友,了解更多