基于机器学习的XSS攻击检测技术的研究与实现
计算机学院(国家示范性软件学院)
Research and Implementation of XSS Attack Detection Technology Based on Machine Learning
XSS漏洞往往由于网站开发者过于信任用户输入的变量造成,即使一些开发框架默认对用户输入进行转义,仍然无法完全杜绝XSS漏洞,因此XSS攻击常年位列OWASP整理的十大互联网威胁之一。由于XSS破坏力大,影响范围广许多专家与学者开发研究了针对XSS的防御检测方法,但XSS使用的JavaScript语言功能强大、所处的网站环境复杂,这些方法都无法完全抵御XSS攻击。
本项目拟构造一个可以部署在网关服务器上的XSS流量检测系统,该系统应包括定时数据包抓取、原始数据处理、机器学习分类器、实时结果反馈四个模块。其中,定时数据包抓取模块抓取一小段时间内流经网卡的网络流量,并以pcap格式存储到原始数据文件中;原始数据处理模块将原始流量进行预处理,并完成特征提取和归一化;机器学习分类器是提前用训练集调试完成的,分析前一模块得到的数据并进行XSS与非XSS的分类;实时结果反馈模块在XSS流量超过阈值时进行告警,并用可视化的界面动态显示XSS攻击流量的情况。