大模型驱动的网络敏感数据发现和异常分析
国际学院
Large Model-Driven Network Sensitive Data Discovery and Anomaly Analysis
随着以无线网络为代表的互联网技术的迅猛发展,我们的生活和工作方式正在经历前所未有的变革。根据思科(Cisco)的视觉网络指数(VNI)报告,全球互联网流量持续高速增长,2023年每月达到惊人的2.3泽字节,这相当于每天有769亿兆字节的数据在网络中流动。这一庞大的数据流量不仅标志着信息时代的繁荣,也带来了前所未有的数据安全挑战。
在网络数据传输和交换的过程中,各种各样的日志数据在不停产生。日志作为一种多源异构的数据,拥有种类多、数量大的特点。如何以高效率、高准确率、通用的方式从众多日志中找出高价值、高风险的敏感数据成为我们亟需解决的问题。
本项目旨在利用大模型技术,对海量日志中的敏感数据进行分析,以识别和防范潜在的安全风险。同时探索图神经网络GNN等先进技术在提升大语言模型推理能力方面的应用。