基于多代理环境模拟系统的大型语言模型能力分析与评估

计算机学院（国家示范性软件学院）

Analysis and Evaluation of LLM Ability Based on Multi-Agent Environment Simulation System

本项目计划构建一个基于大型语言模型（LLM）的多代理环境，以模拟现实世界的多种场景。该环境的构建将考虑到各种可能的交互与事件，以及代理间的相互关系。该环境也将可能用于模拟由AI组成的社会或集体，并通过代理间的交互事件等，进行社会学研究分析方法的对比和相似度分析。此项目的目标是为了探索大型语言模型在多种环境中的表现，以及LLM所蕴含的潜在能力。我们的主要目标是通过创建和优化基于LLM的多代理框架，形成一个可视化的逼真的虚拟世界，从而进一步评估和理解LLM的学习能力和社会行为。我们希望通过创建沙盒环境，支持各种不同的场景，并允许在其中进行广泛的探索和实验。在此基础上，我们将研究和构建一套科学的评价体系，以检验和提升大型语言模型在多种环境中的表现。我们还期望通过AI社会或集体的模拟，对人工智能在现实环境中的潜在行为进行更深入的研究和理解，以及对人工智能的社会影响进行评估。

项目分数

项目信息

重要程度：

项目负责人

赵明宇2021级理学院信息科学

项目成员

丁嘉宇2021级国际学院电信工程与管理

何杰聪2021级国际学院物联网工程

杨喻绗2021级国际学院物联网

指导老师

杨成计算机学院（国家示范性软件学院）讲师

评审老师

周文安计算机学院（国家示范性软件学院）副教授

张继威计算机学院（国家示范性软件学院）讲师

金大海计算机学院（国家示范性软件学院）副教授

暂无留言

留言