籍智-AI赋能的民族古籍识别系统
北京市创新创业人才培养指导中心
Jizhi - AI-empowered national ancient book recognition system
中央民族大学在民族古籍识别领域积累丰富的研究成果,孙娜副教授团队已经在此研究方向深耕多年,得到行业的高度认可,并发表数篇高质量的学术论文,授权专利多项。而孙娜副教授团队在研究民族古籍数字化过程时发现,对于命名实体,特别是特殊的人名、地名、术语等词汇,目前的各类研究成果均存在识别准确度不高、识别能力较弱等问题,这严重影响了民族古籍的识别效率,降低了人工智能的运用效能,为了解决民族古籍数字化过程中命名实体识别的准确性问题,本项目应运而生。本项目将利用人工智能赋能古籍命名实体识别,开发一个高效的命名实体识别模型,提升模型在识别民族古籍中特定实体(如人名、地名、术语等)时的准确性和效率。同时结合国产商用密码算法,确保处理过程中的数据安全。
本项目积极响应北京市教委创新创业教育相关文件的要求,通过跨校组队方式,联合中央民族大学和北京邮电大学两所高校,实现优势互补。北京邮电大学“计算机科学与网络安全”学科群入选一流学科建设行列,在计算机网络安全和人工智能处理方面具有强大的技术储备。北邮方指导教师网安院雷敏副教授所在的移动互联网安全国家工程中心具备良好的科研环境,雷敏副教授参与国家重点研发计划四项,授权专利多项,具备丰富的双创指导经验和竞赛指导经验。学生团队由中央民族大学以及北京邮电大学的学生组成。
本项目充分利用中央民族大学和北京邮电大学的学科优势,通过跨学科、跨校际的合作,整合民族古籍识别和人工智能和网络空间安全的前沿技术,来解决具有极高的社会价值和经济价值的民族古籍保护实际问题,促进古典的保护和传承,同时为未来的科研合作奠定基础。
中华民族拥有悠久的历史,千百年传承下来的民族古籍中蕴含了丰富的历史、社会、文化和语言等及其丰富的信息。这些古籍对于研究民族历史、社会变迁、文化传承等方面具有极高的学术价值。通过对民族古籍的命名实体识别研究,可以更准确地提取和保护这些宝贵的信息资源,为学术研究提供重要的资料和依据,促进中华民族传统文化的传承和发展,并贯彻落实习近平总书记关于加强和改进民族工作的重要思想,让铸牢中华民族共同体意识不断深入人心。