赫拉—基于图像和语音识别的视频内容精确搜索与推荐系
计算机学院(国家示范性软件学院)
Hera — A Video Content Searching and Recommending System based on Image and Audio Recognition
本项目致力于利用图像识别和语音识别技术,对视频内容进行具体分析,实现对大段视频内容的拆分、在多个大段视频内容中精确搜索符合条件的短视频片段,从而实现基于视频实际内容的搜索功能。传统视频搜索平台多是基于视频标题,或是对用户人为添加的tag进行检索,存在视频与标题、tag相关性不高的问题,且搜索结果多是完整的大段视频,无法精确到某个视频的某个具体片段。同时,在民用监控领域,如若要在监控视频中搜索可能出现的某个人影,某个车牌,而又不知道其出现的具体时间(多出现在警方侦查阶段),此时就需要大量人力观看完整的视频,费时费力。而该项目的目的,就在于解决以上全部痛点。同时,由于基于视频实际内容进行搜索,获得的用户行为数据更具价值,基于此构建的推荐系统能更加贴合用户实际需求地进行定向个性化推荐,且由于推荐的是具体视频的具体片段而非完整视频,推荐内容质量显著高于传统推荐系统。