注册
|
登录
|
举报
首 页
公告沙龙
公告中心
活动沙龙
课程学习
项目交流
项目招募
问答中心
信息展示
项目展示
往年项目展示
校内导师
校外导师
使用指南
文件下载
常见问题
×
举报该页有违规/非法信息
网址:
附加说明:
最新版
最新
AI之眼—基于多模态大模型的视觉辅助和交互系统开发
人工智能学院
Eye of AI —— Development of Visual Aids and Interaction Systems Based on Multimodal Large Models
终检评审通过
创新训练
520计算机科学技术
医疗健康
校级
本项目希望通过多模态大模型对现实场景进行识别分析,转化为自然语言文字并生成语音,通过与视力障碍人群进行交互帮助他们像正常人一样感知这个世界。本项目主要由调研、制作数据集、模型训练和实验测试四个部分组成。项目的短期目标为成功训练出一个针对单一场景的目标检测模型并生成语音提示,长期目标为训练出能适用于视障人群大多数生活场景的多模态大语言模型并制作成一个交互式app。
项目分数
项目信息
项目动态
项目相关人员
项目荣誉
留言
重要程度:
全部信息
细节信息
正常信息
重要信息
项目负责人
吴宇锴
2023级 未来学院 计算机类
项目成员
车政浩
2023级 未来学院 电子类
周礼航
2023级 未来学院 计算机类(元班)
张少琪
2023级 未来学院 电子信息类(元班)
指导老师
张彬
人工智能学院 副教授
社交媒体
医疗健康
智能交通
评审老师
马金明
人工智能学院 讲师
通信网络
机器人
智能制造
丘广晖
人工智能学院 工程师
数字教育
杨钢
人工智能学院 高级工程师
通信网络
机器人
暂无留言
留言
提交
该项目暂无荣誉