本网讯(通讯员吴红波、张晋东、梁铭铭)国际视频分析与检索技术评测TRECVID2015大赛日前落幕,国家多媒体软件工程技术研究中心(NERCMS)团队获佳绩。在30个官方规定的检索目标中,我校有8个准确率居世界第一,总分居实例检索任务项目全球第四。
该团队由计算机学院5名研究生王正、叶茫、姚磊、刘俊、黄冰月和2名本科生柳东静、刘涛组成,作为武汉大学唯一代表队参赛。指导老师有胡瑞敏、陈军教授和青年教师梁超。
团队根据实例检索任务的要求,从海量视频数据(TB级)中检索出包括人、车、物等在内的30个特定目标。在面临检索目标大小不一、种类繁多、背景干扰大,对检索算法的性能和效果极具考验的情况下,团队基于经典的图像检索框架,提出了检索目标自适应的相似性度量方法,配合多源跨模态信息,如文本、人脸和车辆等,来综合得到初始的检索结果。在此基础上,团队进一步利用视频连续帧之间存在的时序关联特性,通过对相邻视频镜头的查询扩展来进一步优化初始检索结果,提高了算法准确率。
据悉,这是该团队第三次参加此项比赛,进步明显。今年在实例检索任务上的检索准确率为0.367,较之2013年第一次参赛时的0.0063,提高了58倍。武汉大学此次比赛成绩超过日本国立情报学研究所、澳大利亚昆士兰大学、德国康姆尼斯工业大学等世界知名高校和研究机构,在较短的时间内跻身视频检索领域世界一流的科研梯队。
该赛事由美国国家标准技术研究所于2001年开始举办,至今已有15届。大赛每年向参评的世界知名高校和科研院所发布标准测试数据,参评者用这些标准测试数据测试自己设计的算法,并在规定时间内向组委会提交自己算法的运行结果。最终由美国国家标准技术研究所对提交结果进行评价和比较。今年的比赛共吸引了世界69支队伍报名参赛。本次竞赛的相关技术已经运用在面向监控视频的特定目标检索中,并多次在实际案例中发挥作用,提高了视频监控中针对特定嫌疑目标的排查效率,对维护人民生命财产安全具有重大意义。
部分检索目标示例和算法结果。四个检索目标分别是“这盏灯”、“调味盒”、“这只狗”、“这辆车”。红色方框表示查询目标,绿色方框表示检索到的目标位置。
(供图:胡瑞敏 编辑:付晓歌)