当全球人工智能技术向无人驾驶靠拢时,阿里巴巴在该领域的全球权威机器视觉算法排名中,再次刷新了榜单。近日,全球权威机器视觉算法排行榜KITTI,阿里巴巴iDST夺得行人检测单项冠军。在知名的行人再识别数据集Market1501中,iDST的首位命中率也提升至96.17%,位居世界第一。
行人检测、行人再识别是交通管理、城市平安、无人驾驶等领域的两项核心基础技术。
行人检测要求机器能够从图像或者视频中判断是否有行人,行人在哪里;行人再识别则要求机器能够识别出特定人员在不同摄像头下出现的所有图像。在景区商场人流预测、人群个性化分析、行人交通安全、无人驾驶、寻找丢失老人儿童等应用上,这两项技术可以发挥巨大的作用。
KITTI算法评测平台由德国卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合建立,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、路面分割等计算机视觉技术在车载环境下的性能。
实际上在2017年5月,阿里iDST就已经将车辆检测的准确率提升至90.46%,长踞榜单第一名。而在同一难度级别的最新数据,阿里iDST如今已经刷新至90.55%。
阿里巴巴iDST副院长、IEEE Fellow华先胜表示,目前大部分摄像头所拍摄的图像看不清人脸,需要通过行人的整体和局部特征进行识别。但在实际情况中,包括遮挡、光照、拍摄角度、拍摄距离、人物姿态等因素的干扰,还有摄像头设备的不同,都会给行人的识别与检测带来困难。
据介绍,阿里巴巴iDST团队在行人检测技术方面,提出了基于目标尺寸分级的级联网络,并充分发挥感兴趣区域的上下文信息,提升网络特征提取的能力,以解决行人检测问题中存在的目标尺寸浮动大、遮挡、形变且定位不准等问题;与此同时,在目标定位方面采用交叉熵正则约束来优化边框定位准确度。
而在行人再识别方面,团队不仅利用最新的深度学习技术提取行人的全局特征,还提出了超分辨率模块和深度注意力网络来获得头部、躯干、四肢、携带物等局部细节特征,并提出了融合粗粒度全局特征和细粒度局部特征的新方法,进一步提高了跨摄像头场景下行人表征的一致性和行人再识别的准确性。
行人检测与行人识别这两项技术有着丰富的应用场景,包括景区商场的人流预测、人群个性化分析、行人交通安全、无人驾驶、寻找丢失老人儿童等应用等等。目前上述技术已经全部集成到阿里巴巴ET城市大脑当中,并已落地。
对此华先胜表示:“正如60年代的登月计划带来了通讯技术、生物工程技术大爆发一样,城市大脑已经成为世界顶尖的科技创新的平台,前所未有的难题倒逼明升体育app家们创造前所未有的技术。”
目前阿里巴巴城市大脑已经在杭州、苏州、衢州、乌镇等地落地。借助机器视觉算法,杭州城市大脑可以做到准确侦测、发现交通事故,日均事件报警500次以上,准确率达92%。