【AI Talking】CVPR2016 最佳论文, ResNet 现场演讲
今天带来的 AI Talking 比较老了,ResNet,但是视频中仍然有许多亮点,我们也做了一些总结。(见视频下面)
原视频是公开的,来源于 CV Fundation,我们制作了中英字幕。
https://www.zhihu.com/video/1064614272788668416节选几个比较有意思的片段分析:
【1】Kaiming 回忆 PASCAL VOC,使用 HOG+DPM 的方法为 34% 的 mAP (VOC 2007),这个结果是 12 年之前的。到现在的 2019 年,mAP 早就可以突破 90% 大关。地址:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 (PASCAL VOC 2012 的结果,略难于 2007):
【2】PPT 竟然写错字了,吃惊!~~ 这里的 plain network 指的就是简单堆叠层的网络:
【3】每进行一次尺寸上的下采样(减少),就要增加 2 倍的卷积核数量,VGG 的设计经验噢:
【4】ResNet-152 比 VGG-16/19 具有更低的时间复杂度:
【5】这里是不讲道理的,全面提升和视觉相关任务的表现:
略略略~
发布于 2019-01-04 20:11