首发于AI Talking
【AI Talking】CVPR2016 最佳论文, ResNet 现场演讲

【AI Talking】CVPR2016 最佳论文, ResNet 现场演讲

今天带来的 AI Talking 比较老了,ResNet,但是视频中仍然有许多亮点,我们也做了一些总结。(见视频下面)

原视频是公开的,来源于 CV Fundation,我们制作了中英字幕。

https://www.zhihu.com/video/1064614272788668416


节选几个比较有意思的片段分析:

【1】Kaiming 回忆 PASCAL VOC,使用 HOG+DPM 的方法为 34% 的 mAP (VOC 2007),这个结果是 12 年之前的。到现在的 2019 年,mAP 早就可以突破 90% 大关。地址:host.robots.ox.ac.uk:8080 (PASCAL VOC 2012 的结果,略难于 2007):


【2】PPT 竟然写错字了,吃惊!~~ 这里的 plain network 指的就是简单堆叠层的网络:


【3】每进行一次尺寸上的下采样(减少),就要增加 2 倍的卷积核数量,VGG 的设计经验噢:


【4】ResNet-152 比 VGG-16/19 具有更低的时间复杂度:


【5】这里是不讲道理的,全面提升和视觉相关任务的表现:


略略略~

发布于 2019-01-04 20:11