最近业余时间想做一些computer vision各个研究方向的总结整理,有了paperwithcode.com这么好的网站(把CV各个研究方向的sub任务,每个任务state-of-the-art的算法paper和code都整理好了),就想把这些研究方向再归类一下,正好用上2020 CVPR topic list,通过以下方法,绘制成一张全景图。
以CVPR里面paper submission的area为大类,把paperswithcode中的每一个topic归到CVPR中的一个area,就有了下面这张图 (点击图片看原始高清大图):

这里只是凭个人经验的一个大致划分,很多topic可以归为多个方向,比如3d action recognition是应该归3d multi-view and sensor呢?还是归action and behavior recognition?为了简单generate一个hierarchical的结构,因为这个强调3d action recognition,就归入前者。其他类似。
总结完后感想:
学海无涯,computer vision里研究的方向太多太广了,一个researcher可能一辈子精力研究的就是这个图上的一个小蓝块(比如object detection)。
这里分支多的area和目前CV里热门的area是两个概念,比如vision application and system因为application的本质决定下属的分支细的topics很多。但recognition/detection/categorization这种比较fundamental的area仍然是计算机视觉的热门方向。当然如人脸,pose和3d等areas分支也多,同时也是热门方向。下面这张CVPR 2020的paper提交数量更能反映目前各个area的热门度:

总结归类是一个很好的学习方法,完成之后感觉对计算机视觉里面的方向有一个体系化的认识和全局观。正如有人说结构化的information才是knowledge,把已有的知识点编织成网也更有利于理解和记忆。
过程中也发现了很多以前不知道的topics,比如动漫vision的研究,唇语识别等等,非常有趣。
欢迎留言,欢迎加领英,欢迎讨论。
转载请注明出处 “Liang Peng, www.TechAndBook.com”
reference