入职新加坡国立大学之前，哥大计算机视觉博士总结五年研究生涯(6)

2023-10-27 来源:旧番剧

那会儿video领域，大家主要做classification，而且是几秒的短视频；THUMOS是长视频，而且不光有action classification task，还要一个task是action detection，检测你所感兴趣片段的开始/结束时间。参加比赛时，我跟着师兄主要搞classification，边做边学，上手了处理视频的模型和框架，收获很大。比赛完后，我发现classification大家搞的火热，而detection，同样很重要的一个课题，却没有人研究过基于深度学习的方法，于是就有了我的第一篇CVPR文章，收到了很多follow-up。我自己也算是找到了自己的研究方向，不再迷茫。
我觉得这段经历，对新手很有参考价值，很多时候光努力不够，方向更重要。新手如何选博士几年的topic，有两个问题值得思考：
能不能快速上手？有几个简单的评判标准：
state-of-the-art的paper有没有开源的代码？目的是你能迅速复现baseline，熟悉整体pipeline（如怎样预处理，后处理），加深对实现和细节的理解有没有对这个topic有hands-on经验的师兄，或者community里面approachable的前辈？目的是，当你遇到实现上的细节问题，可以及时咨询和得到反馈这个topic有没有比赛，或者标准的benchmark？目的是，有大家已经定义好的数据，实验setup，评价标准；这样，你有可以直接比较的baseline，outperform baseline的时候也容易被人认可能不能有大的impact？这里我指的是博士期间的大方向，由一系列单项的工作或者paper构成。单篇paper通常有三种类型：
（1）First work：开创了一个topic，比如RCNN于object detection
（2）Last work：基本解决了一个topic，比如Faster-RCNN，YoLo于object detection
（3）Improve类型，介于First和Last之间的。
Last很难，Improve常见但影响力不够深远，对于新手而言，博士的早期工作，在有能力做出来和有impact之间的trade-off比较好的，估计是First了，不一定非要是第一篇，只要是某个topic里面开创性工作的那一批之一，都是不错的。这个早期工作之后，你会对这个问题哪里要改进，有很清楚的认识，因为improvement room大，也会有很多ideas。同样，早期的时候怎么选这样一个topic呢：相关的比赛是这一两年新开的吗，相关的benchmark是这一两年出来的吗，上面的结果提升空间大吗（现在是20%还是已经80%了）？

1 ...4 5 6 7 8 ...11 查看全文