保持阅读论文重要性
对于从事数据挖掘、人工智能相关领域的从业人员来说,保持对新知识的热情很重要。学习新的算法和模型的一个重要途径就是阅读论文。本文将自己从研究生三年到工作这三年的阅读论文的个人经验和体会记录下来,希望对读者有所帮助。
第一步 精读10篇以上经典论文
对于一个积累不足的读者来说,想要实现快速阅读论文、快速掌握公众号里面的算法和模型实际上是很困难的。所以我建议的第一步,先精读10篇以上经典论文。
有几点需要解释一下:
1. 10篇只是一个大概的数字,不一定要完全按照这个数字来
2. 阅读的时候做好笔记,记录你认为有价值的、重要的知识点,以及不太明白的知识点,以及自己的思考和体会。这一步非常重要,很多人不注意就会把精读变成快读了,或者根本读不下去。
3. 有相关的重要文献,也一起读一下,重点是跟你精读论文相关的部分,其他部分可以不用深究,看个人情况就好。
4. 经典论文可以找人推荐、或者在知乎上找一些人推荐的文章, 一般看引用量就能知道,有一个很好的地方可以找到经典论文, 一些著名的公开课如CS231n, CS224n, CS234 等都会提供很多参考文献,而课程的PPT可以当做很好的索引将这些论文串联起来
5. 自己动手实现里面重要的算法。这一点也是很重要的,完全复现论文是一件工作量很大的事情,而且对于刚开始学习不久的人也很困难,但是我们可以只实现里面比较重要的核心算法,或者你自己觉得有趣的点。这一步的核心精神是通过动手,加深理解
6. 当阅读一定量的时候要形成自己的理解,形成自己的知识结构,知识点之间缺乏联系那是知识孤岛,所以平常要多想想不同算法、模型之间的联系,比如思考: 是否存在一种通用的方法把它们都归类到一起,是否两种模型一种是另外一种的特例? 新的算法和经典算法之间的关系是什么? 等等这些问题
第二步 快速阅读多个领域类的文章
有了第一步的基础后,就有一些积累了,可以开始泛读快速扩大自己的知识面了。论文可以通过reference、公开课、网上有心人收集的论文列表、综述等方式。
有几点需要解释一下:
1. 泛读的重点,理解论文的核心创新点,记录笔记
2. 通过大量阅读,总结出更一般化的经验,极大地扩充知识面
3. 泛读的同时,发现值得精读的文章也要按照精读的方法阅读
第三步 有选择地阅读
有了第二步之后,有了一定知识储备,可以有选择地选择一些文章进行精读和复现论文结论,很多论文的结论并不一定靠谱,这一步可以帮助你真正成为领域专家,并且可以创造新的知识、算法和模型。
有几点需要解释一下:
1. 选读的同事也要一定的泛读
2. 积极跟踪最新论文,重要的国际会议,建议每篇文章的标题至少刷一遍,其次最好刷一遍摘要,筛选出感兴趣的文章
3. 这一步的目的是建立自己的知识网,并牢固他们,甚至为别人创造新的知(挖)识(新)点(坑)。