科研文献阅读写作小结


Abstraction

科研文献的阅读和写作是从事科研工作的重要技能,然而很多研究生在初次接触时总是苦于不得要领。笔者根据自己阅读科研文献的一些经验和领悟(以 Graphics 和 AI 方向论文为主),从作者和读者双方的角度出发,自己总结分析了科研文献中各个部分的关系和作用,以提高阅读和把握文献的能力。由于笔者涉猎有限,思考也不尽周密,所以所述经验和领悟不免会有局限,欢迎读者指正。


Introduction

Introduction 是作者向读者展示研究核心价值的章节。科研论文乃至其他任何文献写作的最终目的,就是让读者明白作者所作的研究是什么,这是一切的出发点。那么 Introduction 就需要集中精力阐述清楚三件事:研究课题的意义研究的困难点,以及这篇文章所做的贡献

首先就是解释作这项研究的意义是什么。意义可以是研究对生产生活的重要影响,也可以是对其他科研工作的基础支持。如果不能很好的解释研究的意义,那么整个研究就是空中楼阁。作者面对的对象可能是同行,可能是大众,还有可能是手握基金审批权的官员。只有清楚地表明研究工作的重要性,研究才能得到关注、得到支持以及骗到经费

其次是作这项研究的难点。每一个研究课题都有其相应的难点,这是科研工作者的主要攻关对象。清楚阐述研究的难点,能够让读者了解科研工作者付出的努力,也让读者能够清楚地知道此项研究工作的重点。那么与此相应的,在文章的 Results 或者 Discussion 部分,就需要对应的去讨论这篇工作是否一一解决了此处所列出的困难。读者和评审在阅读后续章节时,也就会关注作者所列的困难是否得到了回应。

最后就是介绍在这篇工作中研究者的贡献。在介绍完研究的难点之后,需要向读者说明研究者是通过什么方法解决这些问题的,在这期间为科学共同体作了什么贡献。对解决方案的描述务求一针见血,深入浅出,其目的是让读者以最直观简洁的方式理解研究者的意图。而对文章贡献的声明,应该有实事求是的态度,否则作者自己的科研信誉受到损失,得不偿失。

作为读者,明白了 Introduction 在文章中的作用,也就清楚了该怎么去读懂它。笔者在 MSRA 图形组实习期间,我的 Mentor 之一刘洋老师就传授给我们读文献的三板斧:“key problem, key challenges, key observation”,其实就是上述的三点。我的另一 Mentor 童欣老师也经常教导我们,要好好读 Introduction。起初笔者并不理解,认为文章的核心应该在 Methods 部分,毕竟这里干货很多,篇幅也最大。后来笔者在逐渐扩展阅读和揣摩文意过程中才领悟到,一篇文献虽是线性的数据,但其组织却是层次性的,而这个层次的根节点,就是 Introduction。它就像硬盘中的分区表一样,虽然只有几百个字节,却组织着整个硬盘扇区的空间。所以 Introduction 一定要好好读,认真读。


Related Works

介绍 Related Works 的意义在于给研究工作定位,为读者指路。每一篇文献都是科研世界中的一个点,这些点连成网才构成了学术界,而 Related Works 就是刻画局部性质的坐标卡。

对 Related Works 的介绍,反映了研究者对自己工作的认识和定位。科学研究不是独立的,而是科学共同体内部大家相互交流、互通有无来完成的。在一篇文章发表之前,一定有围绕着相同问题的其他研究工作存在,因此研究者需要将自己的工作放在同行的工作中进行比较,以确定它的位置。优秀的研究者不仅能去解决最有意义的研究课题,同时也善于将自己的研究摆放到恰到好处的位置。有一句话叫世界上没有真正的垃圾,只有放错地方的资源,对科研论文也同样适用。

读者在浏览 Related Works 时,也希望得到围绕研究课题的学术信息。在 SIGGRAPH 的审稿意见中,引文质量是一项重要评价方面,可见学术界对高质量 Related Work 写作的重视。因为作为读者,不仅希望在阅读这篇文章的时候,了解作者所作的工作,也想了解相关领域其他人的进展。其他人的成果的优缺点是什么,与现在的工作关系如何,都是重要的信息。一个研究可能借鉴了前一研究的方法,可能引入了其他领域的工具,也需要详细说明。


Overview and Methods

在对工作提纲挈领的介绍完成后,就需要进一步展开来叙述:究竟使用了什么方法来解决提出的问题。这也是阅读文献的读者最想弄明白的,因为阅读文献的一大目的就是学习别人的方法,日后用于自己的研究。

然而一项工作环节颇多,一下子铺陈开来容易让人摸不着头脑,所以仍然需要一个自上而下,层次展开的结构来进行叙述。所谓纲举目张,纲目在这里就分别是 Overview 和 Methods 章节了。

Overview 章节的要义是对工作中使用的方法进行粗略但完整的描述。该略过的地方就应略过,要让读者在最短时间内熟悉全貌。务求使读者不至一开始就陷于细节而失全貌,导致丧失阅读的趣味。常用的方法是将内容分为几个独立的子模块,概括其作用,明确输入输出。至于更细节的叙述,则交给 Methods 章节进行详述。

Methods 章节就是对 Overview 所述框架的进一步展开,也就是所谓的“干货”。这里是研究者们各显神通的地方,可以通过文字、公式、图像等等手段进行表现。但一定要做到文字准确、公式标识前后一致、配图有详尽的说明。总而言之,其最终目标就是让读者明白作者在研究中所采用的方法,详细程度应使得有一定基础的研究生照其叙述可对结果进行复现。

其实叙述方式本不只这一种,但长期的实践中,Overview-Method 这种组织形式最能达到效果,因此也逐渐固化为八股文中的一个部分了。


Results

Results 部分的任务是向读者证明作者的理论和方法正确有效。不正确、不有效的工作是不会得到认可和借鉴的。实验结果的展示没有固定的格式,但其核心是逻辑严密地向读者展示自己的结果,说服读者接受作者的结论。

笔者根据 Results 中实验的目的不同,归纳出三种主要类型:展示结果(show demo)、验证理论(validation)、同类方法比较(comparison)。

展示结果就是向读者展示这项工作的一个直观结果,这是最能说服读者的一种方式。以前没有人做过的问题或者没人做成的问题,如果做出来了,展现给读者,就是作者工作成功最好的证明。因为笔者所在领域是计算机图形学,很多问题没有一个可量化的比较指数,而图形学研究的问题本身又是直接和视觉效果相关的,所以相关文献的 Result 章节中有很多展示结果的实验。比如作者十分景仰的 DeepMind 所作相关工作 (DQN, AlphaGo) 就不仅写出了论文,还有实实在在的可演示原型,令人信服。

验证理论就是通过实验支持在文章中提出的论点,通常作为理论部分的补充实验出现。比如在前文中作者声称某一现有方法有缺陷,并在理论上指出其缺陷来源,那么就需要用实验数据证明这一论断。作者在行文时如果声明了一个不平凡的断言,就需要将自己代入读者的视角,问自己读者在读到这里时会产生什么样的疑问。那么作者就应该从最能解决读者疑问的角度来做实验证明之。没有实验支撑的理论是无力的,甚至是有害的(误导其他研究人员),而得到实验支撑的理论则会获得生命力。相对论的出现和证实就是一个经典的案例。计算机方向的研究同样是科学研究,所以作为支撑理论的实验一点也马虎不得。

同类方法比较就是将工作中提出的新方法同现有方法进行比较。要让读者认可作者的研究成果,那至少得在某些方面证明相比于同类方法的优越性。如现有的深度学习领域的相关研究,在有了比较基准 (Accuracy, F1, IU) 之后,各个模型的核心竞争就在提高这些指数上。虽然有同行抱怨深度学习科研沦为调参大赛,但也没有更好更公平客观的选择。


Conclusion and Discussion

最后的总结除了再次重申作者的贡献外,需要讨论工作的局限性,以及未来设想。研究总是一步一步推进,得陇才能望蜀,希望诸君共勉。


Reference

  1. How to write a great research paper, Deep Learning Indaba.
  2. Keshav, S. (2007). How to read a paper. _ACM SIGCOMM Computer Communication Review_, _37_(3), 83-84.