科研文献阅读写作小结

Abstraction
Introduction
Related Works
Overview and Methods
Results
Conclusion and Discussion
Reference

Abstraction

科研文献的阅读和写作是从事科研工作的重要技能，然而很多研究生在初次接触时总是苦于不得要领。笔者根据自己阅读科研文献的一些经验和领悟（以 Graphics 和 AI 方向论文为主），从作者和读者双方的角度出发，自己总结分析了科研文献中各个部分的关系和作用，以提高阅读和把握文献的能力。由于笔者涉猎有限，思考也不尽周密，所以所述经验和领悟不免会有局限，欢迎读者指正。

Introduction

Introduction 是作者向读者展示研究核心价值的章节。科研论文乃至其他任何文献写作的最终目的，就是让读者明白作者所作的研究是什么，这是一切的出发点。那么 Introduction 就需要集中精力阐述清楚三件事：研究课题的意义，研究的困难点，以及这篇文章所做的贡献。

首先就是解释作这项研究的意义是什么。意义可以是研究对生产生活的重要影响，也可以是对其他科研工作的基础支持。如果不能很好的解释研究的意义，那么整个研究就是空中楼阁。作者面对的对象可能是同行，可能是大众，还有可能是手握基金审批权的官员。只有清楚地表明研究工作的重要性，研究才能得到关注、得到支持~~以及骗到经费~~。

其次是作这项研究的难点。每一个研究课题都有其相应的难点，这是科研工作者的主要攻关对象。清楚阐述研究的难点，能够让读者了解科研工作者付出的努力，也让读者能够清楚地知道此项研究工作的重点。那么与此相应的，在文章的 Results 或者 Discussion 部分，就需要对应的去讨论这篇工作是否一一解决了此处所列出的困难。读者和评审在阅读后续章节时，也就会关注作者所列的困难是否得到了回应。

最后就是介绍在这篇工作中研究者的贡献。在介绍完研究的难点之后，需要向读者说明研究者是通过什么方法解决这些问题的，在这期间为科学共同体作了什么贡献。对解决方案的描述务求一针见血，深入浅出，其目的是让读者以最直观简洁的方式理解研究者的意图。而对文章贡献的声明，应该有实事求是的态度，否则作者自己的科研信誉受到损失，得不偿失。

作为读者，明白了 Introduction 在文章中的作用，也就清楚了该怎么去读懂它。笔者在 MSRA 图形组实习期间，我的 Mentor 之一刘洋老师就传授给我们读文献的三板斧：“key problem, key challenges, key observation”，其实就是上述的三点。我的另一 Mentor 童欣老师也经常教导我们，要好好读 Introduction。起初笔者并不理解，认为文章的核心应该在 Methods 部分，毕竟这里干货很多，篇幅也最大。后来笔者在逐渐扩展阅读和揣摩文意过程中才领悟到，一篇文献虽是线性的数据，但其组织却是层次性的，而这个层次的根节点，就是 Introduction。它就像硬盘中的分区表一样，虽然只有几百个字节，却组织着整个硬盘扇区的空间。所以 Introduction 一定要好好读，认真读。

Related Works

介绍 Related Works 的意义在于给研究工作定位，为读者指路。每一篇文献都是科研世界中的一个点，这些点连成网才构成了学术界，而 Related Works 就是刻画局部性质的坐标卡。

对 Related Works 的介绍，反映了研究者对自己工作的认识和定位。科学研究不是独立的，而是科学共同体内部大家相互交流、互通有无来完成的。在一篇文章发表之前，一定有围绕着相同问题的其他研究工作存在，因此研究者需要将自己的工作放在同行的工作中进行比较，以确定它的位置。优秀的研究者不仅能去解决最有意义的研究课题，同时也善于将自己的研究摆放到恰到好处的位置。有一句话叫世界上没有真正的垃圾，只有放错地方的资源，对科研论文也同样适用。

读者在浏览 Related Works 时，也希望得到围绕研究课题的学术信息。在 SIGGRAPH 的审稿意见中，引文质量是一项重要评价方面，可见学术界对高质量 Related Work 写作的重视。因为作为读者，不仅希望在阅读这篇文章的时候，了解作者所作的工作，也想了解相关领域其他人的进展。其他人的成果的优缺点是什么，与现在的工作关系如何，都是重要的信息。一个研究可能借鉴了前一研究的方法，可能引入了其他领域的工具，也需要详细说明。

Overview and Methods

在对工作提纲挈领的介绍完成后，就需要进一步展开来叙述：究竟使用了什么方法来解决提出的问题。这也是阅读文献的读者最想弄明白的，因为阅读文献的一大目的就是学习别人的方法，日后用于自己的研究。

然而一项工作环节颇多，一下子铺陈开来容易让人摸不着头脑，所以仍然需要一个自上而下，层次展开的结构来进行叙述。所谓纲举目张，纲目在这里就分别是 Overview 和 Methods 章节了。

Overview 章节的要义是对工作中使用的方法进行粗略但完整的描述。该略过的地方就应略过，要让读者在最短时间内熟悉全貌。务求使读者不至一开始就陷于细节而失全貌，导致丧失阅读的趣味。常用的方法是将内容分为几个独立的子模块，概括其作用，明确输入输出。至于更细节的叙述，则交给 Methods 章节进行详述。

Methods 章节就是对 Overview 所述框架的进一步展开，也就是所谓的“干货”。这里是研究者们各显神通的地方，可以通过文字、公式、图像等等手段进行表现。但一定要做到文字准确、公式标识前后一致、配图有详尽的说明。总而言之，其最终目标就是让读者明白作者在研究中所采用的方法，详细程度应使得有一定基础的研究生照其叙述可对结果进行复现。

其实叙述方式本不只这一种，但长期的实践中，Overview-Method 这种组织形式最能达到效果，因此也逐渐固化为八股文中的一个部分了。

Results

Results 部分的任务是向读者证明作者的理论和方法正确有效。不正确、不有效的工作是不会得到认可和借鉴的。实验结果的展示没有固定的格式，但其核心是逻辑严密地向读者展示自己的结果，说服读者接受作者的结论。

笔者根据 Results 中实验的目的不同，归纳出三种主要类型：展示结果(show demo)、验证理论(validation)、同类方法比较(comparison)。

展示结果就是向读者展示这项工作的一个直观结果，这是最能说服读者的一种方式。以前没有人做过的问题或者没人做成的问题，如果做出来了，展现给读者，就是作者工作成功最好的证明。因为笔者所在领域是计算机图形学，很多问题没有一个可量化的比较指数，而图形学研究的问题本身又是直接和视觉效果相关的，所以相关文献的 Result 章节中有很多展示结果的实验。比如作者十分景仰的 DeepMind 所作相关工作 (DQN, AlphaGo) 就不仅写出了论文，还有实实在在的可演示原型，令人信服。

验证理论就是通过实验支持在文章中提出的论点，通常作为理论部分的补充实验出现。比如在前文中作者声称某一现有方法有缺陷，并在理论上指出其缺陷来源，那么就需要用实验数据证明这一论断。作者在行文时如果声明了一个不平凡的断言，就需要将自己代入读者的视角，问自己读者在读到这里时会产生什么样的疑问。那么作者就应该从最能解决读者疑问的角度来做实验证明之。没有实验支撑的理论是无力的，甚至是有害的（误导其他研究人员），而得到实验支撑的理论则会获得生命力。相对论的出现和证实就是一个经典的案例。计算机方向的研究同样是科学研究，所以作为支撑理论的实验一点也马虎不得。

同类方法比较就是将工作中提出的新方法同现有方法进行比较。要让读者认可作者的研究成果，那至少得在某些方面证明相比于同类方法的优越性。如现有的深度学习领域的相关研究，在有了比较基准 (Accuracy, F1, IU) 之后，各个模型的核心竞争就在提高这些指数上。虽然有同行抱怨深度学习科研沦为调参大赛，但也没有更好更公平客观的选择。

Conclusion and Discussion

最后的总结除了再次重申作者的贡献外，需要讨论工作的局限性，以及未来设想。研究总是一步一步推进，得陇才能望蜀，希望诸君共勉。

Reference

How to write a great research paper, Deep Learning Indaba.
Keshav, S. (2007). How to read a paper. _ACM SIGCOMM Computer Communication Review_, _37_(3), 83-84.