是N+1的工作,我们为了证明N+1比原来的N要好,你首先要重复前面N个人的工作,这也是在科研上实验结果必须能够重复的原因。一个有经验的导师在指导学生做研究时,通常是从重复前人的实验开始的,然后才开始自己的改进。将来写成论文时,实验结果的第一部分就是重复前人最成功的实验(一般被称为基准)。然后,才是对自己各种实验结果的介绍,以及和前人的比较。
第四,实验所用的数据,要尽可能地使用那些同行能够得到的。可比性对科学研究非常重要。为了让大家有一个可以公平比较的平台,各个学科领域都有很多共享数据、材料和工具,供同行使用,这些是属于整个学术圈子的财富。大家做研究都要用这些共同的东西来验证、比较,这样才是橘子和橘子的比较,不是和橘子的比较。
万一有些数据是自己产生的,外面找不到,当同行问起来时,要随时准备提供给对方。这里我想补充一点,有时,为同行准备大家可以对比的客观数据,也是一件非常有意义的事。事实上,在学术界,为了便于大家进行学术交流,常常要建设一个给学术圈子使用的基准平台。有时,建这样一个数据平台甚至要花很多钱。我过去所在的语音识别和自然语言处理领域,宾夕法尼亚大学就有专门一个小组为全世界的学者准备研究和测试数据。2015年,谷歌为了让全世界的大数据医疗研究有一个可以做对比实验的基准,拿出一亿美元给了斯坦福和杜克两所大学的医学院,用5年时间采样5000人(各2500人)的全部生理和医疗数据,作为将来全世界在相关领域搞研究的共同基础。
对于非自然科学的论文,使用的数据一定要是同行也能够得到的,比如在经济学上,大家常常采用世界银行、美国中央情报局、美国统计局的数据。我在写《浪潮之巅》分析各公司的经营状况时,一般都引用它们向美国证监会(SEC)提供的数据,而不是《华尔街日报》的二手数据。
此外,如果一个研究人员在前人的基础上更进一步,那是一件可喜可贺的事。但是,完成了N+1,将来就会有N+2,因此好的论文最后都会从学术角度,讲一下自己未完成的工作,这些工作或许是自己正在进行的,或许是留给同行的。到此,一篇论文才算完整。
从这个写作过程可以看出,它似乎就是一篇中规中矩的文章,有点儿像中国过去的八股文。学术界对规矩从来是非常看重的,一旦守规矩,写出来的必然就是“八股文”,没有太多可以发挥的余地。能够按照上述的条条框框写出一篇“八股文”,至少是符合要求的。
写科技论文,下面三件事一定不要做,不会有好处,只会帮倒忙。
第一,吹牛。过分强调自己研究的重要性,上升到非常高的高度,生怕立意不够高被拒绝,这样的做法是在帮倒忙。很多学者的论文有这样的毛病,喜欢宣布自己解决了一个天大的难题,可以改变世界等,即便是真的,也都是废话。在学术圈子里,同行对这项研究的背景和意义都比较清楚,意义是否重大,无须费太多口舌。有时,一些人工作本来做得还不错,这么一写,读者反而不知道哪些工作是他完成的,哪些是吹牛了。科技论文不是新闻报道,不需要什么事情都要上升到一定的高度。至于发明和发现是否那么重要,一切看结果就清楚了。那些大话、废话,除了占用宝贵的篇幅,对论文没有帮助,甚至只有副作用。
其实,不仅是写论文,在申请经费写报告时也是如此。
第二,贬低同行的话。一些人为了显示自己的工作多么有水平,自吹自擂,把前人的工作贬得一无是处。要知道,审稿的人,可能就是那些被贬低的同行。是否比同行做得好,有了数据自然明了,不需要抬高自己,贬低别人。