• 科学论文写作要点(2019-10-15更新)

    发表的论文是写给读者的,不是写给自己的,因此,要保证读者有兴趣读你的文章。描述自己的发现,然后用实验数据支持你的观点,逻辑地下结论。写给别人,要求文字和数据都能清晰的表达!写作顺序不要根据实验的时间顺序,而要遵从逻辑顺序。

    编辑喜欢的文章:

    1. 同行认同的强有力证据支持的文章;

    2. 对领域有更深的理解,解决重大问题或开发新方向;

    3. 有更大的实际应用价值,提供应用可行方案。

    如何挑选杂志:

    1. 通过读相关文章,找到喜欢发表类似领域文章的杂志;

    2. 在杂志网站寻找该领域文章的发表的标准。
     

    编辑的最爱:

    接下来,编者会介绍生命科学和物理学中,他们喜爱的例子。

    一个nature的例子

    当你被细菌感染,你会肿胀、发红、疼痛,这些每个人都知道。生理学家告诉我们,它有一个发展顺序:细菌引起炎症、肿胀并释放一些东西,然后激活神经元引起疼痛。

    这篇文章发现了顺序上的不同。它发现细菌首先激活神经元,而免疫系统和炎症是可有可无的。神经元上的细菌直接引起疼痛,反过来神经元释放一些分子调节免疫和炎症。这与以往的认知相反。就这篇文章的影响而言,很难找到切入点,因为它的确影响到基础科学、应用科学和临床。很明显,它可以改变人们在医院谈论细菌如何引起炎症和疼痛的话题。

    作为一个基础科学杂志的编辑,我对科学意义和潜在的疯狂想法感到兴奋。这篇文章,细菌直接影响“伤害感受器”神经元系统,“伤害感受器”系统随后调节免疫系统,但是,还有其他感觉神经元,其他感受神经元也能从细菌那里直接获得信息,然后调节免疫系统吗?

    该文打开了神经元系统和免疫系统互作的潘多拉魔盒。但是上述一切,需要非常多的结果,是涉及很多人的重要研究,它明显不是在Nature发表的唯一途径。所以,如果在这篇特别的文章中吸取一个教训,作为一个研究人员,在整理一篇论文之前,它是一个项目,可能你应该将自己放在裁判的位置问自己所有该问的问题,在所有问题都得到解决后(复选框打勾),你可能在审查中得到很好的体验。

    又一个nature的例子 (生命科学)

    它是一个基本的细胞过程,叫做泛素化。泛素是附着在其他细胞蛋白上的小蛋白。细胞中的任何蛋白实际上都可以被泛素化。一旦蛋白被泛素化,它们被标记,或者降解或者改变活性或稳定性。实质上,泛素,像其他转录后修饰器一样,例如磷酸化,是一个化学组,绑定在蛋白上,影响他们的活性。

    泛素化的一个工作背景(案例)是标记受损线粒体上的蛋白。本例中,一种E3连接酶叫做parkin,将泛素绑定到线粒体表面的蛋白上,但是为了让parkin正常行使功能,它必须被一个叫做PINK1的蛋白给磷酸化。我们知道PINK1对parkin的磷酸化是该反应所必须的,但这还不够。这篇论文发现泛素也能被磷酸化,这是这篇文章最重要的信息。但是,真正在编辑水平上感到兴奋的是,就像我前面解释的,细胞内的任何蛋白都可以被泛素化。所以尽管在这篇文章中,他们已经展示了parkin泛素被PINK磷酸化的背景(案例),这可能也与各种其他蛋白有关。任何被泛素化的细胞内蛋白也可以被进一步被这样的磷酸化影响,这本身非常重要,因为泛素是一个转录后修饰器。

    这篇论文展示了转录后修饰器本身的转录后修饰,新增加了复杂的一层,细胞内调控的新层。同时,PINK和parkin是重要的蛋白,因为它们与理解帕金森症有关。在一些熟悉的疾病形式中,这些蛋白中的每一个都是单独突变的。最终,PINK和parkin也是细胞质量控制过程中的调解员。这篇文章的优点是什么?是新奇的概念,一个泛素被磷酸化的新现象,也在各种角度引起广泛的兴趣。

    令研究团体非常兴奋的确认该工作的是,几个星期之内,三个不同的独立研究组发现了相同的结果,三篇文章基本上一起发表。实际上,我们在新闻和观点文章中报道了这三篇文章。给一个建议,这个建议不仅适用于细胞生物学家,也适用于想在Natrue或其他杂志上展示自己工作的科研工作者,用Covering letter去展示你们的优势和解释这篇论文的重要性,以及为什么这篇论文适合该杂志。

    再一个nature的例子(生命科学)

    到今年为止,我处理过的优秀的稿件之一,叫做“世界珊瑚礁鱼类的恢复潜力”。珊瑚礁是世界上生物多样性最丰富的海洋生态系统之一,因此非常重要。但是,他们也是世界上最受威胁的生态系统之一。这源自至少3种不同的威胁,一个是气候变化中的温度效应,引起珊瑚漂白。另一个气候变化引起的原因是二氧化碳的增加,它引海洋酸化,使珊瑚结合更多的钙。最后一个威胁是捕鱼和过度捕捞。这篇文章着眼于开发珊瑚礁使鱼类生物量减少。

    本文的标题导致需要找出未开发珊瑚礁的鱼类生物量,事实证明,它是每公顷一吨。要得到这个数字,作者对未开发的珊瑚礁和已开发的不同时期的珊瑚礁以及已经被保护了不同时间的珊瑚礁进行了观察。还做了时空替换。然后,他们回看这些巨大的数据集,他们有全球800个珊瑚礁。他们回看降级情况,发现全球80%的珊瑚礁比未开发的降低50%甚至更低。因此,这篇优秀论文发表的关键之一是巨大的数据集。

    这里,我们查看了800左右的珊瑚礁,我们搜集了大约10年的数据。那不是说在Natrure发表的文章必须用大数据,但它是写Natrue文章的组分之一。通常有至少3到4个不同组分合并到一起组合成一篇Nature文章,这些组分包括数据集的大小,新概念,提出以前我们不知道的数字,令人瞩目的技术,令人印象深刻的大量统计分析。

    然后,你会得到启示。本文对海洋保区和可替代海洋保护区的政策有启示。所以,3到4个不同的方面聚在一起带来了一篇Natrue论文。最终发表在Nature上的论文会发生什么?不是单一的因素让他们能够发表在Natrue,需要有一系列属性使它成为Natrue论文。显然,你看到,发表的文章与几个月前接收到的原始稿有明显提升。所以请牢记,不要被收到的评审意见吓倒,同行评议是提供建设性意见的强有力工具,用来提高我们的文章水平,这就是为什么我们最终能发表伟大的作品。

    一个Nature Plants的例子

    有一篇文章对我印象深刻,题目为:“通过在空生态位增加植物资源评估入侵性的发展”,发表在《自然植物》杂志。它是一篇好文章,因为它很容易吸引读者全览此文。它具有优质引言、清晰的实验设计和明确的结论。在这方面,它绝对是一篇好文章。该文章观察加利福尼亚的一种叫做黄星蓟的杂草。黄星蓟自从1900年代引入开始一直生长到现在,而它原本生长在地中海气候中。它在快速的增长,一些人认为其是加利福尼亚最具入侵力的植物。

    这里,我们关注的问题是为什么这个植物能在加利福尼亚如此成功,在地中海,它是一个表现完美的植物,不接管任何地方,它谦虚的坐着,与周围的环境和睦相处。研究人员没有把它与当地杂草做对比,去得到它的优势特征,这些是过去研究外来入侵植物所做的。他们关注的是黄星蓟到底有什么不同,怎样在地中海生长。它们从加利福尼亚各地取样,也从地中海采集了植物样本,从这些植物中取出种子,播种在温室受控环境下,观察是否它是相同的植物,或者是否有不同的特性。

    长话短说,星蓟有能力超越加利福尼亚的本土植物,事实似乎并非如此。它更像是在生态位上生长良好的植物,而这个生态位是当地植物让出来的,出于某种原因,让出生态位的植物已经死了,星蓟利用它们不再占用的生态位。在某些方面,这是很小的研究。只包含1个植物和加利福尼亚的一个地点。但是,我认为它会刺激其他人和其他研究者,去关注他们自己关注的植物是否也正在发生类似的情况。它有点像换一种方式观察外来入侵者。

    我们趋向于认为外来入侵植物不好,它们破坏自然生态系统,赶走已经存在的植物。而本例中,似乎不是这样发生的,因此,我认为它是一个以不同视角看待事物的好案例。它为我们提供给另一个看待外来入侵的方式。

    一个Nature的例子(物理)

    一篇处理洛伦兹对称性的文章在一月份发表。他们使用了新、老两种方式测试洛伦兹对称性。换句话说,他们使用被困的离子,它将量子信息技术用于基础物理测试。在物理学上,洛伦兹对称非常重要。它基本上意味着物理定律在不同的参考框架。什么是参考框架?例如,如果你正匀速驾驶一辆汽车,火车以不同的速度行驶,这些可以是不同的参考框架。问题是,在所有参考系统内,物理定律都是一样的吗?以不同的速度移动或改变参考系统。

    所以,你如何测定洛伦兹对称性是否真实?经典的测试是迈克尔逊 – 莫利式测试。他们使用一束光,射入干涉仪,光有两条途径,如果两条途径的光线速度不同,它应该是可视的,你最后可以看到的干涉模式。作者做了什么?基本相同,但他们使用电子波包,不是一束光,在对称测试中它具备一些优势。因此,我认为这是一篇非常重要的论文,因为使用被困的离子和波包的想法去测试洛伦兹对称性,具有原创性和新颖性。

    那些被困的离子已被大量用在量子信息,但是将他们用于精密测试,比如本文,是非常原创的想法。第二,使用这个技术,他们得到了非常精密的结果。所以,他们能够确定洛伦兹对称式1018电子的一部分,这非常重要,因为它超越了一个里程碑。10-17,是弱电力和万有引力间的比率,正如期望那样,洛伦兹平衡违反了它。因此,精密度高于这种里程碑。所以,我认为这是一个非常有趣的结果,它也将为其他研究者改善这个结果提供途径,只是在精度方面。但也得到了量子信息和精度测试方面的灵感。

    又一个Nature的例子(物理)

    十二月,我们发表了一篇珍宝级的论文,叫做《蜘蛛感官系统启发的超灵敏机械裂纹传感器》。

    当这篇文章第一次摆在我的桌子上时,非常与众不同,我不得不阅读两遍,三次才完全理解作者所作的工作,和可能的重要性。他们写了很长的引言,关于蜘蛛的仿生学。我最终了解到,这篇论文非常棒,它用仿生学设备概念,开拓了一些列可能的应用范围。

    这篇论文,作者用很薄的铂金膜做了一个高灵敏度的机械传感器。它只有20纳米厚。它能在薄膜内通过小心的弯曲产生微小的裂缝。

    这篇文章成为Nature论文有几个原因。一个是它证明了一个新奇且吸引人的设备概念。第二,它在一个火热的领域取得了明显进展。第三,论文论述了一系列实际应用的范围。例如,他们证明了传感器非常灵敏,可以检测瓢虫震动翅膀。它能检测得到嘈杂环境中人们演讲的不同内容。他们能在皮肤上检测人的心跳。这非常刺激,其他研究者可以提出设想,关注具体设备的实际应用。

    小节一下:

    1. 发表可以让同行检验你的发现,也引领该领域的进步。

    2. 专业的编辑会寻找有数据支持且在该领域或相关领域做出巨大贡献的新发现。

    3. 尽早地构思文章非常有益。它会让你的文章更加清晰、结构严谨,能更好的为读者传递思想。
     

    进一步工作

    1. 做一个敏锐的读者
       –  当阅读一个论文时,大多数科学家会批判的评估该文是否有可靠的数据支持,是否有新的结论:
             – 在领域内是否有巨大进步;
             – 对领域有广泛的影响。
    2. 创建自己的科学写作工具箱
       – 搜集你认为有益的文章案例,为未来写作积攒灵感:
             – 科学评论;
             – 图表;
             – 结构;
             – 短语;
             – 术语。
    3. 在你写论文时问自己:
       – 你应该在文章中回答一些问题,确保读者能够理解你的工作。在大多数文章中你都能找到答案,你需要考虑的是,在自己的研究中回答相同的问题:
             – 我的工作有什么用?与领域内科学家做的工作有什么相关性。
             – 目标和假设如何从我之前的工作中得出?
             – 让读者信服我的结论,应该做什么?怎么呈现和解释数据?
             – 在领域里,我的发现怎样改变当前的理念。
     

    有效写作的ABC

    什么是写作的ABC?

    我们都知道写作很难。通常情况下,只是把文字罗列出来很简单,难就难在,不仅要让同行或者对该领域有了解的人明白,更要让普通读者也清楚你在做什么。这里有三条规则:A是准确,B是简练,C是清晰。

    准确

    怎么理解准确?准确就是确保你的读者可以明白你写的是什么,没有模糊的描述。模糊的描述容易引起很多问题,比如用词不当引起误解。

    “16.9倍的基因组覆盖,主要通过454的成对合成配对和未配对,剩下的覆盖率由Sanger测序获得。”如果你看到这句话,会觉得很难理解。

    我们改为“16.9倍的基因组覆盖,26%被Sanger引物测序,剩下的74%来自454测序平台的成对和非成对合成测序(附表1和附表注释)”就清晰多了。当然,还需要解释这些百分比是如何计算出来的。

    简练

    简练很难做到,相对简单的是用一大段文字进行描述。

    保持文字简练时一定要注意,不要使用华丽的辞藻和过多描述,这样会让文章失去重心。保持简练很重要,但同时必须准确。

    有一个例子,原文为“基于这些结果,我们假设接种疫苗的对照个体与用化合物X处理的相比可以呈现相同的细胞因子谱。评估该假设,我们对比了接种疫苗的对照个体和接受治疗的患者。我们发现了高频率的…”。句子冗长,有很多冗余和重复。事实上,也很难读懂,可能需要再读一遍才能知道文章描述了什么。

    修订版就好多了。“基于这些结果,我们假设接种疫苗的对照个体与用X复合物处理的患者都呈现出相似的细胞因子谱。相比之下,我们发现较高频率的…”。这非常精简,移除了重复和冗余,用一个句子取代两个句子。把两个句子合并成一个可能在大多数写作中都是黄金法则。

    清晰

    我经常要求作者提交手稿时描述的更加清晰。常见的是好几件事被聚集在一个自然段,或者一件事被拆分到不同段落或部分。这很难让读者跟上你的思路。

    “而黑猩猩广泛分布于赤道非洲,矮黑猩猩,有相对较小也相对较远的栖息地,那也意味着他们是最后描述的猿,居住在刚果共和国刚果河以南(图1a),是稀有的类人猿。”长句中两件事,使得它很难读懂,很不清晰。

    所以,修正的版本为“而在赤道非洲广泛分布黑猩猩,矮黑猩猩则在刚果共和国刚果河以南居住(图1a)。由于相对较远和较小的栖息地,矮黑猩猩是最后描述的类人猿物种,也是圈养的最稀有的猿类。”我们将一个长句分解成两个句子,每个句子只说一件事。这样,句子清晰了,更容易阅读和理解。

    写作风格中的常见问题

    最常见的三个问题是歧义、不必要的复杂性和被动的声音。

    歧义

    经常能够看到的是模糊的比较,比如说一些东西比另一些东西重要,却并不说明另一些东西是什么。

    it的指代不明确也很常见。

    另外,人们趋向于使用拟人的写作手法。一些人喜欢写“癌细胞很有个性,决定抗击肿瘤治疗,在人体内逃跑和转移。”这确实是用简单的方式去解释,但是并不准确。事实上,拟人手法应该尽量避免,因为它不是科学语言。

    不必要的复杂性和被动的声音

    另一个重要问题是简短和清晰。用短的单词永远比长的要好,比如在讨论或其他一些地方用use代替utilize。这主要是由于很多人的英语非母语,你要考虑句子长度等问题。

    更加华丽的描绘常常难以理解。所以,另一种简短和清晰的方式是你将它说出来。当你自然表述的时候,你会使用更短的单词并将你的信息表达的更清晰。然而,一定要小心,不要用口语词汇来写作。不要使用缩写词,如can’t、won’t、don’t等,诸如这些。你不会在科技论文中看到这些,所以也要避免使用它们。

    在你的写作中要注意时态。在描述你已经做过的事情时,倾向于使用被动。但是,你也应该考虑使用积极的声音。例如,”某某技术曾被用来鉴定…“,你可以换成主动的声音,”我们使用某某技术去发现了…“。主动比被动更短、更清晰、更容易理解。用主动表示我们做了什么,用被动表示别人做了什么,读者更加容易区分,这在科学写作上非常重要。

    构建段落

    内容的主要单元或主要的文字,或者介绍、结果、讨论部分都由段落构成。理想情况下,每个段落解释或描述一个主题。当看一段话的时候,开头和结尾最能抓住读者的内心。因此,写好开头和结尾尤为关键。

    一般的,写一段话的方式有两种。第一种是从上到下的方法,在段落的第一句强调你的主题,然后解释它的意思,用证据证明它,等等。从上到下的方法在科学文献中最常见,因为易于阅读。读者可以通过第一句话获得整段的主题。

    构建段落的第二种方法是自下而上法,在讨论部分非常常用。例如,你具体的描述都做了什么,然后再最后给出结论。在讨论某种特定的方法或具体的结果得到某个结论时,最好使用自下而上法。

    高频问题

    1. 收到有问题的的文章,编辑会怎么做?
     

    文章的第一次评估,语言不是问题。只要编者能理解研究者所要表达的即可。之后,如果文章语言接近发表水平,简单的完善;如果语言不足以发表,编辑会要求让母语是英语的人帮忙修改。首次体检,不用太担心英语水平。
     

    2. 对非英语母语的人写文章,有什么建议吗?
     

    我的母语也不是英语,根据我自己的经验,写第一篇论文很难。必须要做的是,阅读大量文章,观察短语、结构等,看看摘要如何组织,尽可能列出常用短语,以备自己写文章的时候使用。

    小结

    好的文章需要发现新的东西,并用数据证明它。时刻认识到写文章为了交流,而不是写给自己。
     

    文章不是简单的罗列,要针对目标读者而写。保持准确、简洁和清晰。
     

    – 每个段落一个主题或一个概念。

    – 正确使用主动时态。

    – 用简单的词汇,但需要专业和精确。
     

    设立个人目标
     

    花时间审视自己的文章。检查文章是否达到准确、简洁和清晰。改善歧义、不必要的复杂和错误的被动。

    例如,你是否倾向于写长句子?如果答案是是,尝试将不同的主题分开到不同的句子中。修改你的文字时,通常超过25个字的句子要转变成短句,每个句子中一个主题。进行一些练习,你的写作风格会明显改善。

    标题和摘要的写作

    作为一个读者,什么可以吸引你去读一篇文章?

    标题和摘要通常来说是最早进入读者视线的,是文章的第一印象。文章的读者类型多种多样,其中不仅有领域内的专家、学者、审稿人,也有相关领域的人员甚至普通大众。你的标题和摘要需要有足够的吸引力来获得更多人的关注。

    从直觉上讲,同行是你文章关注的目标,他们非常专业,可以理解你文章的每一个部分。你的同行很容易通过相同的关键词发现你的文章。但是,专业人士毕竟是少数。一篇文章,想要具备一定的影响力,就需要更多的人来引用。而引用文章的人可以是同行,也可以是其他相关专业的人员。

    大多数读者喜欢使用类似PubMed这样的搜索引擎。结果一般会列出标题,或者一些简要信息。无论发表多久的文章,好的标题和摘要都能让人提起兴趣浏览全文。

    一般来讲,看题目的人最多,其次是摘要,最后之后很少的人看文章内容。有吸引力的标题让人更想看摘要,有吸引力的摘要让人更想看内容,提高读者的范围和数量,并且让他们在文章中找到他们想要的,就会增加引用率。

    大多数读者只阅读或付费他们想要的内容。因此,在合理的范围内,标题和摘要都应该是独立齐全且易读的,以便潜在读者理解你的发现。

    特色标题的价值

    人们看的最多的文章部分就是标题,它是一个切入点。因此,文章的标题一定要易于理解。你针对的目标不要只限于专业人士,还要广泛争取相关专业的读者。

    标题可以容易并免费得到。请尝试让其具有独立性,即概括工作的主题,采用的方法,关键点,以及你想要读者了解的核心参数或发现,以便吸引他们看后面的内容。

    基于以上几点,你在标题上花费的时间会比你想象中还要多。它可能并不是你写文章的第一件事,文章完成后去修改他可能有更多的意义。

    以下情况请慎重考虑:我已经完整的写下来,我已经全览了所有内容。现在标题是最适合的吗?已经表达了我想要表达的吗?花一些时间考虑,它是否合理,是否易于阅读,是否符合目标杂志的要求。

    很多杂志编辑可能会帮你修改标题,记住,当编辑建议你修改标题时不要惊讶。这是整个过程的必要部分,可以让你的工作更清晰的展现。

    有效的撰写标题

    如何有效撰写标题?引起他们的兴趣并阅读摘要。

    写出陈述性、有吸引力和专注的标题

    标题要具有“陈述性”、“有吸引力”和“专注”。

    写英文文章,需要准确、简练和清晰,英文标题也是一样,还需要增加陈述、吸引力和专注。

    陈述是清晰的告诉读者它们需要什么,例如,如果你发现了对某事情的影响,不要只说有影响,要说影响是什么,是增加了?抑制了?等等。这种细节会在标题中起到很大作用。

    吸引力并非是在标题中使用流行语,它不是用讲笑话或类似的方式吸引人。它是你文章的发现,要让读者清晰的看出你的发现,没有其他的。

    专注是关注主要发现,而不是解释整篇研究,不要把所有研究内容都概括进来。常规的研究和分析不是读者感兴趣的点,只有那些新发现才能吸引读者继续读下去。

    写一个特别的标题

    自然物理作者带来的一个标题,叫做 “拓扑薛定谔猫”。有些人看了可能会很感到兴奋,它的信息量不大,说实话,甚至缺乏可信度。它非常适合作为新闻或观点的标题,但是不适合作为研究论文的标题。研究论文的标题必须特别的,信息丰富的,包含必要的关键词,所以我们将其编辑为信息量更大但有点无聊的标题——拓扑缺陷的非局部量子叠加。

    小节

    题目要包含做了什么,有什么发现(效应),试验条件(如体外体内),什么引起了差异(如果是已知的蛋白或激素,需要给出名字),顺序并不固定。

    避免在标题中出现

    复杂描述

    一般,在写作标题时,不要出现复杂的描述,它会让你的标题过长,占用篇幅,读起来也别扭,也容易引起歧义。比如,“过量水分重量移除器”这样的描述应该直接用“干燥器”来代替。在英文中,如果换行,通常会增加破折号,而复杂描述在换行时,中间出现破折号,会改变原来的意思,因此不推荐使用。同时,避免在题目中使用首字母缩写,这很难让人理解,尤其是外行。

    缩略词或缩写

    缩略词和缩写是你给读者挖的坑。在标题中使用它们的问题是,你的读者在阅读全文前,根本不知道这个缩写的含义,标题永远是最先出现读者面前的。

    尽量避免缩略词或缩写出现在标题,尤其是不常见的,甚至是你自己定义的词,绝不能出现。所以,请尝试将其拼写出来,那些知道的人会主动跳过这里去阅读其他部分。

    标题中的问句

    在标题中提出设问或疑问应该尽量避免。标题中的问句可以吸引眼球,但你最终给出的答案可能并不是读者想要的,非常容易引起读者的不满和失望。因此,尽量不要这么做。比如:“一个巨大的精子有多长?”这是一个非常普遍的问题,在当时也很新潮。但是,没人能在标题中找到真正的意义。

    Reference

    Pitnick, S., Spicer, G. & Markow, T. How long is a giant sperm? Nature 375, 109-109 (1995).

    双关语

    直接了当的标题可能会让人感觉有些无聊。有些人会想,是不是应该在标题中加入个玩笑,或者双关语或者有趣的陈述,或者隐喻、比喻等等?

    这么做通常是危险的,而且经常事与愿违。读者的英语水平可能无法理解你的玩笑,或者你为了加入玩笑,有些重要的信息没有写在标题中。读者可能会感觉,有些重要信息没有直接表达,或者看上去什么也没说,最终好像只说了一个笑话。

    读者可能会对这种标题表示反感,他们会觉得这里没有想要的答案,或者认为作者不够严谨,没有认真对待这篇文章。仅仅阅读标题,找不到文章要说的重点是什么。

    知识检测:确定有效标题(生命科学例子)

    读一读下面的摘要,找出最适合的标题。用你之前所学,回想标题需要哪些特性。

    摘要

    为了抑制全球530万人死亡,全球体育大流行。我们需要理解支配身体活动的基本原则。然而,全球自由人口的大规模体育活动部分发现了一个缺乏。在全球范围内,智能手机充当了杠杆的作用,去测定体育活动。我们研究了全球111个国家,717527个人在680万天的数据,它提供了一个了解体育活动的窗口。我们发现在国家内部,体育活动的分布不均匀,它与使用均值相比,可以更准确的预测肥胖的流行率。女性活动量的降低在活动不均衡中占了很大部分。内置环境方面,例如提倡行走的城市,在活动量和活动不均衡方面与性别有较小关联。在更提倡行走的城市,日活动量、周活动量跨越年龄、性别和身体质量指数(body mass index,BMI),女性的增长幅度最大。我们的发现对全球公众健康政策、城市计划有启示,突出了活动不平衡和环境内盖上活动量和健康的作用。

    问题

    下面哪个标题最合适:

    – 城市环境影响活动不平衡和肥胖

    – 一步一步理解物理活动水平和肥胖

    – 全球体育活动测定发现活动不平衡,它受环境因子影响,比用均值预测更准确

    – 大规模体育活动测定数据揭示全球活动部平衡

    – 全球活动部平衡在环境内削弱

    – 体育活动水平等于世界人口?

    答案

    – 大规模体育活动测定数据揭示全球活动部平衡

    选择论文的关键字

    当你写出了一个好文章,你需要的是让更多的人能够读到它。这需要更多的人能够发现它,有必须把文章提交到网络搜索,这就需要你选择好关键词。我们建议每200字的摘要选择3-5个关键词,如果可以,尽量包括标题关键字。有些期刊需要在它们提供的列表中选择5个或更多关键词,有些则可以自定义。这有助于你的文章在数据库或网站索引中被发现。

    如何写摘要

    不同的领域和不同的期刊对摘要的要求和惯例不同。然而,一般而言,摘要是文章的迷你版,需要反映你的工作是什么,读者根据摘要认定是否值得查看全文。

    五问题技术

    构建摘要的方式有很多种,有时候,它需要根据欲投稿期刊的要求特别格式书写。常用的构建方法还有5问题方式,它提出5个问题,然后一一回答:

    – 为什么做?

    – 做什么?

    – 怎么做?

    – 发现了什么?

    – 有什么意义?

    首先,为什么做是工作的大背景。你要回答的一般问题是什么?什么是最大的挑战?你需要填补哪些知识缺失?为什么你想把这个研究放在首位?

    然后,做什么?你用什么精确的方法去回答上个问题?你想要尝试哪些事情?为了理解问题和解决问题,你采用哪种方法?

    如何做?比上一步更进一步,解决问题的细节,特别的方法。

    你发现了什么?将所有的发现放到初始框架下,结果是否与答案相关?答案是什么?你发现的事实是什么?

    它有什么意义?总结整件事情,联系上下文。现在我们理解了X,现在告诉我们首要的问题或者上下文中更广泛的问题,或者研究可以从哪里开始?

    你可以想象一个沙漏,沙漏的形状代表了宽度和广度。5个问题中的第一个问题写的要大,考虑更大的事件和更广的关联。随后慢慢缩窄,落在独特和具体的着力点上。后面,再次变大,从你的结果出发,未来的研究应该从哪里开始。

    Nature的摘要段落

    自然杂志这编辑建议读者使用的摘要段落,包括Natrue Letters。

    该结构是Natrue的特别结构,也适用于其他杂志:

    – 有介绍

    – 有一个句子关于缺失的知识或你想要解决的问题

    – 这里我们展示了…,真正发现了什么,你的主要声明(我们做了什么,得到了什么结果)

    – 你做了什么的简要介绍

    – 你工作的启示。

    介绍部分不要超过3句,给你的研究要给大背景。你想要解释的,在领域中发生的现象,我们建议这部分具体写。

    然后,描述缺失的知识,突出问题,一般不超过一句话。

    简要提出你的声明。

    用几个句子,通常是摘要中的最大部分,描述你做了什么,用什么方法来支持声明。

    启示方面,再一次具体些。这些结果中有什么新观点,这个方法或具体研究开放了那些研究领域?

    摘要中要避免的

    空句子

    很多人在声名的时候,总是喜欢用里程碑、基石、核心等等,但是在文中却没有这些文字的证明信息。不要提未经证实的内容。

    小结

    标题:

    陈述性:清晰描述你的主要发现

    有吸引力:唤起读者继续看全文

    专注:给读者提供最有用的信息

    摘要:

    – 为什么做?

    – 做什么?

    – 怎么做?

    – 发现了什么?

    – 有什么意义?

    少数人喜欢先写摘要,需要注意的是,随着草稿的书写,摘要可能需要相应做修改,请在全文完成后再次审视摘要。

    写论文:画一张图

    重要特性:

    – 目标和全文基调

    – 叙述流

    全文,有点像扩写的摘要。从背景写起,然后提出目标,展示结果,下结论。

    目标撑起整篇文章,你怎么解决目标,有什么发现等。最重要的是,文章所有内容必须和目标相关联。

    前言是非常少量的背景信息,让读者快速的聚焦到你的目标上面。

    讨论时对结果部分的深度挖掘,并讨论相关问题。同样,检测你的结果是否适合前言中的文献。

    纵览全文,论点集中在具体的目标跟合理性上面,也包括特殊结果。简要总结新发现。仔细审视重要性、稳定性,找出进一步工作和启示。

    如何写引言

    引言是科技手稿中的核心部分之一。但它不是长篇大论,不是文献综述,不是大篇幅的。它应该只涵盖你的主题。

    引言第一部分是背景,让读者明白这篇论文是关于什么的。

    引言第二部分是吸引,告诉你的读者,为什么他们会对这篇稿件感兴趣。是临床上未被解释的现象?以前未应用在该领域的技术?或者其他一些能够让读者感兴趣继续读下去的内容。

    引言的例子

    下面是Natrue Letters的一个例子,结构分明。本来是一段,为方便理解分成3部分。

    1. 一般性的介绍

    回声定位系统是蝙蝠和鲸鱼等独立进化出来的复杂表型性状,包括发出、接收和超声脉冲的声音处理,用于躲避障碍、辨别方向和捕猎。

    2. 面向该领域的读者,需要进一步调查

    最近的进化研究发现,蝙蝠的回声定位系统并不都是一个血统,旧世界水果蝙蝠没有这个系统。说明,蝙蝠至少进化了两次回声定位系统,亦或旧世界水果蝙蝠进化早期丧失了该能力。新的证据支持之前的观点:蝙蝠回声定位的分界点似乎是听力相关的几个基因的碱基替换。此外,蝙蝠和鲸鱼的一些听觉候选基因也出现平行改变,这也是高频率听觉的证据。潜在的其他回声定位系统的基因已经在鲸鱼和蝙蝠序列中定位到了。

    3. 声明本研究的目标

    这里,使用回声定位进化作为表型收敛的模型,我们调查了蝙蝠和鲸鱼独立进化过程中已经发生在基因组上面的平行改变程度。

    如何写方法部分

    方法部分是你的文章与同样专家交流的重要组成部分。方法部分要足够详细,让同行能够重复实验并获得相同的结果。

    如果你培育一个材料,你需要足够的细节让同行可以培育类似的材料。如果你使用光谱方法,你需要介绍所有光谱方法需要的参数。

    假如你不清楚是否提供了足够的细节,可以将这部分交给同行,看其使用你提供的方法能否重复实验。

    如何写结果部分

    显然,结果部分要包含结果,可以是实验测量的数据,也可以是计算数据。

    记住,不是讲数据罗列在这里。确保指出数据的关键特征,同时,确保你解释你的结果。你如何做的实验、如何计算和为什么要做。

    这个部分也包含图表,用于帮助读者理解你的数据和你的收获。有逻辑地呈现你的数据和结果,不要按照时间顺序。确保你强调了真正有意义的结果特性,并提供描述。不要把所有结果列出来!

    结果的结构有很多,可以按照自己的逻辑书写,这里提出一个例子。

    第一,分开所有的实验和计算。每段对应一个实验或计算。

    第二,每段像这样写:第一句是实验的目的:”为了调查A或B对X的响应,我们调查了这些“。然后呈现相关的图表,通常用图、表或两者都用。最后用简短的句子概括基本结论,通常这样说,”这表明这或那显著依赖于X或Y。“

    接下来,下一段与上一段用相同的方式描述。你可以联系以下前一段,这样文章更通顺。

    数据提交存储

    将自己的数据提交到数据存储库(知识库)有很多好处。

    首先,一些杂志,比如Natrue系列的杂志会要求作者将数据共享或提交到知识库。

    第二,这样做可以方便的让其他研究者在你所作的基础上继续进行进一步研究,它会提高你在学术领域的知名度和地位。

    第三,便于其他研究者和自己理解数据。当时间比较长,感兴趣的其他研究人员问到你的数据时,你可能已经忘记了具体的步骤和结果,甚至找不到原始数据存放在哪里。将数据提交存储到公共库,可以随时进行查看,回答其他研究者的问题。

    第四,尽早地将数据提交到知识库,可以利用知识库固定的格式查看自己数据的问题,修正数据的错误,同时,可以分享给你的合作伙伴,协作处理数据。统一的格式有助于全球科学家共同发展。绝大多数知识库都具有私有属性,在发表前,不会公开。

    最后,将数据共享到知识库是研究人员的责任,无论所选的期刊是否有这方面的要求。在知识库,数据可以存放5年甚至20年的时间,它不会改变,不会丢失,任何人想要在此基础上进行研究都能很容易的得到。
     

    Recommended data repositories – 推荐的知识库列表

    高频问题

    将数据提交到知识库的最常见问题:

    1. 我应该选择什么样的知识库?

    2. 提交到知识库我应该做什么准备?

    3. 谁有责任对知识库中的数据进行公开和维护?

    请首先选择自己的领域的知识库。在生物学中,可以去biosharing.com这类网站,了解信息标准。此外,Scientific Data网站列出了70个数据知识库,你可以浏览一下,查看哪些是应用在你所在领域的。网站也列出了一些复合数据知识库,在那里可以存放不同类型的数据。我们也鼓励作者将数据提交给自己单位的相关部分,最近,很多单位图书馆设置了提交选项。

    当你准备提交数据到知识库时,最好先浏览一下知识库的网站的要求,了解数据类型的最小信息标准,这些都能在知识库网站上找到。知识库官方会提供一个建议提交标准,最好按照该标准准备数据。请确保你提供了数据相关的足够信息,也叫做元数据,其他人可以通过这些信息理解数据,它怎么生成?用什么技术?表如何组织等。数据的版本也很重要,如果你的数据在不断发展,请确保你有最原始的版本,方便其他人回溯到原始版本重复分析过程。

    数据知识库由不同的组织维护。最早的和最大的知识库由国家发放或国家基础服务资助。NCBI是最早的数据知识库系统之一,由美国政府资助,EIB基本上是其欧洲的双胞胎。中小规模的知识库通常由个别机构或个人项目资助。DataSite系统将数据链接起来,你释放了数据后会得到一个DOI,方便引用。

    如何写讨论

    讨论部分在结果部分下面,是对结果的解释和评估。最重要的是讨论启示,为什么它重要以及发现了什么。

    从审稿人和读者的角度去看问题,预测他们可能产生的疑问,然后自我批判。不要怕解决研究中或数据搜集中的问题,也不要害怕去解释为什么你的研究中有些情况是不可能的。

    这部分也要写“为什么读者要相信你的数据?你用了正确的方法吗?”更重要的是,你需要回到最初的问题,你前面声明的一般目标,你需要说服读者,你确实回答了先前研究问题。

    结果和讨论部分的结合

    有些期刊会要去将结果和讨论部分合并,而不是单独分开。可以有很多写作手法,这里提供一个。

    可以这样开头,你想要调查这或那,为了调差它,你测定了某某某。然后你呈现结果(图或表)。接下来,提供这些结果的简短结论。再进入简短的讨论,你需要关注结果的评估和解读,最重要的可能是结果的意义。

    这个结合部分的核心是讨论。从一般的目标开始,得到结果,然后提供讨论。

    结果和讨论的动词形式

    动词的形式决定准确性水平。请确保你所谈论的假设、事实和新发现用了正确的形式。

    避免过度炒作你的工作

    不要夸大结果的意义,比如用改变了模式或者改变了游戏规则这样的描述。在结论的结尾处,很多人喜欢这样说。这种改变很少,可能一个世纪的内都可以用手数出来。所以,请小心的考虑真实的启示。

    知识检测:写一段话

    牢记所学的结构,平时做小实验的时候可以进行练习。一般400个英文字左右。每一段讨论一个实验,勇敢地解决你收集数据时出现的问题。

    • 实验目的:一句话描述实验的目标。
    • 实验方法:一句话到两句话说明你用什么方法实现目标。
    • 关键结果:简短几句介绍最重要的结果,引用图表。
    • 评估和解释:你的结果有什么含义?从结果中能推断出什么?
    • 启示:一两句话指出结果对该领域的影响,在此基础上下一步该做什么或能做什么?

    获得反馈

    邀请同事查看你写的段落,同时也帮同事看他的文字。尝试给出5条反馈意见,这里有一些建议:

    • 首局是否清晰描述了实验目的?太宽泛还是太具体?
    • 整段是否在讨论同一件事?
    • 段落中相关的各种想法是否都得到清晰的阐述?
    • 是否缺失了某些部分?
    • 段落过长或过短?需要增减。
    • 文字是否明确清晰?
    • 单个句子是否过长(英文)?过长请拆分成短句。

    自检列表

    一般问题:

    • 我的稿件讲了一个故事?
    • 文章前面清晰提出了主题?
    • 段落逻辑结构正确?
    • 所有段落平滑过渡?
    • 每个段落只包含了一个主题、思想或问题?

    引言:我们做了什么?为什么要做?

    • 清晰和连贯的背景介绍?
    • 报道了领域中所有相关工作的贡献?
    • 清晰的界定了文章的目标读者和读者范围?
    • 简要的介绍了我完成了什么研究?
    • 简要描述了我的主要发现和结论?
    • 相对于以前的研究,我当前的工作有意义吗?

    方法:如何做?

    • 已经提供了足够的细节,其他人可以用来重复实验?
    • 有逻辑的组织和呈现?
    • 合理的使用了所有的方法?
    • 统计方法描述足够详细?
    • 解释了所有数据删减?

    结果和讨论:你发现了什么?有什么意义?为什么要相信你的数据?我为什么关心?

    • 有逻辑地、清晰地呈现数据,提取和描述重要趋势?
    • 清晰的阐述主要发现?
    • 足够的证据证明结论?
    • 讨论点清晰,得出确切结论?

    结论:下一步做什么?

    • 已经讨论了新发现的意义?我的研究是否与我的目标直接相关?
    • 清晰描绘结果在相关领域的作用,提供改进或新的发展方向?

    数据管理

    科学来自于数据,数据是研究活动生成或搜集的材料或信息,它是研究的最终产物。数据管理在研究过程中非常重要。

    数据管理重要性有几个原因:

    1. 科学家有责任收集、管理、保存数据。科学家将数据分享出去,其他科学家可以重新计算、验证和在此基础上进行研究。因此,数据需要完整和准确。强大的数据管理计划可以帮助他们。
    2. 一些资助者、研究组织和学术团体要求数据必须保存或者可以保持可用,比如英国研究行为准则要求研究数据要保存十年以上。
    3. 一些顶级期刊要求数据公开、透明,以便其他研究人员可以方便的验证和使用。
    4. 好的数据管理计划帮助其他研究者不犯相同的错误,避免资源和资金的浪费。如何他们需要的数据已经存在,他们没有必要再做一遍相同的事。
    5. 越来越多的资助者(基金会)要求采用数据管理计划。
    6. 美国国家自然科学基金和英国威康信托都要求基金申请者采用数据管理计划。

    数据管理不善的风险

    数据管理不善很常见。牛顿的狗曾经碰倒了燃着的蜡烛,导致几年积累的数据付之一炬。现今时代,很少用到蜡烛,但数据管理不善依然常见。

    数据管理不善容易引起知识丢失。比如,一个知道特殊信息的且知道怎么样获取和使用该信息的雇员离职。

    数据安全计划也包含数据的信息,如果有人处理数据,但数据信息只有这个人知道,那么其他人在使用数据时就会造成困扰。

    用过时的或罕见的格式存储数据很难使用。例如:用软盘、光盘存储数据,很可能由于物理磨损等原因使数据丢失。

    数据丢失是损失最大的情况。目前,已经有很多免费的数据存储计划可供使用,用标准的格式存储自己的数据,方便自己的使用,也方便数据的分享流通。

    创建数据管理计划

    对所有科学领域来说,创建数据管理计划都是很好的做法。多数资助机构要求数据管理计划作为资助申请的一部分,那么,好的数据管理计划需要做什么?

    数据管理计划应该包括你的数据要如何处理,如何存储,以及项目结束后其他人如何获取到它。它不应该是一个固定不变的文件。

    理想状态下,文件应该随着时间的推移而升级。让它随着项目的进展发挥越来越大的作用。主要的调查人员和整个研究团队是计划的主管。事实上,任何直接参与数据的创建、收集和管理活动的人都是数据管理者。这个理念要传达给整个团队。

    可以确定的是,每个计划都应该根据搜集的数据类型而有所不同。不同的资助者或机构有不同的要求,但是,总有一些相同的部分。

    数据所有权是指谁控制和具有数据管理和使用的权力。资助者提出条件,研究机构和数据源,到底谁将最终拥有数据。一般情况下,如果是政府资助,机构或组织最终拥有数据,PI和资助机构只有数据的连接和使用权。通常,PI作为组织代表实际保管数据。然而,这些规则会根据机构或资助来源的政策而改变。

    数据收集包括元数据和纪录。在了解了数据如何创建和数据的实际情况后,你可能想要使用它。这就要求,你知道谁在保管这些记录,谁创建了原始数据,描述方法是什么。这些既适合于原始数据,也适合于数据处理过程。

    多版本保存是确保数据有效的必要方式。同时,也需要考虑数据的存储。例如,你要知道数据长度多少比较合适,同时,版本控制也需要注意,过多的版本也会占用大量存储空间。你是否已经需要转换成全部主流的数据格式?在计划中要明确这一点。文件命名也有讲究,标准的命名可以让团队中的成员快速找到想要的文件。

    请确保你的数据在今后仍然可用并且可以重复利用。你也需要说明你的数据想如何分享,在哪里分享。例如:你想要将数据分享到哪个知识库?你需要提供数据的详细信息。

    总之,数据管理计划最重要的是数据所有者、数据收集、数据记录、数据保存和数据分享。当你已经有了数据管理计划,记得告诉团队的每一个人并确保他们能够理解。然后,充分利用它进行下一步研究工作。

    分享数据的重要性

    大多数研究者在原则上拥护数据分享。在同行评议中,你的数据需要分享给审稿人和编辑。同样的,大多数研究者想要在文章发表后分享自己的数据给其他人,同时也希望其他人将数据分享给自己。

    可以说,数据分享已经成为学术交流生态系统中的一部分。问题是,这些交流大多在幕后完成,较少发生在公开的知识库,通常他们的交流仅限个人水平。

    为什么要进行数据分享?首先,电子邮件已经过时,联系变得困难。假如研究人员能够联系得上,电子邮件地址也没有更换,大多数数据存储在他的私人硬盘,这有很大风险。我们需要稳定的介质存储数据,以便其可以长期用于研究。公共知识库能够做到这一点。

    另一个原因,数据可以在很多方式上供人使用,也可以共享给个体研究者和小型公司。个人研究者可能难以决定数据怎么样进行再利用。非常好的范例:人类基因组计划,已经为美国经济做了9650亿美元的贡献,不仅是通过研究,也通过私人公司和研究人员等开发的工具。

    数据分享在今天非常迫切的被需要。在寨卡病毒或安伯拉病毒爆发时,起初数据分享非常顺畅,科学家和研究人员分享他们的序列数据和流行病学数据。然而,我们发现,仅仅开始时分享足够好,当事件离开媒体视线后,出现了数据缺失。

    我们需要持续性的分享数据。一些研究问题,对于个人或机构来说,究显得太巨大了,它需要全球的关注而不是个人或小团队单独研究。

    癌症是一个很好的范例。为了战胜癌症,我们需要强大的力量,每个人都可以查看所有数据。基于此,我们发现了各种癌症类型,非常多的突变,只有在共享和开放数据的情况下,我们才能做到。

    数据分享也对研究者有益。文章引用会出现额外的链接,这个链接的意义在于,公共知识库中的数据可以连接到你的文章,增加了你的文章被发现的机会,潜在的增加引用率。

    数据分享可以让更多的研究人员测试、验证你的数据,让你的数据更可信。另外,引用率也能让你获得更多的合作者。

    Dr Chris和他的研究团队,将他们发表的数据分享到了Scientific Data。另外,他们还在Twitter发推文,鼓励研究人员使用他们的原始数据和最新数据。

    Dr Daniele是神经科学计算学家,他使用了Dr Chris的数据。他觉得这个数据集组织的非常好,非常完整,包含了很多关键的信息和参数。

    FAIR是Findable,Accessible,Interoperable和Re-usable的缩写。译为:可发现、可连接、可互作、可重利用。它由科学家和组织联合体所提倡,目的是确保科学数据更高效的利用。

    元数据的意义

    无论你将数据分享到知识库还是你自己的个人服务器,如果没有包含一些必要的信息,它未必对其他人有用。包含了数据来自哪里,如何生成,其他人怎样使用的数据,叫做元数据。

    你需要考虑,其他人可能用你的元数据做什么,他们是想重新使用数据?他们使用它来验证你的数据集?还是直接通知你,你需要补充记录的方面?如果你使用了知识库,你会收到存储结构通知,告知你填写实验和必须信息。例如GenBank,提交元数据有必须填写的信息。

    将数据上传到知识库将让这件事变得容易。系统会根据你提交的数据类型指引你完成信息填写。如果你想要上传的知识库包含很多类型的数据,那么你需要考虑数据集中所有元数据类型,并在数据报告中写清楚。

    数据报告中只记录数据本身的来源和测定方法,而不记录分析、不记录结论。Scientific Data中会包含重新利用数据的所有关键信息。

    数据报告记录元数据信息,基于这一点,你可能需要让机器能够抓取它,这有助于其他人找到你的数据,甚至找到相关的其他数据。比如,用Google搜索。怎样让机器能够抓取?

    一种方法是,ISA-Tab格式,当然也有其他格式。主要是用一些词汇让机器能够抓取。

    你也应该在元数据中加入许可条件,你需要让人知道如何可以获得数据,他们需要签署数据使用协议或是其他条件。

    元数据应该包含

    1. 通用的文件格式
    2. 提供单位
    3. 简要的格式信息介绍
    4. 避免使用不常用的缩写
    5. 避免合并单元格
    6. 避免使用特殊字符

    布局

    1. 数据集的名称和参考信息
    2. 数据集的标识符(如果需要)
    3. 数据集描述:解释数据的收集和生成,它的来源、性质、规模和谁可以使用它,是或否发表。

    分享数据

    分享数据的益处:

    • 合作,获得新的发现
    • 更高的知名度
    • 从更多视角审视数据
    • 满足资助机构的要求

    使用分享的数据:

    • 从其他人的数据中获取新视角
    • 可以使用自己很难独立收集的数据集
    • 做数据所有者想象不到的研究

    高频问题

    1. 电子记录本在数据管理上能规避风险吗?是的,电子记录本比纸质材料更能规避风险。使用电子记录,你可以方便的修改格式,用于以后的分析;也可以避免转抄时候出错,电子记录直接复制,不会出现这类错误。
    1. 发表文章时,准备的数据和平时使用的有什么不同?发表文章时,你需要考虑,读者最可能用你的数据做什么?是重复你的结果?或是将你的数据用于其他研究。这就需要你的数据有足够详细的描述,让他们在使用的时候没有障碍。他可能比你在做研究时使用的数据更加详尽一些,因为不是你自己团队的人需要了解数据,而是让你相关专业或者外行人使用数据。
    2. 科学家需要分享研究数据吗?从趋势上来讲,是的。一些基金会、研究资助机构或者一些期刊网站都强制要求这一点。现在的问题是,谁来执行。
    3. 从其他研究者哪里获得数据的最好方法?如果你读的文章里没有将数据放在公共知识库或者附件,那么你可以发邮件给作者,是否可以获取数据。如果长时间未得到回复或者作者拒绝给你数据,你可以向杂志社的编辑求助,一般情况下,编辑能够帮助你。

    小结

    数据并非在你完成发表后被丢弃和遗忘。可能你在做其他研究的时候,还需要再次用到,让然,其他人也是一样。共享你的数据,其他人可以验证你的结果是否正确,可以利用你的数据做一些你自己无法想象的科学研究。

    请尽量

    • 采用数据管理计划
    • 做有持续性的研究
    • 设计有用的数据部署
    • 分享元数据

    Resources

    数据展示原则

    数据通过图形来高效的传达信息。原则是:

    1. 确定你要传达的主要信息是什么。
    2. 用最简单、最清晰的方式呈现数据。
    3. 你准备发表文章的图像时,需要做什么,不需要做什么。
    4. 美学加工。让图片更加简洁美观。

    确定主要信息

    图表的作用很明显,但是很多杂志限制图片数量。因此,你需要考虑,你主要传达的意思,用图片将关键的信息传达出来。

    领域的专家往往知道你所作的试验的全部细节,他们可以提出建设性的意见,让你改进图表。你的图表需要紧紧围绕主题,有些不重要的图可以放在附表。

    你的读者未必是专家,不同的读者知识结构也不尽相同,在制作图表时,要将必要的细节介绍清楚,以便其他的读者能够理解你传达的意思。

    用哪种图呈现数据?

    饼状图、柱状图、箱线图、提琴图等等,都可以反应数据的情况。一般来说,使用国际通用的,或领域常用的方式呈现数据,以便读者可以更容易的理解你想传递的意思。

    图像类型选择的原则是,用最简单的图像尽可能多的包含主要信息。

    一些信息在图片上可能不能直接放映,比如数据差异是否显著,仅仅从误差线上是不能下结论的,因此,必须另外做显著性检测才能确定。

  • Flarum支持中文搜索

    cd /www/wwwroot/lecent.wang
    curl -L https://install.meilisearch.com | sh
    chmod +x meilisearch
    mv meilisearch /usr/local/bin/
    meilisearch --version
    screen -S meili
    meilisearch --master-key="SDT8rEyLVsVpQSHEzVuGhxPGFJz_mIiieuzmXnc2xA4"
    composer require clarkwinkelmann/flarum-ext-scout
    php flarum scout:import "Flarum\User\User"

  • flarum上传插件权限设置

    # 1. 进入您的网站根目录
    cd /www/wwwroot/lecent.wang
    # 2. 将所有文件所有权分配给 Web 服务器用户(宝塔一般是 www 用户)
    chown -R www:www .
    # 3. 给 Flarum 需要写入的两个核心目录赋予 775 权限
    chmod -R 775 storage
    chmod -R 775 public/assets

    宝塔面板,PHP,安装exif

  • 宝塔安装Flarum

    cd /www/wwwroot/lecent.wang
    composer create-project flarum/flarum .
    chown -R www:www /www/wwwroot/lecent.wang
    chmod -R 755 /www/wwwroot/lecent.wang

    设置伪静态

    宝塔 → 网站 → lecent.wang → 设置 → 伪静态

    填入:

    location / {
    try_files $uri $uri/ /index.php?$query_string;
    }

    http://lecent.wang

    完成安装

  • Autorun.inf病毒自救

    Autorun.inf类病毒应该算是一类比较古老的病毒,在U盘最火的那几年非常流行,它主要利用了Windows自动运行对权限管理不严的漏洞。随着网络技术的发展,网络硬盘盛行起来,加上越来越严格的运行权限限制,U盘病毒的影响越来越低。

    比较典型的U盘病毒会隐藏所有文件夹,然后生成一个文件夹图标的exe,双击该exe可以进入到隐藏的文件夹目录,当然也运行了病毒,这样,病毒得以周而复始的传播。

    很多流行的杀毒软件都可以杀掉这类U盘病毒,包括Autorun.inf和可跳转至隐藏文件的exe,但未必会将隐藏的文件恢复。要恢复这些隐藏文件,可以使用专用的U盘病毒杀毒工具,也可以手动修改这些目录的属性。

    手动修改属性方法:

    按WIN+R快捷键运行命令提示符,输入[f:]回车,f:为你的U盘或移动硬盘的盘符。

    列出隐藏文件夹[dir /a:dh /b](可选)

    输入

    for /f "delims=" %D in ('dir /a:dh /b /s') do attrib -h -s "%D"
    

    解读:attrib是设置属性,-s表示去除系统属性,-h表示去除隐藏属性,/s表示子目录做相同处理,delims= 表示 不设置分隔符,也就是整行原样读入,%D 是循环变量,每次循环保存一行输出(一个隐藏文件夹的完整路径)。输入时不用写方括号“[]”。

  • 【更新】参考文献格式化助手

    短小精悍、绿色环保、免费开源、整洁高效
    Small, Green, Freedom, Open Source, Neat, Efficient

    你还在为各种参考文献管理软件使word崩溃烦恼吗?你还在因参考文献插件与导师的不同而无法编辑而烦恼吗?你还在为找不到注册码四处奔波吗?
    Are you still worried about word crashing due to various reference management software? Are you still troubled by the fact that the reference plug-in and the supervisor are different and cannot be edited? Are you still running around trying to find your registration code?

    试试我们的《参考文献格式化助手》!简约、支持自定义、无需安装任何软件!解决您的参考文献格式烦恼!
    点此进入https://dataholdcn.cn/ckwx/
    请杯奶茶【https://wp.me/P80aHo-Z5
    报告BUG【https://lecent.wang/t/bug-report

    使用示例/Example of use

    点击进入参考文献格式化助手使用示例

    更新/Update

    【20260228】 1.26版/v1.26

    1. 修正了对MDPI系列杂志名称的识别。
    1. Corrected the recognition of MDPI series journal names.

    【20251031】1.25版/v1.25

    1. 修正了Bug提交的链接。
    1. Fixed the link for bug submission.

    【20250331】1.24版/v1.24

    1. 增加了不显示EP页数。
    1. Added not showing EP when EP is not provided.

    【20240905】1.23版/v1.23

    1. 修正了有些情况下出现刊物名称与句号之间出现空格。
    1. Fixed the appearance of a space between the name of the journal and the period in some cases.

    【20240810】1.22版/v1.22

    1. 增加了“重命名推荐”功能。用于将下载下来的文献进行规范化保存。
    1. Added the ‘Rename Recommendation’ feature. You will standardize PDF files standardized.

    【20240222】1.21版/v1.21

    1. 增加了对Google Scholar导出的RIS文件的支持,但是极不推荐!!!请官网未提供RIS格式文件(如arXiv)时使用。
    1. Added support for RIS files exported from Google Scholar. Please only use for arXiv. Try to use the RIS provided on the official website as much as possible.

    【20240125】1.2版/v 1.2

    1. 增加了自动识别et al为等。
    2. 修正了正常RIS文本会增加-的问题。
    3. 修正了中英文献混排的问题。
    1. Added automatic recognition of et al and etc in Chinese.
    2. Fixed the issue where normal RIS text would increase -.
    3. Fixed the problem of mixed arrangement of Chinese and English documents.

    【20240124】1.1版/v 1.1

    1. 增加了对知网官方输出格式的支持,并增加了标准化功能。知网文本会直接转化成标准RIS。
    2. 增加对中文的支持。
    3. 增加了favicon。
    1. Added support for the official CNKI output format and added standardization functions. CNKI text will be directly converted into standard RIS.
    2. Add support for Chinese.
    3. Added favicon.

    【20240115】1.0版/v 1.0

    1. 参考文献格式化助手 v1.0诞生!
    1. Reference Format Assistant v1.0 release.

    功能/Features

    1. 智能分析RIS文件,并提取主要信息;
    2. 作者之间的分隔符可以自定义;
    3. 参考文献显示的作者数量可以自定义;
    4. et al.斜体、粗体、加不加.统统可以自定义;
    5. 根据参考文献模板输出结果,需要什么样的参考文献格式,自己定义;
    6. 自动识别杂志全称并给出缩写形式(测试);
    7. 多个参考文献支持同时格式化;
    8. 若是中文文献,则自动识别et al为等。
    1. Intelligently analyze RIS files and extract main information;
    2. Separators between authors can be customized;
    3. The number of authors displayed in references can be customized;
    4. et al. Italic, bold, add or not. All can be customized;
    5. According to the reference template output results, you can define the required reference format yourself;
    6. Automatically recognize the full name of the magazine and give the abbreviation (testing);
    7. If it is a Chinese document, et al will be automatically recognized as 等.

    使用/Using

    1. 在SCI杂志社官网找到引用功能,下载.RIS文件,用记事本打开并复制全部内容,粘贴到《参考文献格式化助手》的分析框里。
    2. 点击分析参考文献按钮。
    3. 调整其他参数,获得最标准的输出格式。
    4. 将最下面的参考文献复制到word,调整字号。
    1. Find the citation function on the official website of SCI Magazines, download the .RIS file, open it with Notepad and copy the entire content, and paste it into the analysis box of the “Reference Formatting Assistant”.
    2. Click the Analyze References button.
    3. Adjust other parameters to obtain the most suitable output format.
    4. Copy the bottom reference to Word and adjust the font size.

    什么是RIS文件/What is the RIS file【查看

    获取RIS文件/Get RIS files

  • Machine Learning Algorithms Translate Big Data into Predictive Breeding Accuracy

    网站链接
    PubMed】【Trends in Plant Science

    引用
    参考文献格式由参考文献格式化助手(https://dataholdcn.cn/ckwx/)生成。

    Crossa J, Montesinos-Lopez O, Costa-Neto G et al. (2024) Machine learning algorithms translate big data into predictive breeding accuracy. Trends in Plant Science . https://doi.org/10.1016/j.tplants.2024.09.011

    统计机器学习(ML)从大量的基因组、表型和环境数据中提取模式。ML 算法可以自动识别相关特征,并使用交叉验证来确保模型的稳健性,从而提高在新株系中的预测可靠性。此外,ML 对基因型与环境(G×E)相互作用的分析可以提供对影响特定环境中性能的遗传因素的深入了解。通过利用历史育种数据,ML 可以简化策略并自动化分析,以揭示基因组模式。在这篇综述中,我们探讨了大数据对植物育种中基因组支持预测的变革性影响,包括多性状基因组学、表型学和环境协变量等内容。我们讨论了大数据和 ML 如何通过提高预测准确性、加深对 G×E 相互作用的理解以及通过分析广泛和多样化的数据集来优化育种策略,从而彻底改变该领域。

    何塞·克罗萨(José Crossa)是国际玉米和小麦改良中心(CIMMYT)生物统计部门的杰出科学家。他的研究工作涉及全基因组预测模型以及基因型与环境互作模型,旨在帮助CIMMYT的研究人员实现他们的目标。克罗萨还教授统计遗传学课程。他的办公室位于墨西哥城。克罗萨因其显著的研究影响而受到认可,他和其他CIMMYT科学家的论文位于高引用论文的前1%。

  • 无免费午餐定理

    无免费午餐定理(No Free Lunch, NFL):如果对“所有可能的目标函数/数据分布”平均,任何两个学习算法(或优化算法)的期望性能是相同的。

    NFL 定理往往在“对所有可能函数等概率”的假设下成立。在如此宽泛的假设空间中,一个算法在部分函数上擅长、在另一些函数上就会吃亏,平均被“拉平”。

    没有“通吃”的算法。想在特定任务上优于平均,必须引入与该任务匹配的先验假设或归纳偏置(inductive bias)。模型选择和特征工程的关键在于“贴合数据分布与任务结构”。