欧宝app-分析了1960 至 2014 年间发表的论文
你的位置:欧宝app > 欧宝app下载官网 > 分析了1960 至 2014 年间发表的论文
分析了1960 至 2014 年间发表的论文
发布日期:2022-02-20 14:56    点击次数:195

分析了1960 至 2014 年间发表的论文

欧宝app,欧宝app下载,欧宝app下载官网

 欧宝app,欧宝app下载,欧宝app下载官网一周前,经营机视觉领域经典之作、何恺明的 ResNet 论文的被引次数冲破了 10 万 +,而这距离他提交这篇论文仅往常六年。这一责任的热度如斯之高,既袒清楚了 ResNet 自己的久经教练,也印证了 AI 领域,稀零是经营机视觉如今的火热进度。

但是,ResNet 高被引的背后也让咱们看到了一个问题,那等于经营机视觉领域每年产出那么多的新论文,为何斟酌者时常照旧选拔它行为引文呢?对高被引经典论文的趋向性究竟会给领域带来卓越照旧停滞呢?新发表的论文是否还有可能成为下一个经典之作呢?

在近日发表在 SCI 期刊 PNAS 上的一篇论文《Slowed Canonical Progress in Large Fields of Science》中,来自美国西北大学和芝加哥大学的两位斟酌者对上述问题进行了解答,并真切探讨了科学领域发表论文的数目、质地以及被引情况之间的纵横交叉的关联。

论文地址:https://www.pnas.org/content/pnas/118/41/e2021636118.full.pdf

对科学卓越有种很胜利的视力,那等于多多益善。一个领域发表的论文越多,科学卓越的速率就越快;斟酌者数目越多,掩饰的面就越广。即使并非每篇论文都产生裂缝的影响,但它们都成为了聚成沙堆的沙粒,增多了出现质变的可能性。在这照旧过中,科学风景得到了重新成立,结构性探究中出现了新的范式。

更多论文的发表也增多了「它们之中至少有一篇包含伏击翻新」的可能性。一个颠覆性的全新主义不错动摇近况,将人们的防范力从以往责任中诱惑过来,并取得多数的新援用。

领域内流行的计谋很好地反应了这种多多益善的视力。人们会把柄学者的坐蓐力对他们进行评估和奖励,一段技巧内发表更多的论文是他们取得毕生教职和职位提高的最可靠路线。数目仍是大学和公司伸开比较的标杆,其中发表作品、专利、科学家和经费的总量仍是重中之重。

质地也主要通过数目进行判断。被引次数用来预计一个领域内个人、团队和学术期刊的伏击性。在论文层面,人们时常假设最佳和最优价值的论文会诱惑更多的护理,从而塑造了该领域的斟酌轨迹。

在文中,他们预计,当每年发表论文的数目颠倒大时,新论文的快速流动会迫使学界护理那些被庸碌援用的论文,由此减少了对不太造就的论文的护理,即使它们当中有些提议了新颖、灵验和具有潜在变革性的主义。多数新发表论文的出现并莫得引起领域范式的更快更替,反而巩固了那些高援用量的论文,阻难新责任成为被援用最多且广为人知的领域经典之作。

斟酌者通过履行分析考据了这些视力,标明了科研单元对数目的护理可能阻难基础性卓越。跟着每个领域每年所发表作品的不竭增长,这种不利影响将加重。况兼,计划到鼓舞「发表数目至上」领域领略的树大根深、纵横交叉的结构,这种情况将不可幸免。重构科学坐蓐力价值链的计谋要领需要进行调遣,以使全球重新聚焦于那些有后劲的新主义。

这篇文章主要讲了啥?

本文重心斟酌了领域大小,即给定的一年内某个领域发表论文数目的若干产生的影响。以往的斟酌发现,许多学科的援用不对等气候正在加重,至少部分受到了偏好的影响。但是,一篇论文时常无法在往常几年保持它们的援用水讲理名次。颠覆性论文约略取代以往的责任,被引次数的当然波动也会影响论文名次。

因而,斟酌者预计,当领域富余大时,变革能源会出现变化。援用最多的论文将树大根深,在将来取得不可比例的援用量。新论文无法通过偏好依附积贮援用数,也就不可能成为经典。新发表的论文很少约略对已成型的学术镣铐产生影响。

他们给出了赞助以上预计的两个机制。一方面,当一个领域短技巧内发表了许多论文时,学者不得不诉诸于启发式体式来对该领域进行不竭性的相连。领略超载的评审人和读者在读新论文时不计划内部的新主义,只会将它们与现有的程序论文磋议起来。不相宜现有形式的新主义有极大可能不会被发表、阅读或援用。

面对这种变革能源,论文作家不得不紧紧地将他们的责任与知名论文磋议起来。这些知名论文充任起了「学问徽章」,界定了若何相连新责任,不鼓吹他们斟酌太过新颖且不易于与现有经典之作磋议起来的主义。这么一来,冲破性新主义的产生以及被发表和庸碌阅读的概率下落,况兼每一篇新论文的发表也将不可比例地增多高被引论文的援用量。

俄罗斯警方分别在莫斯科、圣彼得堡、列宁格勒和利佩茨克地区逮捕了14名团伙成员,并搜查了25处地址,没收了计算机设备和加密货币钱包。FSB声称,他们已经确定了REvil团伙的所有成员,并监视他们的行动。

另一方面,若是新主义的到来速率太快,它们之间的竞争可能会阻难任何新主义在领域内广为人知和庸碌汲取。至于为什么会这么呢?斟酌者以某个领域中传播主义的沙堆模子为例进行解读。

当沙子渐渐落在沙堆上时,一次一粒,比及沙堆明白罢手时再落下一粒。跟着技巧推移,沙堆达到了无标度临界景色,其中一粒沙子都约略引起整个这个词沙堆区域的坍弛。但当沙子以极快的速率落下时,相邻的袖珍坍弛会互关系扰,导致任何一粒沙子都无法触发沙堆范围内的位移。这意味着,沙子掉落的速率越快,每个新沙粒约略影响的区域就越小。论文也一样,若是论文出现的速率太快,则任何一篇新论文都无法通过局部扩散和偏好依附成为经典。

这两方面的论点繁衍出了六个预计,其中两个分别是最高引的论文将持久处于主导地位以及新发表论文的竹篮汲水和它们自身颠覆性的裁减。

总之,相较于一个领域每年发表的论文很少,当该领域每年产出的论文许多时,则将面对以下六种情况:

新论文将更有可能援用最高引的论文而不是低援用的论文; 每年最高引的论文列表险些不会出现变化,导致经典论文永恒是那些; 一篇新论文成为经典之作的概率将下落; 过问高援用论文列表的新论文不和会过按次累积的传播形势杀青; 新发表论文中发展现有科研主义的比例增多,而颠覆现有主义的比例下落; 一篇新论文成为颠覆性责任的概率裁减。 用到了哪些数据与体式?

斟酌者使用 Web of Science 数据集,分析了1960 至 2014 年间发表的论文,算计 90,637,277 篇论文和 1,821,810,360 个援用。Web of Science 将学术领域,或者某些情况下大的子领域,永别为不同的学科。因此,斟酌者的分类中共有 241 个学科,并将它们行为领域级分析的基础。其中,一篇焦点论文每年从统一主题新发表论文中收到的被引次数组成了斟酌者主要的有趣变量。

为了经营 10 个最大的非轮廓学科(non-multidisciplinary)学科的 1-decay rate(λ),关于每个学科,斟酌者以发表论文数目的 10 log 永别年份,截点分别为 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5 和 5.5,并以 field-year 中被引最多的百分位永别论文年份,截点分别为 1, 2, 3, …, 100。关于每个(发表论文的记载数目)×(援用数百分位),他们将第二年一篇论文的被引次数归来到焦点年份论文的被引次数。这一趟归的整个产生 1-λ。

此外,为了经营整个学科的 1-λ(图下图 2D 所示),斟酌者登科了第 1、2、5、10 和 25 个百分位数中被引最多的前 100 篇论文。他们通过发表论文数目的 base 10 log(截点分别为 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5 和 5.5)对 subject-years 进行分类。关于每个 bin× 登科的百分位,斟酌者将第二年一篇论文的被引次数归来到焦点年份论文的被引次数。这一趟归的整个产生 1–λ。

欧宝app,欧宝app下载,欧宝app下载官网 这些预计得到阐发了吗?

斟酌者的整个预计都在 Web of Science 数据集的援用形式中得到了阐发,具体如下图 1 至 4 所示。跟着领域变得越来越多,被引次数最多的论文永恒成为主导,在援用散布上占据齐备上风。比拟之下,新论文成为高引的可能性裁减,况兼无法随技巧推移而渐渐累积护理度。发表论文时常在发展现有主义,而不具备颠覆性,也很少约略产生具有开拓性的新的斟酌潮水。

具体而言,被引次数最多的论文在更大的领域取得了不可比例的更高的援用份额。最大领域援用份额的基尼整个约为 0.5,如下图 1A 所示。高引论文不可比例的被引次数又导致不对等护理的加重。

举例,当电气与电子工程领域每年发表 10,000 篇论文阁下时,前 0.1% 和前 1% 高被引论文占了总被引次数的 1.5% 和 8.6%。当该领域每年发表 50,000 篇论文时,前 0.1% 和前 1% 高被引论文占了总被引次数的 3.5% 和 11.9%。当该领域领域更大,每年发表 100,000 篇论文时,前 0.1% 和前 1% 高被引论文占了总被引次数的 5.7% 和 16.7%。

比拟之下,名次终末 50% 的被引最少论文在总被引次数中所占份额下落,每年发表 10,000 篇论文时的占比为 43.7%,每年发表论文达到 50,000 和 100,000 时,这一比例仅略高于 20%。

当跨越技巧检讨领域数据时,咱们会发现有在这么的形式:当每年发表的论文数目较多时,被援用最多的 top-50 论文之间的名次磋议性增多(图. 1B)。在随后几年斯皮尔曼名次磋议性中,在一个领域中被援用最多的 top-50 列表从发表 1,000 篇论文时的 0.25 增多到 100,000 篇论文时的 0.74。

图 1

当领域范围很广时,被援用最多的论文的被引次数保持逐年增长,而整个其他论文的被引次数都会下落。下图 2 为论文当年与上一年被被引次数的预计比率。在论文发表很少的年份,被被引次数最多的论文的比率彰着低于 1,与被被引次数较少的论文的比率莫得太大区别。但是,在发表论文数目较多的年份,被被引次数最多的论文的比率接近 1,彰着高于被被引次数少的论文。

在颠倒大的领域年中,发表了大要 100,000 篇论文,平均而言,被援用最多的论文的被引次数莫得逐年下落。比拟之下,名次在 top 1% 除外的论文,平均每年损背信 17% 的被引次数,而处于 top 5% 及以下的论文则趋向于每年亏本 25% 的被引次数。

图 2

当统一领域同期发表许多论文时,单篇论文的援用量达到 top 0.1% 的可能性会减少,这种气候在统一年的不同领域或不同庚的统一领域都适用,如图 3A 所示。一般来说,较大领域论文被援用最多,很少是通过局部扩散等经过完成。

图 3B 袒露了一篇文章过问磋议领域的平均技巧(以年为单元),要求是该论文成为该领域中被引次数最多的论文之一。当一个领域很小时,论文会跟着技巧的推移郑重高潮到被被引次数最多的 top 0.1%。咱们以 1980 年在小领域(归来预计)发表的论文为例,假如统一领域发表了 1000 篇论文,想要成为被援用最多的论文,平均需要 9 年技巧。比拟之下,在最大领域经典论文会马上登上援用榜首,这与学者通过阅读别人著述中援用的参考贵府发现新著述的累积经过不一致。雷同的归来预计,在每年发表 100,000 篇论文的大领域中,论文达到援用量 top 0.1% 的技巧平均不到一年。

图 3

统一年发表的大多数论文都诱导在现有文件的基础上,而不是中断(disrupt)现有文件(图 4A)。逻辑拟合预计袒露,当该领域一年发表 1,000 篇论文时,49% 的论文具有中断度量(disruption measure) D > 0(违反,51% D < 0)。当发表 10,000 篇论文时,中断度量比例下落到 27%,发表 100,000 篇论文时下落到 13%。即使当 D > 0 时,新发表论文的中断度量在更大的领域中也会削弱。图 4B 袒露了按领域年罗列的新论文比例,这些论文在中断度量的 top-5 百分位中名次。Lowess 料到袒露,具有 top-5 百分位中断度量的新论文比例从该领域年发表的 1,000 篇论文时的 8.8% 减少到每年 10,000 篇论文时的 3.6% 和 100,000 篇论文时的 0.6%。

图 4