科技评价2.0：从局部评价到全局评价

发表日期：2017-09-01 09:19PM 阅览次数：

中国改革开放走过了近40年的历程，这场伟大的变革，让我们的生活世界和信奉的观念系统都发生了根本性的变化。科技系统作为社会的子系统之一，自然无法置身事外，从彼时的百废待兴到此时的蒸蒸日上，显然科技界的整体结构已经发生了天翻地覆的变化。科技评价体系作为科技系统中最重要的环节，它通过规则的设定实现国家意志并对科技共同体的行为进行规训。高质量的评价，能使科技资源处于最佳配置状态，从而实现科技造福社会的目的。然而科技界的表现却与预期有较大的差距，问题到底出在哪里？科技评价体系的改革从哪里切入是比较合适的路径？这一切都要回到对评价体系结构的检视上。

一、科技评价体系的结构

科技评价的水平直接影响科技发展的质量，这已是学界的共识。由于评价是一种主动介入式的管理方式，那么，科技评价的结构一定是基于科研生产过程而设定的。通常科技的生产链条有如下结构：科技生态系统+资源配置+人才=科研成果。在这个简化的流程图中，广义评价是对等式两边的四项要素全部进行有针对性的评价，狭义评价则主要针对知识生产链条中的可见要素进行评价，即对资源配置、人才与成果进行评价。对于管理者与社会大众而言，他们比较关注狭义评价，然后各取所需：管理者求政绩最大化，公众则是获得骄傲与自豪。两种不同诉求在结果处合流，也助长了整个社会把狭义评价等价于评价的认知误区。

这种线性评价模式就是我们在过去几十年里一直在执行的科技评价1.0模式的主要内涵，其最大特点就是简单地把“资源+人才”拢到一起，然后就期望预期的科研成果马上出现，如果实际效果不理想，那就直接调整两个变量：要么加大资源投入量，要么增加人才数量，或者同时增加，这种粗线条的评价模式操作简单，在科技发展处于跟随阶段很有效，毕竟有成熟的路线可以依循，问题是一旦科技整体发展态势由跟随型转变为并跑型，可资借鉴的模式在迅速减少，这时线性评价模式的功用也就走到了尽头，用经济学术语讲就是出现了总体边际收益开始等于或小于零状态，这时再靠传统的线性评价模式来支撑与推动科技发展的策略显然已经开始失灵。毕竟在资源的硬性约束下，投入不可能无限加大，这时那些隐而不显的科技发展要素开始显示出作用，即好的科技生态系统在同样规模的投入下会有更好的表现，这里的表现包括两个方面内容：成果的质量和数量。因此，寻找新的科技评价模式是科技系统发展到一定阶段的必然要求。在探讨新的科技评价模式之前，我们还是需要清理一下，传统评价模式1.0对科技发展带来了哪些弊端，只有把这个问题梳理清楚了，我们才能真切体会到变革的必要性与紧迫性。

传统科技评价模式给科技发展带来的主要问题有以下几个方面：首先，严重忽视科技生态系统的建设，单纯依靠资源的粗放式投入来取得可见的科研成果，结果造成科技生态系统的严重透支与破坏，如科研诚信库存的大幅损失，学术不端的泛滥等，这些弊端都是对资源配置扭曲的一种回应，其恶果时至今日仍无法有效清除，这种情形与我国的环境状况类似；其次，造成资源的过度开采，缺乏有效的保护机制，从而导致资源效能的衰竭。客观地说，现在的评价指标体系已经非常细致，直接渗透到私人领域：使得生活时间逐渐被工作时间侵蚀，很少有恢复的时间与空间。政绩目标通过层层分解，导致压力向下传递，这种压力造成：一则出现资源的普遍饥渴症，二则造成体系内所有人的普遍疲劳状态。当资源和人都处于效率不佳状态时，又怎么能有高质量的产出。如目前频见报端的科技界过劳死现象，以及更多被忽视的弥漫性疲惫与厌倦症候群，然而恢复资源效能的措施迟迟不见踪迹。第三，资源的线性使用模式，造成对量化考核模式出现严重的路径依赖现象。第四，由于评价权重设定的极度扭曲，导致科技界马太效应加剧，造成资源使用效率的大幅降低。反观当下科技界有些人成了各种帽子（头衔称号）专业户、资源的最大占有者，政、商、学通吃，毕竟人的精力有限，这些职责忙得过来吗？有时真想知道那些身居高位、拥有数千万甚至上亿基金的大咖们是否内心会有一丝不安：如果做不出来该如何向纳税人交代啊？坦率地说，一旦把这套评价模式从科技界移走，我们很多人真的开始不知道该如何做科研了，管理部门也不知道该如何管理科技界了，吊诡的是大家都知道这套评价模式有问题，但是却没人敢取消这套模式。

对于长期被忽略的科技生态系统，还要简单说两句，科技生态系统都包括什么？这是很难定义的事情，大体可以把那些可见要素移除后支撑科技发展的要素都称作科技生态系统，为了简化起见，我们把生态系统中支撑科技发展的不可见要素按影响力强弱分为政策要素与文化要素。这样来一来，科技的生态系统=政策要素+科学文化要素。这些要素都是不可见的，由于公众对于科技界的陌生，很难了解到这些东西的作用于价值，因而，社会大众对此缺乏应有的关注，这样就无法形成来自社会的有效压力，促使管理者去做出改变，而来自科技界内部的批评声音则多有忌讳，故而这个问题就如同影子一般存在。没有人看见它，却又时刻离不开它，如何评价它，这也是当今世界上一个没有很好解决的问题。下面就科技生态系统中的政策要素做些简单的评价分析，一斑窥豹。

科技生态系统健康与否直接受政策影响，因而对科技政策层面的评价恰恰是诊断科技生态系统状况的便捷方式。政策通用的评价标准就是公平，即一项政策是否体现了最大限度的公平，以及提供实现公平的路径。由于其不可见性，这部分评价在实践中通常是被悬置的，也是目前评价中最为薄弱的部分。比如，当下人才市场中最炙手可热的“青千系列”，就是一个明显的歧视性政策，它在政策中设置特设性门槛，以此有效阻止国内人才的参与机会，难道国内就没有符合其水准的人才吗？显然不是，这就导致国内有同样实力的最优秀青年人才无法获得应有的承认，久而久之，国内青年人才市场就会沦落为柠檬市场，迫使国内人才必须通过出口转内销的方式才能弥补这份损失，这是很荒谬的。如果说千人计划具有国家态度示范意义的话，那么其目的已经达到，而青千计划则完全没有必要仿效千人计划的准入门槛。任何牺牲公平的政策，虽然短期有效，但其长期影响实在是得不偿失。这项政策无疑会加剧土洋对立的局面，那些被排除在外者对于国家的认同与忠诚会出现打折现象，同时这种政策也是对国内高等教育取得成就的直接否定。公平永远是政策的最大美德，缺少公平的政策是行之不远的。让所有有能力的人有公平的机会同台竞技，这项政策才能真正把影响力发挥到最大，由此而来的知识溢出效应才能被社会所分享。

二、科技评价2.0的目标：环境、鸡和蛋一个都不能少

19世纪英国小说家萨缪尔.巴特勒（Samuel Butler，1835-1902）曾说过一句很有趣的话：鸡只是蛋为了产生另一个蛋而用的手段。对于整个科技生产链条而言，科技评价就是一项被证明为行之有效的政策工具：它一方面调控资源配置方向与科技产出的规模，另一方面规训科技主体的行为选择模式。随着整个社会分工的日益精细化与专业化的大趋势，科技评价为了适应时代的要求也必须完成从评价1.0版上升到评价2.0版。如果说评价1.0版是线性评价模式，那么，评价2.0则是非线性的，它努力在科技生态、资源与人才之间形成一种耦合关系。为了分析的方便，我们把科技评价1.0版称为局部评价，仅关注资源配置、人才结构与成果等级；那么，即将到来的评价2.0则是全局评价，它关注整个科技生产链条，尤其关注对科技生态系统的评价，而这是评价1.0无力做到的事情。

全局评价的目标有四个：首先，营造良好的科技生态系统。科技生态系统本身也是一种具有持续影响力的成果；其次，改变原有的人才评价权重，解决屠呦呦、袁隆平等遭遇的评价窘境，突出能力优先；第三，取消单一化评价模式，采用科研成果分类评价；第四，塑造纯粹科学家，杜绝肆意的跨界行为。虽然从内容上看，局部评价也关注人才和成果，但是那种评价体系下的关注是粗糙的，并在实践中带来很多难以消除的后遗症。如局部评价（评价1.0）下的人才认定就是一种静态考察模式，过度仰仗于出身与学历等静态指标，对于成果的评价过度依赖于所谓的国际名刊等，这是造成屠呦呦、袁隆平等评价窘境的根源所在，另外取消奖励的申报机制改为推荐制，杜绝自我吹嘘的恶习。如果所有的科研活动都以论文来评价，这就严重缩减了科学活动的外延，仅就科技活动的起点分类而言，基础研究、应用研究与试验发展研究的成果呈现形式是完全不同的，如果一律以论文作为评价标准，会对科技共同体造成严重的不公平，也会带来群体行为的制度性越轨，比如最近曝光的医生论文被大批量撤稿事件，就是这种扭曲评价体系带来的制度性越轨。再比如评价1.0对于人才的评价，通过特设性的歧视条款造成的后果就是激励了一小批，遏制了一大批，其负面反应慢慢会呈现出来。从手段上看，局部评价过度依赖资源的调控与承认的分配，造成整个科技界出现过度竞争以及浮躁之风蔓延，已经严重侵蚀了科技生态系统的基础，而这些调控因子在频繁使用之后开始出现敏感度降低现象，导致刺激所带来的效果远不如预期。现在是到了彻底改革的时候了，否则科技界会整体陷入边际产出递减的状态。

如果把评价工具所具有的调控力设定为一个定值，那么，全局评价则会带来一个可喜的变化，即评价的调控力会在多个目标上分散，从而让原先被过度使用的资源、人才与成果恢复弹性与敏感性。当评价的注意力部分转移到科技生态系统，会为其他子系统的发展留出缓冲与调适时间。以往局部评价带来的唯一好处就是在共同体内部形成了竞争意识以及对于资源和成果的渴求，这部分经验会成为科技共同体的认知定势。这也从另一个侧面说明全局评价是可能的，即便调低对于人才、成果的评价力度，由于前期形成的竞争意识也不会轻易消退，这就意味着全局评价即便在不增加过多力量的情况下也是可以实现的。

据《全国科技经费投入统计公报》（2015）显示，我国的R&D投入已经突破2%的关口，全时当量研发人员以及科技人力资源总量都已经是世界第一。这组数据说明两个问题：首先，我国的科技体量已经足够大，短期内R&D投入大幅增加已经不太可能；此次，随着人才总量的持续快速增加，资源的竞争强度会越发激烈。如果再在这两方面加大调控力度，只会造成过度竞争以及出现共同体集体麻木状态。根据生态学的原理，足够大的群体密度会造成挤出效应，因此，对于全局评价来说，把力量从资源与人才方面部分撤出，留出精力去处理更加复杂的科技生态系统是完全有可能的。反之，如果仍旧沿袭评价1.0的方式，完全有可能彻底毁掉科技生态系统，这绝非危言耸听，当群体密度增加、在单向刺激不断强化的过度竞争状态中，会在某一刻摧毁一切激励机制，这个临界点类似于美国动物行为学家约翰.卡尔宏（John B. Calhoun，1917-1995）提出的行为的沉沦（behavioral sink）的临界点。就如同发条上过劲突然崩断一样，到那时所有的激励作用都失灵了。从这个意义上说，科技界也应该减负了，否则会出现欲速则不达的状况。李克强总理在最近的讲话中曾深刻地指出：人类的重大科学发现都不是计划出来的。评价作为一种计划的产物，应该不忘初心。因此，科技评价只是手段，激发人的创造性才是所有评价的最终目的所在，如果为了评价而评价，那么，作为科技活动主体的人就死了。

既然科技的全局评价系统的建设是可能的，那么该如何着手呢？由于科技的生态系统主要包括两个大的部分：科技政策与科学文化，对此，可以引入社会影响评价（Social Impact Assessment）。主要目的是使科技生态系统自身保持生产性功能，从而达到支持科技生产链条的持续发展，并使科技生产系统总是处于边际产出递增阶段。这恰恰是科技生态系统的生产功能的体现，一个好的科技环境可以最大限度上降低交易成本，从而为成果的产出留出更大的利润及空间；另外，系统中好的科学文化则可以保证群体的价值观是向上的并具有超越性，而非单纯的入世取向的利益诉求；再有，好的科技生态系统既可以培育人才，也可以吸引人才，只要想想硅谷的科技生态系统就可以明白这个道理。硅谷没有秘密，支撑硅谷的条件都是明确的，为什么别的地方无法克隆，原因就在于那里的科技生态系统处于健康状态，这就为无数的资源、人才、想法的流入提供了适宜的生长空间。之所以引入社会影响评价，是想借助于社会的力量来遏制科技生态系统的退化与保守倾向，让科技生态系统时刻处于开放的、远离平衡态的进化状态。

来源：科学网

附件：暂无附件

科技评价2.0：从局部评价到全局评价

站内检索

按日查询

下载安卓客户端