Academy /

强推断


当代的科学家们倾向于粉饰太平——声称一切科学都是平等的。我们偶尔会抨击个别异己分子的研究工作,但通常情况下我们宣扬所有科学家的研究领域和研究方法都一样的好(或者略胜一筹)。因此,在推荐他人申请政府资助的时候,我们也保持着热情友好的态度。

但我认为,凡深思过该问题的人都会赞同下述观点:某些领域科学研究的进步速度要比其他领域快很多。这类事实常见诸报端——例如分子生物学和高能物理,这都是高深学科领域取得的货真价实的进展。正如Alvin Weinberg所说,几乎每个月美国国家科学院院刊上都会报道分子生物学的科研突破。

为何某些科研领域有如此迅猛的发展,而其他领域没有?因为其他领域太难?因为其他领域的科研工作者或教育质量不行?因为其他领域科研项目的规模小?这些原因确实重要,但并不充分。我开始相信,影响科研进步的主要因素是一种智力因素。即,这些进展神速的科研领域往往都系统化地教授和应用“强推断”这种科研方法。我认为有必要对这种方法的运用、历史和逻辑进行考察,然后看看其他团体或个体是否可以学习这种方法,并在自己的科研工作中加以应用。

究其成分,强推断不过是简单、老套的归纳推断,其最早可以追溯到弗朗西斯·培根。其步骤为每一个大学生所熟知,科学家们也断断续续地练习和使用这种方法。但差别在于系统化地应用。强推断要求以一种正式的、明确的、规律的方式将下述步骤应用到每一个科研问题中:

就像爬树,在第一个分叉口,我们选择踩右边还是左边的树干(在科学研究中,自然的神秘力量或者实验本身对实验的结果进行选择),在下一个分叉口,我们又要选择踩右边还是左边的树干……在条件化的计算机程序中也有相似的决策点,其中计算机的下一个动作取决于前一次计算的结果。在很多一年级的化学课本上也有此类的“条件归纳树”或者“逻辑树”。化学课本上描述了对未知样品进行分析的步骤:加入试剂A。如果你得到红色沉淀物,那是物质alpha,你需要过滤、并添加试剂B;如果你得到的不是红色沉淀物,则加入试剂C……

当然,对任何新问题而言,归纳不像演绎那样简单,因为其涉及到对未知的探索。Step1和Step2需要智力性的创造,Step1和Step2必须进行聪明地选择,以使假设、实验、结果和排除以一种严格的三段论的方式联系起来。关于如何进行这种创造,其他地方已经讨论很多了。那些标准规范告诉我们的是:在设计假设和实验、实施下一步、进行到下一个分叉口时尽量不浪费时间在无关紧要的东西上。

为何这样的方法可以产生快速、有力的进步?探索未知没有捷径,这样的方法只是遵循了最起码的步骤。任何没有经过排除的结论都是不安全的,都必须进行复查。进入下一个循环之前的任何延迟都只是延迟。强推断(及其产生的决策树)之于归纳推断,正如三段论之于演绎推断。强推断为尽可能快地、一个接一个地获得稳固的归纳结论提供了规律性的方法。

“但这有什么新奇的呢?”某些人会说。这正是科学研究所用的方法,一直以来都是;为何要给它一个特别的名字呢?原因在于,我们中的很多人几乎都忘记了它。科学已是日常。仪器、计算和演讲本身成为了本身的目的。我们中有多少人每天会将备择假设和实验设计写下来,并聚焦在对某个假设的排除上?我们一直以来所写的论文,看起来就像我们心中确实有步骤1、2、3。但实际上,我们做的只是累人却毫无价值的工作。我们变得“方法导向”而不是“问题导向”。我们说,我们倾向于摸索着进行概括。我们没能有效地教会我们的学生如何进行敏锐地归纳推断。并且,我们没有意识到在科研的每个步骤中设定备择假设、排除备择假设所能够带来的巨大增益。

不规范的研究方法之于强推断,就好比于一个偶尔可以打着火的汽油发动机与一台稳定运转的汽油发动机。如果我们的摩托艇就像我们的研究工作一样错误百出,那么我们中的大部分人都将赶不上吃晚饭。

分子生物学

新的分子生物学是一个我认为强推断法得以广泛使用并大获成功的领域。这是一个复杂的领域;尽管如此,过去10年连续进行的实验为我们提供了关于遗传机制、酶、蛋白质合成的数量惊人的新知。

分子生物学的每一个实验都体现出这种逻辑结构。1953年,James Watson和Francis Crick提出DNA是一个双螺旋分子,同时也形成了一系列有待检验的备择假设。在细胞分裂时,双螺旋的两条链是在一起的还是分开的?Matthew Neselson和Franklin Stahl使用了独创性的同位素密度标记法,揭示出细胞分裂时双螺旋的两条链是是分开的。DNA双螺旋始终有两条链么,是否像原子模型那样有三个?Alexander Rich发现有时是两条,有时是三条,这取决于离子浓度。这些实验会是John Dalton喜欢的实验,因为这些实验都表明DNA不是原子,而是长长的巨分子链。

或者换一个问题:基因图谱(基因图谱展示了重组实验中不同基因特征之间的统计关系)是如DNA分子一样单维的(T.H. Morgan1911年提出),还是双维的?Seymour Benzer的数百个精细的、基于细菌的微观遗传实验表明,基因图谱只能是单维的。

当然,这样的实验在任何领域都可以找到。分子生物学这一领域的独特之处在于,规范的归纳推断在该领域得到了系统化的应用和传授。每天早晨,英国剑桥分子生物学实验室的黑板上都布满了Francis Crick或者Sidney Brenner写的逻辑图。最上方的一行写着刚从实验室获得的实验结果,或者从信件或谣言中获得的结果。第二行则写着两个或三个可能的解释,或者一个小列表——“他做错了什么”。下面将是一系列的实验和控制条件,这些实验和控制条件可以减少对于实验结果的可能解释(即备择假设)。如果人们开始讨论为何实验会失败或者实验应当如何改进,决策树就会开始继续发展。 这种强推断的态度在论文的写作风格中就可以看出来。例如,在分析抗体形成的理论时,Joshua Lederberg给出了9项有待推翻的命题,并讨论了哪一个更容易通过实验检验。

法国领军者Francois Jacob和Jacques Monod也因其“逻辑密度”而著名,其论文中段落的衔接就像是将“归纳三段论”连在了一起。这种风格得到了广泛的传播——从1964年Journal of Molecular Biology上的第一篇论文开始,我们就能看到下述风格的论文:“Our conclusions… might be invalid if…(i)…(ii)…or (iii)…We shall describe experiments which eliminate these alternatives.”平庸的物理学家、化学家或任何领域的科学家都习惯了逻辑松散、推断不清晰的文章,哪怕只是随机从Journal of Molecular Biology上阅读一篇文章,这些科学家都能从中受益。

对分析方法的抗拒

生物学的这一分析取向有时甚至变成了一项改革运动,因为它引起了很多科学家的抗拒,这些科学家成长于一种更为宽松的、弥散的科研环境。这两种观念在1958年博尔德的生物学家会议上出现了戏剧化的对峙。Leo Szilard说:“酶是如何产生的,蛋白质是如何合成的,抗体是如何形成的,这些问题的答案已近在眼前,而在此之前这是不可想象的。如果你做愚蠢的实验,一年做完一个,这可能会花上50年的时间。但是如果你停下实验一会会儿,并思考蛋白质可能是怎样合成的,那么你会发现只有差不多5种可能的方式,而不是50个!而这只需要几个实验就可以将其辨别清楚。”

一个年轻人补充到:“这就是个老问题:你的实验能做到多小、多精炼?”

这些评论惹恼了在场的一些人。一位电子显微镜工作者说:“绅士们,这跑题了。这已经成了哲学问题。”

Szilard反驳说,“我没有与三流的科学家争论什么:我在与一流的科学家争论。”

一位物理化学家急忙问到,“我们要在晚饭前还是午饭后拍集体合照?”

但这并没有使争吵停下来。一位著名的细胞生物学家站起来说,“没有完全相同的两个细胞。生物学是一门多元的系统。”他自行补充说,“你知道的,科技圈里有科学家,也有一些混日子的——他们做着一些与简单的系统(DNA和体外系统)相关的工作,但他们做的事情与科学无关。我们需要他们的辅助性的工作:他们建造设备、做一些小的研究,但他们不是科学家。”

Cy Levinthal回应到:“有两种生物学家,一种科学家在看是否有些东西可以被理解,而另一种科学家一直说问题很复杂、根本没办法搞清楚……你一定是在钻研你感兴趣的最简单的系统。”

当他们离开会议的时候,大家听到一个人在发牢骚:“Szilard希望我怎么做?举枪自尽嘛?!”

任何试图改变我们的研究方法的批评(或挑战)自然会激起我们的自我防御。但在生物学这个例子中,分析方法极大地提高了科研的效率。但不幸的是,这种批评更多地带来了争吵,而不是促进了学习。最近的很多成就实际上都得益于这些“过度简单的模型系统”,得益于1958年争论中提出的研究思路。他们没有变成那些为辩称“不存在两个一样的细胞”的人,不管这个说法最终是多么正确。这些成就实际上是新的思考方式带来的成就。

高能物理

这种分析思考是鲜有的,但这种思考不应局限于新生物学。高能物理是另一个类似的领域。在该领域中,这种排除逻辑甚至可以显而易见地出现在报纸的新闻稿中。例如,在C. N. Yang和T. D. Lee的著名发现中,其问题是:“在特定反应中,基本粒子是否保持镜像对称性或‘宇称(parity)’性,或者不保持这种特性?”研究者进行了实验,并在几个月里完成了实验,结果排除了‘宇称(parity)’性。Richard Garwin、Leon Lederman和Marcel Weinrich进行了其中的某个实验。这个实验是在晚餐时间想出来的,在午夜之前他们设置好了实验装置,在凌晨4点之前他们捕捉到了证伪‘宇称(parity)’性的脉冲。可以说,这一现象一直在等待这一备择假设的形成。

该领域的理论家热衷于预测新的特性或粒子,如果这些特性或粒子无法被发现,某个理论就完蛋了。正如W. A. H. Rushton所说:“一个不被威胁的理论是无法存活的。”Murray Gell-Mann 和Yuval Ne’eman最近使用粒子分组(他们称之为“The Eightfold Way”)预测了一个未被发现的粒子,即Omega Minus,之后该粒子被发现了。但是该理论的另一个分支预测了一种只有三分之一常规电量的粒子的存在,但该粒子并未被发现,因此这一分支的理论必须被拒绝。

逻辑树是高能物理的重要组成部分,高能物理的某些发展阶段倚赖于电子符合环路(电子符合环路可以探测粒子、激发气泡图[bubble-chamber photographs])。每种电子都会在电子计数器(electronic counters)上激发出不同的模式。通过调整设置,电子环路可以排除和纳入任意类型的事件。如果区分标准是序列的,该设备甚至可以在1微秒时间内跑完整个逻辑树。这种电子预分析,如同人类对潜在结果的分析一样,加速了科研进程,完善了标准。它使得研究者不用浪费时间去扫描成百上千幅无关图像。通过电子分析,或许只需要几个脉冲、几个小时,研究者就可以宣告反质子的存在或者宣告某个理论的终结。

我之所以强调强推断这种研究方法在生物学和高能物理两个领域中的应用,部分源于前辈们对我的影响,包括分子生物学领域的传统遗传学家,或者Midwest Chowder and Bacteria Society的Szilard(1948-50年间于芝加哥),或者Max Delbruck在Cold Spring Harbor开设的关于噬菌体基因(phage genetics)的暑期课程。但同时,这也源于这两个领域自身的特点。生物学的信息内容是巨大的、复杂的,如果不事先充分思考重要的、决定性的实验应当是什么样子,研究者可能会在“低信息”的观察和实验中浪费数十年的光阴。在高能物理中,新的加速器设备所带来的粒子的“信息流”和数百万美金的消耗迫使研究者不得不采用相似的研究方法。在开展每一个实验之前进行顶层设计是值得的,这种习惯传播到了整个领域。

归纳与多重假设

在历史上,强推断这种研究方法的发展得益于两方面的主要贡献。第一个是弗朗西斯・培根。他想要一种“发现自然”的“更可靠的方法”,而不是那个时代那些逻辑上站不住脚或包罗万象的理论,或是“通过简单的列举”来进行归纳(这种方法虽然值得称赞,但却很粗糙)。他不仅仅是像一些人所认为的那样大力提倡实验法,他还强调了将理论和实验联系起来的重要意义——理论与实验可以互相检验。在其建议的诸多归纳法程序中,我认为最重要的是条件归纳树。条件归纳树起于备择假设(培根将其称为“可能的原因”,possible “causes”),通过关键实验(“交叉路口的指向牌”,“Instances of the Fingerpost”),落脚于对备择假设的排除(“建立公理”,“establishing axioms”)。他所声称的“交叉路口的指向牌”就在逻辑树的交叉口。

培根在他的书籍《新推理法(The New Organon)》中提出的很多关键实验至今仍魅力依旧。例如(p164),为了检验体重是由“内在本质”决定的,还是由地球引力导致的(这种情况下体重将随距离的增加而降低),培根提出首先在地面上比较摆钟(依靠重量计时)和弹簧钟(依靠弹簧弹力计时)的速度,之后将其从地面升高到高塔的顶端再比较钟的速度。他作出以下结论:如果塔顶的摆钟比弹簧钟慢,那么我们或许就可以认为地球引力是产生重量的原因(摆钟位置较高时,钟摆重力减小,摆钟速度理应减慢)。

这是一个可以分离空洞理论的方法。

培根声称任何人都可以学习归纳法,就像学习用直尺画直线、用圆规画圆那样。“我提出的用来探索科学知识的方法将人类的智慧拉到了同一水平,这种方法只为那些聪颖的人留下了一点点提升的空间,因为这种方法依据的是最可靠的规则。”即使出现错误,也不会造成致命的影响。“真相能更快地从错误中出现,而不是从混乱中出现。”

不难理解为何年轻人踊跃尝试这种方法。

尽管如此,该方法存在一定的难度。正如培根所强调的,“排除”是必要的。他说,“归纳法适用于科学和艺术,必须通过适当的拒绝和排除来探索真理,在进行了大量的否定之后,研究者便可以得到一个证实性的结论。“研究只能从否定开始,只能将所有备择假设全部排除以后,研究者才能得到验证性的结论。”

或者,正如哲学家Karl Popper所言,在科学中压根儿不存在“证实”这回事儿——因为其他的备择假设(在解释现象或问题时)可能一样好,甚至更好——因此只有证伪能够促进科学的进步。一个不可检验的假设毫无意义,因为这样的假设什么也说明不了:“实证科学必须能够被经验驳倒。”

其困难之处在于证伪是一个艰难的信条。如果你有一个假设,我有另一个假设,很显然这两个假设必须被排除一个。科学家似乎没有其他选择,他们要么一团和气,要么争论不休。或许这就是为什么如此多的人会反对强推断这种分析方法,这就是为什么一些伟大的科学家总是那么爱争吵。

幸运的是,对我来说,这一困难可以通过另一种智力创造来避免,即“多假设,”该方法正是研究者们所需要的用来克服“培根困境”的方法。该方法由芝加哥的一位地理学家T. C. Chamberlin于世纪之交提出,其因提出了关于太阳系起源的“张伯伦-莫顿假说”而闻名。

Chamberlin指出,我们的麻烦在于当我们提出单个假设的时候,我们就附属于它。

“从研究者对某个现象提出一种最初的解释开始,研究者就对这一智力成果产生了感情,当这一解释逐渐发展完善成一种理论,研究者的这种‘父母式的爱’就日趋强烈……”

“另一个在不经意间增长起来的是迫使理论与现实相符的压力,以及迫使现实与理论相符的压力……”

“为了避免这种危险,我们需要多个假设。与单假设不同,多假设将努力和感情分散开去。”

每一个假设都指明了相应的标准,相应的证实方式,相应的洞察事实的方法,如果多个假设包含了方方面面,那么研究者所能获得的结果也是丰富的。

Chamberlin认为该方法“带来了新的思考方式”,并且在教育中极具价值。“在足够长时间的学习之后,这种方法将培养出一种复杂的思考模式……”

这一迷人的文章值得重新刊载,以使每一个研究生和教授可以阅读学习。

我认为,Chamberlin已经为我们在科学研究中遇到的问题给出了解药。为了形成更准确的归纳推断,冲突与排除(对备择假设的排除)都是必要的。这些冲突和排除常常成为研究者之间的冲突,因为每一个研究者只抱守着一种信条。但只要研究者开始拥有多个假设,这就纯粹是不同观点间的冲突。这样的话,我们每天就可以更轻松地来证伪了——以强推断的方法——没有阻抗,没有争吵。事实上,当存在多个假设,而这些假设并不是某个人的私人财产时,实验室的生活就变得非常有趣和兴奋,所有的学生都迫不及待地想要看到故事最后的结局。我觉得这就是Chamberlin所描述的“与众不同的思考方式”和“复杂的思想”得以发展的原因,这就是生物学、高能物理学领域出现锐意进取、兴奋、热情、团队合作(甚至国际合作)的原因。还有什么能比这更有效呢?

当强推断配合多假设时,科研便成了动力源和一项智力活动。

但我觉得不幸的是,通过比较我们可以发现其他领域的科学已经病了,因为它们已经忘记了备择假设和证伪的必要性。每个人都坚守逻辑树中的一个分支(或者没有),它随意的转变前进方向而从不慎重决定。我们可以通过外部症状看出有些东西是科学性错误。例如,永不更新的方法(The Frozen Method),一直做调查的研究者(The Eternal Surveyor),做不到头的研究(The Never Finished),只有一个学术假设的学界大牛(The Great Man With A Single Hypothesis),一小撮拥趸组成的圈子(The Little Club of Dependents),反对一切的杠精(The Vendetta),包罗万象不可证伪的理论(The All-Encompassing Theory Which Can Never Be Falsified)。

有愤世嫉俗的人讲了一个故事(可能是杜撰的):一个理论化学家对学生解释说,“因此我们可以看到,第一种合成物中的C-Cl键比第二种化合物更长,因为其离子性更小。”

教室后排传来一个声音,“但是教授,根据表格,第一种合成物中的C-CI键更短。”

“喔?是吗?”教授说,“那也好理解,因为第一种合成物中的双键离子性更大。”

如果这个故事是真的,那么这种所谓的“理论”根本不是理论,因为它不能排除任何东西。这样的理论能够预测一切,因此它什么也预测不了。在教授的不断重复下,这样的理论也变成了学生不断重复和确信的口头公式。这不是科学,这只是信念;这不是理论,这只是神学。不论是用文字、数字还是公式,一个不可被证伪的理论绝不是理论。换句话说,理论必须能够用实验结果来证伪。

在化学中,共振理论家会认为我在批评他们,分子轨道理论家也会认为我在批评他们。但是他们的行动,不,应当说我们的行动(因为我也是他们中的一员)已经代表了我们。三十年都不能达成一致意见,这就像是一个公开的广告,宣示着其是不可证伪的。

但是,我在这里的目的不是为了骂街,而是想说,我们都有过错,我们在任何领域、任何实验室中都应当创造可证伪的多假设。

系统化的应用

我认为一些科学家的研究方法已经展示出强推断的力量。大量的成功是源于系统地使用了培根的“最可靠的法则和证明”,还是源于可遇而不可求的智慧呢?法拉第的日记本和费尔米的记事本都证明了他们对归纳法的信念。

有机化学一开始是强推断的精神家园。苯中的化学键是可互换的还是等价的?如果是可互换的,则应有5种二取代衍生物;如果是等价的,则应有2种。这就是强推断检验——这不是测量的问题,不是生成物的重量的问题,而是逻辑问题(通过逻辑推测存在其他可能)。否则的话,四面体碳原子或者六边对称苯怎么能通过X射线和红外线证实呢?

我们意识到当Pasteur进入生物学领域时科研氛围还是另一种样子。大家有目共睹,Pasteur采用了完全不同的推理方法。每2-3年,Pasteur就会从一个研究问题转到另一个研究问题:从光学活性到甜菜糖发酵,到葡萄酒和啤酒的“病害”,到蚕病,到“自然发生”问题,到羊炭疽病,到狂犬病。在上述每一个领域中,欧洲都有大把大把的比Pasteur博学的专家,但是这些专家没有解决的问题,Pasteur几个月就解决了。这显然与知识储备量无关,与运气无关(因为Pasteur总是一次又一次的成功);这只能是因为Pasteur系统化地采用了某种研究方法。被细菌污染了?设计一个S形瓶颈。细菌是否被半真空吸进去了?插上棉花插头。周复一周,Pasteur建立起了逻辑树。分子生物学领域今日之盛景实为Pasteur故事的循环上演。 牛顿、麦克斯韦这样伟大的科学家的成就是少数例外。但有趣的是,其工作同样体现出强推断这种方法的作用,比如牛顿对光学的归纳,以及麦克斯韦对三原色的证明。

有效性的尺度

我认为强推断这种方法的有效性为我们提供了一种衡量科研方法有效性的尺度。调查,分类,设备设计,系统化的测量和表格,理论计算——它们各居其位,各司其职,均是探索自然奥妙的重要环节。但不幸的是,它们常常固步自封、自我膨胀,总是在证明自己是一门值得尊敬的学问。

我们赞赏“毕生研究”,但各个领域的大量案例表明,我们真正需要的不是毕生研究,而是短短几个月或几个星期的归纳推断。我们需要在每一个新领域(例如伦琴射线)去尝试,看看从调查到分析推断可以做到多快。我们需要去尝试(像Pasteur那样),看看我们是不是可以得到百科全书不能辨别出来的强推断。

诚然,测量和小研究能够为构筑科学殿堂添砖加瓦。但大部分这样的研究就像散落在砖厂里的废料,并未对科学殿堂的构建发挥什么作用。数字表格有其价值,但如果没有经常评估它,这一个接一个的调查就在实验室中替代了思维,就成了遗害终身的教育训练。

古人云,小心那些只会一种方法或工具的人(不论是实验的还是理论的)。这些人倾向于变成方法导向的,而不是问题导向的。方法导向的研究者画地为牢:问题导向的人至少在靠近最重要的知识。强推断将迷途的羔羊引领到“问题导向”这条道路上,但这要求迷途的小羊们乐于撇开自己擅长的方法,然后学习新的东西。

另一方面,我认为任何思考科学之有效性的人都会发现,当下物理学和化学中的数学知识很多都是无关紧要的(如果不是错误的)。

数学公式的价值在于,当实验的结果与计算的结果在5个小数位上都一致的时候,很多备择假设都可以被排除(尽管Bohr理论和Schrödinger理论所预测的Rydberg系数是一致的!)但是当拟合程度只能精确到两位、甚至一位小数时,数学公式可能还不如外推法的经验法则有效,其他的一些质性的排除方法甚至比量化的拟合程度还要严格和重要。

我知道这就好像是说皇帝的新衣。今天我们宣扬:只有量化的科学才是科学。我们用相关代替因果,用物理公式代替有机推理。测量和方程被认为可以淬炼思维,但通过我的观察,我发现测量和方程只能使思维更混乱、而不是接近因果。它们倾向于变成科学操纵的对象,而不是检验和推断的工具。

很多,或者说大多数,伟大的科学问题都是质性的,而不是量化的,即使在物理和化学中也是这样。公式和测量只有与证据相结合才是有用的:但是证据或反例更重要,即使没有量化的测量,证据和反例也是最具说服力的。

换句话说,你可以通过逻辑或者数学捕捉到现象。逻辑粗糙但是强韧,数学精确但是脆弱。数学看似美丽,但如果没有逻辑上对数字的预测,数学是不能解释现象的。

我的意思是,在很多所谓的科学领域中,我们喜欢我们已经习惯化的方式,我们的研究可以无穷无尽地做下去。我们测量,我们定义,我们计算,我们分析,但我们无法排除备择假设。这不是使用我们的智慧的最有效方式,也不是解决科学问题的最快方式。

我们常常看到某科学家称别人是不科学的。我的观点是,我这里的结论不见得是绝对正确的,但是我们一直以来都需要一种关于“科研有效性”的绝对标准,通过该标准我们可以评估我们在多个科研领域的成功程度——一种大部分人都赞同的标准,这种标准不会受科研压力、时代潮流、科研兴趣和之前工作的影响。我更关注的是评估个人的科研表现,而不是评估某个领域。我坚信强推断就是科研有效性的最高标准——强推断同时也提供了达到这一标准的方法。

强推断的秘诀

我们如何学习和教授这种方法?这种方法没有那么难。你需要首先记住的一点就是,强推断并非神赋异禀,而是可以教授和学习的。分子生物学家就是一个范例。第二个要点就是明确地、正式的、规律地使用它,每天使用半个小时到1个小时的时间进行逻辑分析,并将逻辑树、备择假设、实验设计写在记录本上。我在别的地方讨论过Fermi的笔记方法、这种方法对其学生和同事的效应,以及这种方法可以被习得的证据。

将这种方法教给同伴或者自己的学生需要极尽礼貌。强推断这种取向对其他研究工作的方法和价值极具批判性,任何比较都显得自以为是、盛气凌人。我们可以通过举例、以自己的研究为例进行教学。

我这里需要提出一个严厉的但是有用的检验方法——强推断的试金石——即,努力让别人挑不出刺儿来。任何人都可以学习和使用该方法。培根的“排除法”是我们的老朋友,我喜欢称其为“The Question”。显然,我们既要尽可能挑剔别人,也要尽可能挑剔自己。在听到其他任何理论解释的时候,你需要扪心自问,“但是先生,什么实验可以证伪你的假设?”,或者在听别人介绍一个实验设计的时候提问,“但是先生,你的实验可以证伪什么假设?”

这种方法直击要害。它迫使所有人重新考虑这一核心问题:这一科学问题是否是可以检验的?

如果该问题被大声的提出来,很多伟大的科学家都会变得气急败坏、结结巴巴、脸色铁青,甚至想把提问者扔出去!这样的砖家并不像他看起来那样光鲜,因为他显然没有思考备择假设和实验设计的习惯,旁人甚至会质疑这位砖家所在领域的发展状态。或许,这一提问能给这位砖家好好上一课,也可以给他所在的领域好好上一课!能不能呢?不知道。

另一方面,分子生物学和核物理学在面对这一问题的时候会立即提出不止一个的检验方法来证伪相应的假设——演讲者手下可能已经有两三个研究生已经开始着手相应的工作。

我甚至觉得政府官员需要使用这一试金石。所有科学都是平等的?不。如果所有科学都是平等的,我们将无法通过相互推荐这种方法以外的方法来评价科研的有效性。值得你观察,值得你砸钱的研究者不是那些想要做个调查或者想要做个更详细的调查的研究者,而是带着“笔记本”(见该部分第一自然段)的研究者,带着备择假设和关键实验设计的研究者,知道如何回答你的“The Question”、甚至已经开始着手研究的研究者。

在我们前方的道路上确实有一些非常难的问题、一些高信息问题,例如:光合作用,细胞组织,分子结构,神经系统,更不用提一些社会和国际问题。我认为能在这些复杂领域取得最快地进步、能最有效地利用我们的大脑的方法就是在科研的每一步明确地提出研究问题是什么,备择假设是什么,之后建立关键性地实验来排除某些备择假设。如果这种复杂的问题能够被彻底解决,也只能被那些设计备择假设、排除备择假设、能在单位时间内获得最大量信息、乐于多思考一点点的科研工作者所解决。

当所有人都如此专注的时候,我坚信我们能够在所有领域一次又一次地看到像分子生物学领域那样科研成就井喷的现象,我们的科学知识将以数十倍的比率增长。

原文

Platt, J. R. (1964). Strong inference. Science, 146(3642), 347-353.

知识共享许可协议
本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。

 Academy

  1. 强推断
  2. Prepare data for metaSEM
  3. Ten
  4. Three Types of SS in R