强推断

当代的科学家们倾向于粉饰太平——声称一切科学都是平等的。我们偶尔会抨击个别异己分子的研究工作,但通常情况下我们宣扬所有科学家的研究领域和研究方法都一样的好(或者略胜一筹)。因此,在推荐他人申请政府资助的时候,我们也保持着热情友好的态度。 但我认为,凡深思过该问题的人都会赞同下述观点:某些领域科学研究的进步速度要比其他领域快很多。这类事实常见诸报端——例如分子生物学和高能物理,这都是高深学科领域取得的货真价实的进展。正如Alvin Weinberg所说,几乎每个月美国国家科学院院刊上都会报道分子生物学的科研突破。 为何某些科研领域有如此迅猛的发展,而其他领域没有?因为其他领域太难?因为其他领域的科研工作者或教育质量不行?因为其他领域科研项目的规模小?这些原因确实重要,但并不充分。我开始相信,影响科研进步的主要因素是一种智力因素。即,这些进展神速的科研领域往往都系统化地教授和应用“强推断”这种科研方法。我认为有必要对这种方法的运用、历史和逻辑进行考察,然后看看其他团体或个体是否可以学习这种方法,并在自己的科研工作中加以应用。 究其成分,强推断不过是简单、老套的归纳推断,其最早可以追溯到弗朗西斯·培根。其步骤为每一个大学生所熟知,科学家们也断断续续地练习和使用这种方法。但差别在于系统化地应用。强推断要求以一种正式的、明确的、规律的方式将下述步骤应用到每一个科研问题中: Step1:设计备择假设; Step2:设计至关重要的实验(一个或多个),每个实验都可能出现不同的结果、能够尽可能接近地排除一个或多个假设; Step3:进行实验,得到结果; Step1’:重复上述步骤,产生子假设或序列假设以淬炼结论。 就像爬树,在第一个分叉口,我们选择踩右边还是左边的树干(在科学研究中,自然的神秘力量或者实验本身对实验的结果进行选择),在下一个分叉口,我们又要选择踩右边还是左边的树干……在条件化的计算机程序中也有相似的决策点,其中计算机的下一个动作取决于前一次计算的结果。在很多一年级的化学课本上也有此类的“条件归纳树”或者“逻辑树”。化学课本上描述了对未知样品进行分析的步骤:加入试剂A。如果你得到红色沉淀物,那是物质alpha,你需要过滤、并添加试剂B;如果你得到的不是红色沉淀物,则加入试剂C…… 当然,对任何新问题而言,归纳不像演绎那样简单,因为其涉及到对未知的探索。Step1和Step2需要智力性的创造,Step1和Step2必须进行聪明地选择,以使假设、实验、结果和排除以一种严格的三段论的方式联系起来。关于如何进行这种创造,其他地方已经讨论很多了。那些标准规范告诉我们的是:在设计假设和实验、实施下一步、进行到下一个分叉口时尽量不浪费时间在无关紧要的东西上。 为何这样的方法可以产生快速、有力的进步?探索未知没有捷径,这样的方法只是遵循了最起码的步骤。任何没有经过排除的结论都是不安全的,都必须进行复查。进入下一个循环之前的任何延迟都只是延迟。强推断(及其产生的决策树)之于归纳推断,正如三段论之于演绎推断。强推断为尽可能快地、一个接一个地获得稳固的归纳结论提供了规律性的方法。 “但这有什么新奇的呢?”某些人会说。这正是科学研究所用的方法,一直以来都是;为何要给它一个特别的名字呢?原因在于,我们中的很多人几乎都忘记了它。科学已是日常。仪器、计算和演讲本身成为了本身的目的。我们中有多少人每天会将备择假设和实验设计写下来,并聚焦在对某个假设的排除上?我们一直以来所写的论文,看起来就像我们心中确实有步骤1、2、3。但实际上,我们做的只是累人却毫无价值的工作。我们变得“方法导向”而不是“问题导向”。我们说,我们倾向于摸索着进行概括。我们没能有效地教会我们的学生如何进行敏锐地归纳推断。并且,我们没有意识到在科研的每个步骤中设定备择假设、排除备择假设所能够带来的巨大增益。 不规范的研究方法之于强推断,就好比于一个偶尔可以打着火的汽油发动机与一台稳定运转的汽油发动机。如果我们的摩托艇就像我们的研究工作一样错误百出,那么我们中的大部分人都将赶不上吃晚饭。 分子生物学 新的分子生物学是一个我认为强推断法得以广泛使用并大获成功的领域。这是一个复杂的领域;尽管如此,过去10年连续进行的实验为我们提供了关于遗传机制、酶、蛋白质合成的数量惊人的新知。 分子生物学的每一个实验都体现出这种逻辑结构。1953年,James Watson和Francis Crick提出DNA是一个双螺旋分子,同时也形成了一系列有待检验的备择假设。在细胞分裂时,双螺旋的两条链是在一起的还是分开的?Matthew Neselson和Franklin Stahl使用了独创性的同位素密度标记法,揭示出细胞分裂时双螺旋的两条链是是分开的。DNA双螺旋始终有两条链么,是否像原子模型那样有三个?Alexander Rich发现有时是两条,有时是三条,这取决于离子浓度。这些实验会是John Dalton喜欢的实验,因为这些实验都表明DNA不是原子,而是长长的巨分子链。 或者换一个问题:基因图谱(基因图谱展示了重组实验中不同基因特征之间的统计关系)是如DNA分子一样单维的(T.H. Morgan1911年提出),还是双维的?Seymour Benzer的数百个精细的、基于细菌的微观遗传实验表明,基因图谱只能是单维的。 当然,这样的实验在任何领域都可以找到。分子生物学这一领域的独特之处在于,规范的归纳推断在该领域得到了系统化的应用和传授。每天早晨,英国剑桥分子生物学实验室的黑板上都布满了Francis Crick或者Sidney Brenner写的逻辑图。最上方的一行写着刚从实验室获得的实验结果,或者从信件或谣言中获得的结果。第二行则写着两个或三个可能的解释,或者一个小列表——“他做错了什么”。下面将是一系列的实验和控制条件,这些实验和控制条件可以减少对于实验结果的可能解释(即备择假设)。如果人们开始讨论为何实验会失败或者实验应当如何改进,决策树就会开始继续发展。 这种强推断的态度在论文的写作风格中就可以看出来。例如,在分析抗体形成的理论时,Joshua Lederberg给出了9项有待推翻的命题,并讨论了哪一个更容易通过实验检验。 法国领军者Francois Jacob和Jacques Monod也因其“逻辑密度”而著名,其论文中段落的衔接就像是将“归纳三段论”连在了一起。这种风格得到了广泛的传播——从1964年Journal of Molecular Biology上的第一篇论文开始,我们就能看到下述风格的论文:“Our conclusions… might be invalid if…(i)…(ii)…or (iii)…We shall describe experiments which eliminate these alternatives.”平庸的物理学家、化学家或任何领域的科学家都习惯了逻辑松散、推断不清晰的文章,哪怕只是随机从Journal of Molecular Biology上阅读一篇文章,这些科学家都能从中受益。 对分析方法的抗拒 生物学的这一分析取向有时甚至变成了一项改革运动,因为它引起了很多科学家的抗拒,这些科学家成长于一种更为宽松的、弥散的科研环境。这两种观念在1958年博尔德的生物学家会议上出现了戏剧化的对峙。Leo Szilard说:“酶是如何产生的,蛋白质是如何合成的,抗体是如何形成的,这些问题的答案已近在眼前,而在此之前这是不可想象的。如果你做愚蠢的实验,一年做完一个,这可能会花上50年的时间。但是如果你停下实验一会会儿,并思考蛋白质可能是怎样合成的,那么你会发现只有差不多5种可能的方式,而不是50个!而这只需要几个实验就可以将其辨别清楚。” 一个年轻人补充到:“这就是个老问题:你的实验能做到多小、多精炼?” 这些评论惹恼了在场的一些人。一位电子显微镜工作者说:“绅士们,这跑题了。这已经成了哲学问题。” Szilard反驳说,“我没有与三流的科学家争论什么:我在与一流的科学家争论。” 一位物理化学家急忙问到,“我们要在晚饭前还是午饭后拍集体合照?” 但这并没有使争吵停下来。一位著名的细胞生物学家站起来说,“没有完全相同的两个细胞。生物学是一门多元的系统。”他自行补充说,“你知道的,科技圈里有科学家,也有一些混日子的——他们做着一些与简单的系统(DNA和体外系统)相关的工作,但他们做的事情与科学无关。我们需要他们的辅助性的工作:他们建造设备、做一些小的研究,但他们不是科学家。” Cy Levinthal回应到:“有两种生物学家,一种科学家在看是否有些东西可以被理解,而另一种科学家一直说问题很复杂、根本没办法搞清楚……你一定是在钻研你感兴趣的最简单的系统。” 当他们离开会议的时候,大家听到一个人在发牢骚:“Szilard希望我怎么做?举枪自尽嘛?!” 任何试图改变我们的研究方法的批评(或挑战)自然会激起我们的自我防御。但在生物学这个例子中,分析方法极大地提高了科研的效率。但不幸的是,这种批评更多地带来了争吵,而不是促进了学习。最近的很多成就实际上都得益于这些“过度简单的模型系统”,得益于1958年争论中提出的研究思路。他们没有变成那些为辩称“不存在两个一样的细胞”的人,不管这个说法最终是多么正确。这些成就实际上是新的思考方式带来的成就。 高能物理 这种分析思考是鲜有的,但这种思考不应局限于新生物学。高能物理是另一个类似的领域。在该领域中,这种排除逻辑甚至可以显而易见地出现在报纸的新闻稿中。例如,在C.
Read more...