第三节——模型思维:构建理解、预测与干预社会复杂性的抽象工具
在深入探讨了计算社会科学研究的问题意识与数据基础之后,我们现在转向认识论的第三大支柱:模型思维。如果说问题思维为研究设定了方向,数据思维提供了经验基础,那么模型思维则关乎我们如何运用智力工具——即模型——来组织经验、推演逻辑、深化理解,并最终尝试把握甚至影响复杂社会现象的运行轨迹。
模型,作为人类认知世界的核心手段之一,在科学探索的历程中扮演着无可替代的角色 (Hesse, 1966)。它既是连接抽象理论与具体数据的桥梁,也是驱动科学发现和理论创新的引擎。在计算社会科学领域,随着计算能力的极大增强和模型形态的日益丰富,模型思维不仅继承了科学哲学的深厚传统,更被赋予了新的内涵与挑战。它要求研究者不仅具备构建和运用模型的技术能力,更需具备一种深刻的认识论自觉:理解模型的本质是什么?它们如何以及在何种程度上能够代表社会实在?它们服务于哪些不同的认知目标?我们又该依据何种标准来评判一个模型的认知价值?
本节将围绕这些根本性问题展开,系统梳理模型思维的认识论基础,为后续学习和应用计算模型奠定坚实的思想根基。我们将依次探讨模型的认识论本质、其在知识生产循环中的作用、服务于不同认知任务的模型目的论,以及评估模型的内在属性与认识论标准,最后特别关注计算模型带来的独特认识论意涵。
模型的认识论本质:作为认知中介的抽象建构
模型的概念在科学话语中无处不在,但其确切的认识论地位和与实在的关系,一直是科学哲学探讨的核心议题。理解模型的本质,首先需要厘清不同哲学视角下模型是如何被定位的。这些视角并非总是相互排斥,有时可以看作是对模型不同功能或侧面的强调,但它们共同构成了我们理解模型认知角色的基础。
一种广泛持有且历史悠久的观点是表征主义 (Representational Views),认为模型的首要功能是代表或描绘(represent)现实世界的某些方面,即所谓的“目标系统” (target system)。模型之所以具有认知价值,是因为它们在某种意义上“反映”了现实。然而,对于这种“反映”的具体含义,表征主义内部存在不同解释。相似性论 (Similarity Accounts) 认为,模型通过与目标系统在某些相关方面足够相似而获得其表征能力 (Giere, 1988, 1999)。这种相似性不必是全局的或字面意义上的,而是有选择性的、服务于特定目的的相似。例如,一个经济模型可能在预测市场趋势方面与真实市场相似,尽管它忽略了许多个体行为细节。另一种更强调结构对应的观点是同构/同态论 (Isomorphism/Homomorphism Accounts),尤其在形式科学和结构主义传统中影响深远 (Suppes, 1960; van Fraassen, 1980)。这种观点认为,模型(通常是数学或逻辑结构)与其目标系统在结构上存在一一对应(同构)或多对一对应(同态)的关系。模型的认知价值在于其能够精确地映射目标系统的结构性特征和关系。
与表征主义相对或互补的是工具主义 (Instrumentalist Views)。持此观点的学者认为,模型的主要价值不在于其是否“真实地”反映了世界,而在于其作为工具的有效性 (effectiveness) 和有用性 (usefulness)。模型是服务于特定科学目的(如预测、计算、干预、启发)的工具或仪器 (Cartwright, 1983)。评价一个模型的标准是它能否很好地完成这些任务,而不是它是否“像”现实。工具主义提醒我们,模型构建往往受到实用目标的驱动,其形式和内容可能更多地由其预期功能而非对现实的忠实模仿所决定。
进一步,虚构主义 (Fictional Views) 将模型视为一种概念上的虚构创造物 (fictions) (Godfrey-Smith, 2006; Frigg, 2010)。模型描述的往往是现实世界中并不存在的、经过高度简化或理想化的“模型世界”。例如,物理学中的无摩擦平面、经济学中的完全理性人。这些模型并非直接描述现实,而是通过与现实进行类比、隐喻或思想实验,间接地帮助我们理解现实世界的某些方面。虚构主义强调了模型构建中的创造性和非描述性特征。
近年来,一种整合性的推论性观点 (Inferential Views) 受到越来越多的关注 (Suárez, 2004; Weisberg, 2013)。这种观点认为,模型的核心功能是充当推理的中介 (mediator)。研究者并非直接从理论推导到数据,或从数据归纳到理论,而是通过构建和分析模型来进行推论。模型使得我们能够运用特定的推理工具(如数学演绎、计算机模拟)来探索理论的含义、预测数据的模式或解释观测到的现象。模型的表征能力(如果有的话)和其作为工具的有效性,最终都服务于其作为可靠推理引擎的功能。
下表总结了这四种主要的哲学视角:
表征主义 (Representationalism)
模型旨在代表或描绘目标系统的某些方面。
模型的相似性或结构对应 (Similarity/Structure)
工具主义 (Instrumentalism)
模型是用于特定科学目的(预测、计算等)的有效工具。
模型的有效性与有用性 (Effectiveness/Usefulness)
虚构主义 (Fictionalism)
模型是概念上的虚构创造物,通过类比等方式促进理解。
模型的非描述性与创造性 (Non-description/Creativity)
推论性观点 (Inferentialism)
模型是使研究者能够对目标系统进行推论的中介结构。
模型作为推理引擎 (Model as Inference Engine)
无论持有何种哲学立场,科学模型的核心构建过程都离不开两个关键的认知操作:抽象化 (Abstraction) 和 理想化 (Idealization)。这两者密切相关,但概念上可以区分,并且对于理解模型的认识论功能至关重要。抽象化是指在构建模型时,识别并抽取出目标系统的关键或相关要素、属性或关系,同时忽略(omit)那些被认为是不相关、干扰性或过于复杂的细节 (Weisberg, 2013)。抽象化的目标是抓住问题的本质,简化复杂性,使其易于处理和理解。例如,在研究社会网络对信息传播的影响时,模型可能会抽象出网络的拓扑结构(节点和连接),而忽略个体的具体身份、动机或互动内容等细节。抽象化追求的是一种普遍性 (generality),试图剥离特殊性,揭示更广泛适用的模式或原理。
理想化则更进一步,它不仅是忽略,而且是对模型中的元素或条件进行有意的、通常是与现实不符的简化、变形或极端化处理 (McMullin, 1985; Cartwright, 1989; Weisberg, 2007)。理想化可以表现为多种形式:假设不存在摩擦力或空气阻力的物理模型;假设信息完全对称、交易成本为零的经济模型;假设人口无限大或混合均匀的传染病模型;或者,在计算模型中,设定简化的行为规则或同质化的代理人主体。理想化的目的通常是为了使模型在数学上或计算上易于处理 (tractable),或者为了凸显某个特定机制的“纯粹”效果,排除其他干扰因素的影响——这被称为伽利略式理想化 (Galilean Idealization)。与抽象化主要关注“遗漏”不同,理想化涉及了某种程度的“扭曲”或“失真”。
抽象化和理想化共同构成了模型构建的基础。它们是科学理解得以可能的必要手段,因为现实世界过于复杂,无法被完整无缺地复制到模型中。通过有选择地忽略和简化,模型才能够有效地降低认知负荷,突出核心机制,实现知识的迁移和应用 (Wimsatt, 2007)。然而,这也正是模型的局限性所在。抽象化可能遗漏了对现象有重要影响的因素,而理想化则可能导致模型与现实的系统性偏离。因此,对模型进行评估时,理解其所做的抽象和理想化假设,并判断这些假设在特定研究目的下的合理性与后果,是模型思维不可或缺的一环。研究者需要意识到,模型提供的知识总是“有条件的”,其有效性依赖于其抽象和理想化在多大程度上捕捉了目标问题的关键特征,而没有过度扭曲现实。
模型的认识论本质也体现在其多样的本体论形态上,这些形态往往与其服务的主要认知功能相关。虽然模型的分类方式多种多样,但从认知功能的角度区分,有助于我们理解不同模型贡献知识的方式。例如,现象学模型 (Phenomenological Models) 主要目标是准确地描述或预测可观测的现象模式(经验规律),它们关注输入和输出之间的关系,但不一定深入探究产生这种关系的内部机制 (Frigg & Hartmann, 2020)。相比之下,机制性模型 (Mechanistic Models) 则致力于揭示产生现象的底层因果过程、组件及其相互作用 (Craver & Darden, 2013; Hedström & Ylikoski, 2010)。这类模型追求的是解释的深度和对“为什么”的回答。此外,还有结构简单、高度理想化的探索性/玩具模型 (Exploratory/Toy Models) ,它们的主要价值不在于精确拟合数据,而在于探索基本原理、展示概念可能性、激发理论洞见或作为更复杂模型的起点 (Grüne-Yanoff, 2009)。理解不同类型模型的本体论地位和认知目标,有助于研究者更恰当地选择、使用和评估模型。
模型在知识生产循环中的作用:连接理论、数据与认知
模型并非孤立存在,它们深深嵌入在科学知识生产的动态循环之中,扮演着连接理论、数据与研究者认知的关键角色。理解模型在这一循环中的多重作用,是掌握模型思维精髓的重要一步。模型既非纯粹的理论演绎,也非简单的经验归纳,而是处在理论思考与经验观察之间,进行着复杂的双向互动与中介。
模型是理论的载体与探针 (Models as Vessels and Probes for Theory)。理论通常以抽象的、往往是定性的语言表述。模型,特别是数学和计算模型,提供了一种精确、无歧义的语言,可以将理论的核心假设、概念关系和机制进行形式化 (formalization) (Lehtinen, 2018)。这一过程本身就具有重要的认识论价值:它可以暴露理论中隐藏的含糊性、不一致性或未明确的假设;它使得理论的逻辑后果可以通过严格的推导(数学分析)或模拟(计算实验)被探索出来。通过系统地改变模型的参数或结构,研究者可以进行理论探索 (theory exploration),考察理论在不同条件下的含义、预测其动态行为、识别其解释力的边界条件,甚至发现理论中未曾预料到的潜在后果。模型还可以作为比较和整合不同理论 (theory comparison and integration) 的平台。研究者可以构建代表不同理论观点的模型,比较它们在解释同一现象时的优劣,或者尝试将来自不同理论的机制整合到一个统一的模型框架中 (Nowak & Vallacher, 1998)。更进一步,模型运行的结果,尤其是那些反直觉或与现有预期不符的结果,常常能够生成新的理论假设 (generating theoretical hypotheses),这些假设随后可以被引导进行新的经验检验,从而推动理论的修正与发展 (Axelrod, 1997)。在这个意义上,模型是理论发展和精炼过程中不可或缺的“实验室”。
模型是数据的组织者与解释者 (Models as Organizers and Interpreters of Data)。面对庞杂的经验数据,无论是来自传统调查还是大规模数字痕迹,模型提供了一种结构化的方式来模式化数据 (data patterning)。它们帮助研究者识别、描述和总结数据中隐藏的结构、趋势、聚类或异常点,将看似混乱的观测组织成有意义的模式 (Hastie, Tibshirani, & Friedman, 2009)。模型通过其参数或结构,以一种简洁的形式捕捉数据中的关键信息,实现了数据压缩 (data compression) (MacKay, 2003)。例如,一个简单的线性回归模型用两个参数(截距和斜率)就可能概括了两个变量之间数千个数据点的关系。模型还能基于已有的数据和模型结构,对缺失的数据进行插补 (imputation) 或对未来的数据进行外推 (extrapolation),尽管这需要谨慎对待其假设和不确定性。更重要的是,模型为赋予数据意义 (attributing meaning to data) 提供了框架。单纯的数据模式本身并不能自动提供解释。模型,特别是那些蕴含了理论机制的模型,能够将观测到的数据模式与潜在的社会过程、行为动机或因果关系联系起来,从而使得数据不仅仅是数字,而是关于社会现实某种叙述的证据 (Morgan, 1998)。正如著名统计学家 George Box 所言:“所有模型都是错误的,但有些是有用的 (All models are wrong, but some are useful)” (Box, 1976),其“有用性”很大程度上就体现在它们帮助我们理解和解释数据的能力上。
模型扮演着理论与数据之间的中介 (Models as Mediators Between Theory and Data) 的关键角色。科学知识的进步往往涉及在抽象的理论构念与具体的经验测量之间建立联系。模型正是实现这一连接的操作化桥梁 (operational bridge)。理论构念(如社会资本、政治极化)通过模型被转化为可测量的变量或可计算的指标,而经验数据则通过模型被用来检验理论的预测或估计理论参数 (Blalock, 1968)。在这个过程中,理论与数据形成了某种双向约束 (mutual constraint)。一方面,相关的社会科学理论为模型的构建提供了指导,约束了模型的结构形式、变量选择和机制设定的合理性。缺乏理论根基的模型可能只是数据的过度拟合,缺乏解释力或泛化能力。另一方面,经验数据则对模型的有效性提出了检验,约束了模型参数的取值范围,并可能通过与模型预测的偏差来挑战或修正理论 (Mayo, 1996)。这种理论、模型与数据之间的互动关系有时被形容为一个复杂的“三体问题” (Bail, 2014),研究者需要在理论的普适性与简洁性、模型的易处理性与精确性、以及数据的特殊性与噪音之间寻求一种动态的平衡。成功的模型往往是在这三者之间达到了某种富有成效的契合。
模型不仅仅是理论和数据的“仆人”,它们也可以作为独立的认知工具 (Models as Independent Cognitive Tools) 发挥作用。模型构建的过程本身,即思考如何将一个复杂的社会问题抽象化、形式化的过程,往往就能启发新的视角 (heuristic devices),加深研究者对问题本身的理解,即使模型最终未能完美运行或拟合数据 (Wimsatt, 2007)。模型,特别是计算模型,提供了一个进行思想实验 (thought experiments) 的强大平台 (Reiss, 2011)。研究者可以在模型世界中探索那些在现实世界中因伦理、成本或技术限制而无法进行的干预(例如,改变社会网络的结构、调整政策参数),或者考察反事实情景(例如,“如果没有这项技术,社会会如何发展?”),从而获得对因果关系和系统动态的洞察。此外,一个经过充分发展和验证的模型,本身就是一种知识的具体化 (embodiment of knowledge)。它以一种紧凑、可操作、可传播的形式,封装了研究者(或科学共同体)关于某个目标系统如何运作的理解,成为后续研究或实践应用的基础 (Morgan & Knuuttila, 2012)。
模型的目的论:核心认知任务与知识类型
模型思维的一个核心要求是清晰地认识到:我们为什么需要模型?我们希望通过模型获得什么样的知识?不同的研究目标或认知任务,往往需要不同类型的模型,并且对应着不同的评价标准。混淆模型的目标是导致研究设计混乱和结果误读的常见原因。借鉴科学哲学和统计学中的讨论 (Shmueli, 2010; Grüne-Yanoff & Weirich, 2010; Craver, 2006; Hempel, 1965),我们可以将模型服务的主要认知任务大致归纳为四类:描述、预测、解释和生成/可能性探索。这四类任务并非总是截然分开,有时一个模型可能服务于多个目的,但明确主要目标对于指导模型选择、构建和评估至关重要。
描述性知识
描述是科学研究的基础任务之一。服务于描述目的的模型,旨在捕捉、刻画、分类和总结目标现象的静态特征或动态模式。这类模型的目标是提供一个关于“世界是怎样”的准确、简洁、有组织的画面。它们可能用于识别数据中的群体(如聚类分析)、概括大量文本的主题(如主题模型)、展示社会网络的结构特征(如网络可视化与统计指标)、或者描绘变量的分布和相关性。描述性模型产生的知识形态主要是模式陈述 (pattern statements)、类型学 (typologies)、分布特征总结 (distributional summaries) 或结构图谱 (structural maps)。在认识论上,评估描述性模型的关键在于其经验充分性 (empirical adequacy),即模型在多大程度上能够忠实地、准确地反映观测到的数据模式。其重点在于表征的保真度 (fidelity of representation)。一个好的描述性模型应该能够有效地压缩信息,同时保留数据中的关键结构和变异。
预测性知识
预测是许多科学领域的重要目标,尤其在需要进行决策或干预的场景下。服务于预测目的的模型,旨在基于已有的信息(历史数据、当前状态)来推断未来的状态、未观测到的情况或干预的潜在结果。例如,预测选举结果、金融市场波动、疾病传播趋势、用户行为(如购买、流失)等。预测性模型产生的知识形态主要是预测陈述 (predictive statements)、概率估计 (probability estimates) 或趋势预测 (trend forecasts)。在认识论上,评估预测性模型的核心标准是其预测准确性 (predictive accuracy),通常通过在未用于模型训练的新数据(测试集或未来数据)上的表现来衡量。其重点在于模型的泛化能力 (generalizability)。值得注意的是,一个预测能力很强的模型,其内部机制不一定需要完全符合我们对现实的理论理解,甚至可能是难以理解的“黑箱”,只要它能持续做出准确预测即可被认为是成功的(在预测任务上)(Breiman, 2001)。这与解释性目标形成了鲜明对比。
解释性知识
解释是科学理解的核心追求。服务于解释目的的模型,旨在超越现象的表面描述和结果预测,去理解现象发生的原因、机制或依赖关系。它们试图回答“为什么”的问题。例如,解释社会不平等是如何产生和维持的、某项政策为什么会(或不会)产生预期效果、或者个体为何会做出某种特定的社会行为。解释性模型往往致力于揭示变量之间的因果关系 (causal relationships) 或阐明导致宏观现象的微观机制 (micro-level mechanisms)。其产生的知识形态是因果机制陈述 (causal mechanism statements)、反事实依赖关系说明 (counterfactual dependencies) 或过程追踪叙述 (process-tracing narratives)。在认识论上,评估解释性模型的标准比描述和预测模型更为复杂和苛刻。除了需要具备一定的经验充分性外,关键在于其因果有效性 (causal validity)(即模型所断言的因果关系是否真实存在)、机制合理性 (mechanistic plausibility)(即模型所假设的机制是否符合我们对社会行为和互动的理解)、以及与相关领域知识和理论的一致性 (theoretical coherence) (Pearl, 2009)。解释性模型通常要求其内部结构和参数具有可解释性 (interpretability)。
生成性/可能性知识
有时,研究的目标并非解释某个具体发生的事件,而是探索产生某种类型现象的可能机制 (possible mechanisms) 或条件。服务于此目的的模型,尤其是计算模拟模型,旨在展示一个特定的微观过程如何可能 (how-possibly) 导致某种宏观模式的涌现 (emergence)。这类模型的目标是探索系统的潜在行为空间,理解现象生成的充分条件 (sufficient conditions)。例如,Schelling (1971) 的模型展示了即使个体只有轻微的“邻近同质性”偏好,也可能导致宏观层面的严重种族隔离。这个模型并非旨在精确预测某个城市的隔离程度,而是揭示了一种产生隔离现象的可能机制。
生成性/可能性模型产生的知识形态是 “如何可能”的解释 (how-possibly explanations) (Grüne-Yanoff, 2009)、涌现机制说明 (emergent mechanisms) 或反事实路径探索 (counterfactual)。在认识论上,评估这类模型的标准主要在于其生成充分性 (generative sufficiency)(即模型所设定的机制确实能够产生目标现象)、过程合理性 (process plausibility)(即模型中的行为规则和互动方式是否具有一定的现实依据或理论基础)以及其启发性价值 (heuristic value)(即模型是否能带来新的洞见或激发新的研究方向)。
下表总结了这四种核心认知任务:
描述 (Description)
"是什么样的?" (What is it like?)
模式陈述, 类型学, 分布特征, 结构图谱
经验充分性, 表征保真度 (Empirical Adequacy, Fidelity)
预测 (Prediction)
"将会发生什么?" (What will happen?)
预测陈述, 概率估计, 趋势预测
预测准确性, 泛化能力 (Predictive Accuracy, Generalizability)
解释 (Explanation)
"为什么会这样?" (Why is it so?)
因果机制陈述, 反事实依赖, 过程追踪
因果有效性, 机制合理性, 理论一致性 (Causal Validity, Plausibility, Coherence)
生成/可能性 (Generation/Possibility)
"如何可能发生?" (How could it happen?)
“如何可能”解释, 涌现机制说明, 反事实路径探索
生成充分性, 过程合理性, 启发性价值 (Generative Sufficiency, Plausibility, Heuristic Value)
理解这些认知任务之间的区别与联系至关重要。例如,一个好的解释性模型通常也应该具备一定的描述和预测能力,但反之则不然:一个预测准确的模型可能完全缺乏解释力(所谓的“预测性陷阱”)。同样,一个揭示了“如何可能”机制的模型,并不一定能准确预测具体事件的发生。研究中常常存在任务间的认识论张力:追求高预测准确性的复杂模型可能牺牲可理解性 (intelligibility);追求简洁性 (simplicity) 的模型可能无法捕捉现实的全部复杂性,影响其真实性 (realism);侧重输入-输出关系的描述/预测模型与侧重内部过程的解释/生成模型在构建和评估的逻辑上存在显著差异。因此,模型思维要求研究者在项目开始阶段就明确其主要认知目标,并围绕这个目标来选择模型类型、确定评估标准、并最终解释模型结果的意义和局限性。只有目标清晰,模型才能真正成为推动知识进步的有效工具。
模型的内在属性与认识论评估标准
在明确了模型的认识论本质、其在知识循环中的作用以及服务于不同认知目标之后,模型思维的下一个关键环节是如何对模型本身进行深入的审视和批判性的评估。这涉及到两个层面:一是理解模型的内在结构属性 (intrinsic structural properties),即模型“是什么”;二是掌握评估模型认知价值的认识论标准 (epistemological criteria),即判断模型“好不好”的依据。对这两个层面的清晰认知,是负责任地构建、使用和解读模型的基础。
首先,我们需要剖析模型的内在结构属性。任何模型,无论简单或复杂,都由一系列基本构成要素和特征组成。识别这些要素是理解模型行为和局限的前提。
假设集 (Set of Assumptions):这是模型构建的基石。所有模型都建立在一系列明确或隐含的假设之上,这些假设可能涉及本体论(例如,世界是由哪些基本实体构成的?)、理论(例如,个体行为遵循何种原理?)、简化(例如,忽略哪些因素?)、或关于数据生成过程的假定。对这些假设进行清晰的陈述、辨识其性质(哪些是核心假设,哪些是辅助性或技术性假设?)、评估其合理性及其对模型结果可能产生的影响,是评估模型有效性的第一步 (Levins, 1966; Mäki, 2009)。
抽象层次与粒度 (Level of Abstraction and Granularity):模型是在哪个层次上描述目标系统的?是宏观层面(如国家间的关系)、中观层面(如组织或社区)还是微观层面(如个体行为)?模型捕捉的细节程度如何?选择合适的抽象层次和粒度取决于研究问题和理论视角,不同的选择会带来不同的洞察和局限。
范围与边界 (Scope and Boundaries) :模型声称能够解释或预测的现象范围是什么?它适用于哪些特定的时间、空间、社会或文化背景?明确模型的适用边界(scope conditions)对于避免过度泛化和误用至关重要 (Walker & Cohen, 1985)。
组件与关系 (Components and Relations):模型包含哪些基本元素(如变量、主体、节点)?这些元素之间通过何种关系(如数学方程、逻辑规则、网络连接)相互作用?这些关系的性质是确定性的还是随机性的?是线性的还是非线性的?这些结构性选择直接决定了模型的动态行为和潜在能力。
参数空间 (Parameter Space):模型中包含哪些可以调整的参数?这些参数的含义是什么?它们是如何被估计或设定的(基于数据拟合?理论设定?敏感性分析?)?参数的取值范围和敏感性分析是理解模型行为和不确定性的关键。
理解了模型的内在属性之后,我们才能进而讨论如何评估其认识论价值 (epistemological value),即模型在多大程度上能够增进我们的知识或理解。科学哲学和方法论文献中已经发展出一系列用于评估模型的认知美德 (cognitive virtues) 或标准 (Kuhn, 1981; Lacey, 1999; Douglas, 2013)。这些标准并非像数学定理那样具有绝对的客观性,其应用和权重往往取决于研究的具体目标和语境,但它们为我们提供了进行批判性评估的框架。以下是一些核心的认识论评估标准:
经验充分性/拟合优度 (Empirical Adequacy / Goodness-of-Fit):这是最基本的要求之一,即模型与其试图解释或预测的经验数据(观测结果)的一致程度。评估方式包括统计拟合指标、残差分析、模式匹配等。但需要警惕过度拟合(overfitting)的风险,即模型过于紧密地拟合了样本数据中的噪音,而失去了对总体规律的把握。
预测力/泛化能力 (Predictive Power / Generalizability):模型不仅要能解释已知数据,更重要的是能够准确预测未知或未来的数据。这体现了模型的泛化能力,是衡量模型外部有效性的重要指标。通常通过交叉验证、样本外测试等方法来评估。
解释力 (Explanatory Power):模型是否能够提供深刻的、令人信服的、通常是因果性的理解?它能否揭示现象背后的机制?能否统一看似无关的现象?解释力强的模型不仅“知其然”,更能“知其所以然”。评估解释力往往需要结合理论判断和对机制细节的考察。
简洁性/简约性 (Simplicity / Parsimony):在其他条件(如解释力、预测力)相近的情况下,我们倾向于选择更简单的模型(奥卡姆剃刀原则, Occam's Razor)。简洁性体现在假设更少、结构更简单、参数更少等方面。简洁的模型通常更易于理解、分析和推广 (Forster & Sober, 1994)。但这并不意味着最简单的模型总是最好的,有时需要一定的复杂性才能捕捉现实的关键特征。
一致性 (Consistency):包括内部一致性(模型自身逻辑无矛盾)和外部一致性(模型与同一领域内广泛接受的其他理论、知识或背景信念不冲突)。一个与现有知识体系严重冲突的模型,需要提供非常强的证据才能被接受 (Thagard, 1978)。
稳健性/稳定性 (Robustness / Stability):一个好的模型,其核心结论不应过于依赖于某些特定的、可能不确定的假设、参数选择或数据输入的微小变动。稳健性分析(如改变假设、扰动参数、使用不同数据集)是检验模型结论可靠性的重要手段 (Wimsatt, 2012; Levins, 1966)。
可理解性/可解释性 (Intelligibility / Interpretability):模型的内部工作机制和产生结果的过程,能够在多大程度上被人类研究者所理解?对于旨在提供解释的模型,或者需要在高风险领域(如医疗、司法)应用的预测模型,可解释性是一个重要的要求 (Lipton, 2018; Rudin, 2019)。复杂的“黑箱”模型在这方面面临挑战。
精确性 (Precision):模型做出的预测或解释的明确程度如何?是定性的方向判断,还是定量的精确数值?更高的精确性通常意味着更强的可证伪性 (falsifiability) (Popper, 1959),但也可能更容易被证伪。
启发性 (Heuristic Power / Fruitfulness):模型是否能够激发新的研究问题、引导新的实验设计、提出新的概念框架或应用于新的领域?一个富有启发性的模型能够推动整个研究议程的发展,其价值可能超越其最初的拟合或预测能力 (Lakatos, 1970; Kuhn, 1981)。
有效性 (Validity):这是一个 overarching 的概念,指模型在整体上是否达到了其声称的目标,是否真正测量或代表了它意图研究的构念或过程。有效性可以细分为多种类型,如构念效度 (construct validity)(模型操作化是否准确反映了理论构念?)、内部效度 (internal validity)(模型推断的因果关系在研究设定内是否成立?)、外部效度 (external validity)(模型结果能否推广到其他人群、情境或时间?)和生态效度 (ecological validity)(模型设定是否贴近真实的社会环境?)。对有效性的评估需要综合运用多种证据和判断。
下表总结了这些核心的认识论评估标准:
经验充分性 (Empirical Adequacy)
模型与数据的符合程度如何?
预测力/泛化能力 (Predictive Power)
模型对新数据的预测有多准确?
解释力 (Explanatory Power)
模型提供了多大程度的因果理解或机制洞察?
简洁性/简约性 (Simplicity/Parsimony)
模型是否足够简单(在假设、结构、参数方面)?
一致性 (Consistency)
模型内部逻辑是否自洽?是否与背景知识兼容?
稳健性/稳定性 (Robustness/Stability)
模型结论对假设或输入的微小变化是否不敏感?
可理解性/可解释性 (Intelligibility)
模型的运作和结果是否易于人类理解?
精确性 (Precision)
模型的预测或解释有多明确?
启发性 (Heuristic Power)
模型能否激发新的研究或应用?
有效性 (Validity)
模型是否真正测量/代表了其目标构念/过程?(综合多种效度)
需要强调的是,这些评估标准之间可能存在冲突或需要权衡。例如,增加模型的复杂性可能提高拟合优度,但会降低简洁性和可解释性,甚至可能损害泛化能力。追求高度精确的预测可能需要使用难以解释的复杂算法。因此,评估的语境依赖性 (context-dependency of evaluation) 至关重要。对不同标准的侧重取决于模型的认知目标、研究领域的规范、数据的可用性以及研究的最终用途。不存在一个适用于所有情况的“完美模型”或单一的评估指标。模型思维要求研究者基于对这些标准的深刻理解,结合具体的研究情境,进行审慎的、多维度的、透明的评估与论证。
计算模型作为独特的认识论引擎
虽然模型思维的基本原理适用于所有类型的科学模型,但计算模型(computational models),特别是那些在计算社会科学中广泛应用的模拟模型(如Agent-Based Modeling, ABM)和复杂的机器学习模型,因其独特的性质,为传统的模型认识论带来了新的维度和挑战。理解计算模型的独特性,是充分发挥其潜力并规避其风险的关键。
首先,计算模型强调了一种过程导向的认识论 (process-oriented epistemology)。传统的社会科学模型(如许多统计模型)往往侧重于变量之间的相关关系或净效应,有时难以深入揭示导致这些关系的动态过程。计算模型,尤其是模拟模型,通过明确设定主体(代理人)的行为规则以及它们之间的互动方式,使得研究者能够观察和分析从微观互动到宏观模式的逐步演化过程 (step-by-step evolution)。这种对过程的关注,补充了传统基于均衡或静态分析的视角,为理解社会现象的动态性、时间依赖性和路径依赖性提供了强大的工具 (Cederman, 2005; Sawyer, 2005)。
其次,计算模型,特别是生成性模型,突出了一种生成性作为理解方式 (generativity as a mode of understanding) 的认识论途径。正如 Epstein (1999) 的著名论断:“如果你不能让它生长出来,你就不能理解它 (If you didn't grow it, you didn't explain it)”。这种观点认为,对一个社会现象的深刻理解,不仅仅在于能够描述或预测它,更在于能够构建一个包含核心机制的模型,并让这个模型能够“自下而上”地生成 (generate) 出与目标现象相似的宏观模式。这种生成性的成功,被视为对所假设机制的一种强有力支持,尤其对于理解那些难以通过直接观察或还原分析来把握的涌现现象 (emergent phenomena)(如市场崩溃、社会规范形成、集体行为爆发)至关重要 (Gilbert & Troitzsch, 2005)。
再次,计算模型的可执行性 (executability) 使其成为进行 “数字实验” (digital experimentation) 的独特平台。与只能进行一次性推导的数学模型或难以精确控制的物理实验不同,计算模型可以被反复运行。研究者可以系统地探索广阔的参数空间 (parameter space),进行敏感性分析 (sensitivity analysis),考察不同初始条件或随机因素对结果的影响。更重要的是,可以在模型世界中进行受控的干预实验 (intervention experiments) 和反事实分析 (counterfactual analysis),即探索“如果……会怎样?”的问题 (Pearl, 2009)。例如,模拟不同政策干预对社会不平等的影响,或者比较不同网络结构对信息传播效率的作用。这种通过模拟进行的实验,极大地拓展了我们探索因果关系和系统行为的能力,超越了传统思想实验的局限性 (Humphreys, 2004; Winsberg, 2009)。
此外,计算模型的广泛应用也推动了算法思维 (algorithmic thinking) 在社会科学中的渗透。这种思维方式强调将社会过程理解为一系列可被形式化描述的规则 (rules)、步骤 (steps) 和信息处理过程 (information processing)。它关注过程的逻辑、效率和可计算性。将社会现象“算法化”本身就是一种特定的认识论视角,它可能揭示传统理论框架未能注意到的结构和动态,但也可能因过度简化或技术决定论而带来风险 (Elish, 2016; Kitchin, 2017)。
同时,计算模型,特别是那些能够整合大量异质性个体、复杂互动网络和非线性反馈回路的模型,为处理复杂性 (addressing complexity) 提供了前所未有的途径 (Miller & Page, 2007)。传统分析方法往往难以处理这类系统性特征。计算模型通过模拟,使得研究者能够直接观察和分析复杂系统中的涌现行为、临界点、自组织现象等,挑战了传统社会科学中基于线性思维和平均主义假设的研究范式 (Urry, 2005)。
然而,计算模型的强大能力也伴随着独特的认识论挑战。
“黑箱”问题 (The "Black Box" Problem):许多先进的计算模型,特别是深度学习等机器学习模型,虽然可能具有很高的预测精度,但其内部运作机制极其复杂,难以被人类研究者直观理解和解释。这给需要透明度和问责制的解释性任务或高风险决策带来了严峻挑战。追求模型的可解释性(Explainable AI, XAI)已成为一个重要的研究方向 (Adadi & Berrada, 2018)。
模拟与现实的鸿沟 (The Gap Between Simulation and Reality):对于复杂的模拟模型,如何验证其结果的有效性是一个难题。模型可能在内部逻辑上是自洽的,甚至能生成看似合理的模式,但这并不保证它真实地反映了现实世界的运作方式。模型的验证 (validation)(模型是否准确代表了目标系统?)和确认 (verification)(模型代码是否正确实现了设计意图?)是计算建模中持续存在的挑战 (Kleindorfer & Ganeshan, 1993; Sargent, 2013)。需要结合经验数据校准、模式匹配、专家判断等多种方法进行严格的评估。
过度拟合与虚假发现的风险 (Risks of Overfitting and Spurious Discovery):计算模型(尤其是数据驱动的机器学习模型)与大规模数据的结合,增加了发现虚假关联或模式的风险。模型可能过度拟合样本数据的噪音,或者在海量探索中偶然发现统计上显著但无实际意义的模式。这要求研究者在使用复杂模型和大数据时,采取更加严格的统计推断标准、模型验证程序和理论审视 (Calude & Longo, 2017)。
模型思维是贯穿计算社会科学研究始终的核心认知能力。它要求研究者深刻理解模型的本质是作为认知中介的抽象建构,认识到模型在连接理论与数据、驱动知识生产中的多重角色,能够根据不同的认知目标(描述、预测、解释、生成)选择和评估模型,并掌握一套包含经验充分性、解释力、简洁性、稳健性等多维度在内的认识论评估标准。特别地,在计算社会科学时代,模型思维还需要融入对计算模型独特优势(如过程导向、生成性、可执行性)和挑战(如黑箱问题、验证困境)的理解。唯有具备深厚且具批判性的模型思维,研究者才能有效地运用模型这一强大工具,在复杂的社会世界中探索真知,并为应对现实挑战贡献有价值的洞见。下一部分将进入方法论介绍,该部分将尽可能全面地介绍传统社会科学与计算社会科学所涉及的核心概念、方法体系与应用。
参考文献
Adadi, Amina, and Mohammed Berrada. 2018. “Peeking Inside the Black-Box: A Survey on Explainable Artificial Intelligence (XAI).” IEEE Access 6: 52138–60. doi:10.1109/ACCESS.2018.2870052.
Axelrod, Robert. 1997. “The Dissemination of Culture: A Model with Local Convergence and Global Polarization.” The Journal of Conflict Resolution 41(2): 203–26. doi:10.1177/0022002797041002001.
Bail, Christopher A. 2014. “The Cultural Environment: Measuring Culture with Big Data.” Theory and Society 43(3): 465–82. doi:10.1007/s11186-014-9216-5.
Bas, C. Van Fraassen. 1980. The Scientific Image. New York: Oxford University Press.
Blalock, Hubert M. & ann b. 1968. Methodology in Social Research. Later printing edition. New York: London : McGraw-Hill.
Box, George E. P. 1976. “Science and Statistics.” Journal of the American Statistical Association 71(356): 791–99. doi:10.1080/01621459.1976.10480949.
Breiman, Leo. 2001. “Random Forests.” Machine Learning 45(1): 5–32. doi:10.1023/A:1010933404324.
Calude, Cristian S., and Giuseppe Longo. 2016. “The Deluge of Spurious Correlations in Big Data.” Foundations of Science 22(3): 595–612. doi:10.1007/s10699-016-9489-4.
Cartwright, Nancy. 1983. How the Laws of Physics Lie. New York: Oxford University Press.
Cartwright, Nancy. 1989. Nature’s Capacities and Their Measurement. New York: Oxford University Press.
Craver, Carl F. 2006. “When Mechanistic Models Explain.” Synthese 153(3): 355–76. doi:10.1007/s11229-006-9097-x.
Craver, Carl F. 2013. In Search of Mechanisms: Discoveries Across the Life Sciences. ed. Lindley Darden. London: University of Chicago Press.
Forster, Malcolm, and Elliott Sober. 1994. “How to Tell When Simpler, More Unified, or Less Ad Hoc Theories Will Provide More Accurate Predictions.” The British Journal for the Philosophy of Science 45(1): 1–35.
Frigg, Roman. 2007. “Models and Fiction.” Synthese 172(2): 251–68. doi:10.1007/s11229-009-9505-0.
Frigg, Roman, and Stephan Hartmann. 2006. “Models in Science.” https://plato.sydney.edu.au/entries/models-science/ (May 12, 2025).
Giere, Ronald N. 1990. Explaining Science. University of Chicago Press.
Giere, Ronald N. 1999. Science without Laws. 1st edition. Chicago: University of Chicago Press.
Godfrey-Smith, Peter. 2006. “The Strategy of Model-Based Science.” Biology and Philosophy 21(5): 725–40. doi:10.1007/s10539-006-9054-6.
Harris, William A. 1997. “On ‘Scope Conditions’ in Sociological Theories.” Social and Economic Studies 46(4): 123–27.
Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. 2009. “Overview of Supervised Learning.” In The Elements of Statistical Learning: Data Mining, Inference, and Prediction, eds. Trevor Hastie, Robert Tibshirani, and Jerome Friedman. New York, NY: Springer, 9–41. doi:10.1007/978-0-387-84858-7_2.
Hedström, Peter, and Petri Ylikoski. 2010. “Causal Mechanisms in the Social Sciences.” Annual Review of Sociology 36(Volume 36, 2010): 49–67. doi:10.1146/annurev.soc.012809.102632.
Hempel, Carl Gustav. 1965. Aspects of Scientific Explanation and Other Essays in the Philosophy of Science. New York: The Free Press.
Herfeld, Catherine. 2018. “Explaining Patterns, Not Details: Reevaluating Rational Choice Models in Light of Their Explananda.” Journal of Economic Methodology 25(2): 179–209. doi:10.1080/1350178X.2018.1427882.
Hesse, Mary B. 1966. Models and Analogies in Science. University of Notre Dame Press.
Humphreys, Paul. 2004. Extending Ourselves: Computational Science, Empiricism, and Scientific Method. New York, US: Oxford University Press.
Kitchin, Rob. 2017. “Thinking Critically about and Researching Algorithms.” Information, Communication & Society 20(1): 14–29. doi:10.1080/1369118X.2016.1154087.
Kuhn, Thomas S. 1981. “Objectivity, Value Judgment, and Theory Choice.” In Review of Thomas S. Kuhn The Essential Tension: Selected Studies in Scientific Tradition and Change, ed. David Zaret. Duke University Press, 320–39.
Lakatos, I. 1970. “Falsification and the Methodology of Scientific Research Programmes.” In Criticism and the Growth of Knowledge: Proceedings of the International Colloquium in the Philosophy of Science, London, 1965, eds. Alan Musgrave and Imre Lakatos. Cambridge: Cambridge University Press, 91–196. doi:10.1017/CBO9781139171434.009.
Levins, Richard. 1966. “The Strategy of Model Building in Population Biology.” American Scientist 54(4): 421–31.
Lipton, Zachary C. 2018. “The Mythos of Model Interpretability: In Machine Learning, the Concept of Interpretability Is Both Important and Slippery.” Queue 16(3): 31–57. doi:10.1145/3236386.3241340.
MacKay, David J. C. 2003. Information Theory, Inference and Learning Algorithms. Illustrated edition. Cambridge: Cambridge University Press.
Mäki, Uskali. 2009. “Economics Imperialism: Concept and Constraints.” Philosophy of the Social Sciences 39(3): 351–80. doi:10.1177/0048393108319023.
Mayo, Deborah G. 1996. Error and the Growth of Experimental Knowledge. 1st edition. Chicago: University of Chicago Press.
McMullin, Ernan. 1985. “Galilean Idealization.” Studies in History and Philosophy of Science Part A 16(3): 247. doi:10.1016/0039-3681(85)90003-2.
Miller, John H., and Scott E. Page. 2007. Complex Adaptive Systems: An Introduction to Computational Models of Social Life. Princeton, NJ, US: Princeton University Press.
Morgan, D. L. 1998. “Practical Strategies for Combining Qualitative and Quantitative Methods: Applications to Health Research.” Qualitative Health Research 8(3): 362–76. doi:10.1177/104973239800800307.
Morgan, Mary S., and Tarja Knuuttila. 2012. “Models and Modelling in Economics.” In ed. Uskali Mäki. Elsevier (Firm), 49–87. http://www.elsevier.com/wps/find/homepage.cws_home (May 12, 2025).
Nowak, Andrzej, and Robin R. Vallacher. 1998. Dynamical Social Psychology. New York, NY, US: Guilford Press.
Pearl, Judea. 2009. Causality: Models, Reasoning and Inference. 2nd edition. Cambridge, U.K. ; New York: Cambridge University Press.
Popper, Karl R. 1959. The Logic of Scientific Discovery. Oxford, England: Basic Books.
Reiss, Peter C. 2011. “Structural Workshop Paper—Descriptive, Structural, and Experimental Empirical Methods in Marketing Research.” Marketing Science 30(6): 950–64. doi:10.1287/mksc.1110.0681.
Rudin, Cynthia. 2019. “Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead.” Nature Machine Intelligence 1(5): 206–15. doi:10.1038/s42256-019-0048-x.
Sargent, Robert G. 2007. “Verification and Validation of Simulation Models.” In Proceedings of the 39th Conference on Winter Simulation: 40 Years! The Best Is yet to Come, WSC ’07, Washington D.C.: IEEE Press, 124–37.
Sargent, Thomas J. 2013. Rational Expectations and Inflation (Third Edition). Princeton University Press. https://www.jstor.org/stable/j.ctt2jc97n (May 12, 2025).
Sawyer, R. Keith. 2005. Social Emergence: Societies As Complex Systems. Cambridge: Cambridge University Press.
Schelling, Thomas C. 1971. “Dynamic Models of Segregation†.” Journal of Mathematical Sociology 1(2): 143–86. doi:10.1080/0022250X.1971.9989794.
Shmueli, Galit. 2010. “To Explain or to Predict?” Statistical Science 25(3): 289–310. doi:10.1214/10-STS330.
Suárez, Mauricio. 2004. “An Inferential Conception of Scientific Representation.” Philosophy of Science 71(5): 767–79. doi:10.1086/421415.
Suppes, Patrick. 1960. “A Comparison of the Meaning and Uses of Models in Mathematics and the Empirical Sciences.” Synthese 12(2): 287–301. doi:10.1007/BF00485107.
Sutton, Robbie, and Karen Douglas. 2013. Social Psychology. New York, NY: Palgrave Macmillan/Springer Nature. doi:10.1007/978-1-137-29968-0.
Thagard, Paul R. 1978. “The Best Explanation: Criteria for Theory Choice.” Journal of Philosophy 75(2): 76–92. doi:10.2307/2025686.
Weisberg, Michael. 2007. “Three Kinds of Idealization.” Journal of Philosophy 104(12): 639–59. doi:10.5840/jphil20071041240.
Weisberg, Michael. 2015. Simulation and Similarity: Using Models to Understand the World. Reprint edition. Oxford: Oxford University Press.
Wimsatt, William C. 2007. Re-Engineering Philosophy for Limited Beings: Piecewise Approximations to Reality. Cambridge: Harvard University Press.
Wimsatt, William C. 2012. “Robustness, Reliability, and Overdetermination.” In Characterizing the Robustness of Science: After the Practice Turn in Philosophy of Science, ed. Lena Soler. Springer Verlag, 61–78.
Winsberg, Eric. 2009. “Computer Simulation and the Philosophy of Science.” Philosophy Compass 4(5): 835–45. doi:10.1111/j.1747-9991.2009.00236.x.
最后更新于
这有帮助吗?