第二节——计算社会科学的缘起:智识汇流、领域界定与范式确立

智识的积淀与汇聚:计算社会科学的多元思想源泉

计算社会科学(Computational Social Science, CSS)作为一个新兴的跨学科研究领域,其诞生并非一蹴而就或凭空创造,而是深深植根于社会科学内部寻求精确化、形式化和经验化的长期努力,并广泛受益于与数学、统计学、计算机科学、物理学、工程学乃至复杂性科学等多个学科长达数十年的交叉渗透、智识交流与方法借鉴。理解 CSS 的智识谱系,有助于我们把握其核心关切、方法论取向以及与传统社会科学的继承与革新关系。其发展脉络中,既包含了社会科学自身内部的演进动力,也吸收融合了来自外部学科的理论视角、分析工具和计算思维。我们可以将这些多元的源流大致归纳为以下几个相互关联的方面:

社会科学内部的定量化与形式化传统

早在计算机普及之前,社会科学内部就存在着强烈的追求科学化、精确化和模型化的潮流。

  • 经典量化社会科学 (Classical Quantitative Social Science): 这是 CSS 最直接的基础和对话对象。以调查研究方法论(抽样、问卷设计、测量)、实验设计原则、概率论与统计推断(假设检验、置信区间)、回归分析及其扩展(如广义线性模型、多层模型、结构方程模型)、以及计量经济学(Econometrics)为代表的经典量化方法,为社会科学研究提供了严谨的数据收集、分析和推断框架。CSS 正是在这一坚实基础上,试图利用新的数据和计算能力来克服其局限性,拓展其边界。例如,CSS 中的许多预测和因果推断问题,仍然是在经典统计推断的框架内进行思考,但使用了更复杂的模型和算法。

  • 数学社会学与形式理论 (Mathematical Sociology and Formal Theory): 自 20 世纪中叶以来,许多学者致力于运用数学工具(如图论、博弈论、微分方程、线性代数等)来形式化地表达社会理论,构建抽象模型以分析社会结构、互动过程和集体行为的逻辑。这种对理论进行精确化、公理化表达的追求,培养了社会科学中的形式化思维和模型化取向,为后来接受计算模型奠定了基础 (Coleman, 1964; Fararo, 1989)。

  • 早期社会网络分析 (Early Social Network Analysis, SNA): 对社会关系结构进行形式化和定量化研究的传统可以追溯到 Jacob Moreno 的社会测量学 (Sociometry) (Moreno, 1934) 以及后来在社会学和人类学中发展起来的基于图论的结构分析方法。Linton Freeman, Mark Granovetter, Barry Wellman 等学者开创性地发展了网络中心性、结构洞、强弱连接等核心概念和测量方法,奠定了将社会关系视为可分析的网络结构的基础 (Freeman, 1978; Granovetter, 1973; Wasserman & Faust, 1994)。现代网络科学在社会领域的应用,正是在早期 SNA 的基础上,借助强大的计算能力处理更大规模、更复杂网络而发展起来的。

  • 定量地理学与地理信息科学 (Quantitative Geography and GIScience): 地理学中的“计量革命”以及随后地理信息系统(GIS)和空间统计学(Spatial Statistics)的发展,为分析人类行为、社会现象和人地关系的空间维度提供了强大的理论框架和技术工具。对空间自相关、空间异质性、空间互动模式的关注,以及处理和可视化地理空间数据的方法,对 CSS 中涉及地理位置、移动性、城市研究等领域产生了重要影响 (Goodchild, 2007; Anselin, 1995)。

早期计算应用与模拟思想的萌芽

在大型计算机开始出现的时代,一些富有远见的社会科学家就已经开始探索利用计算能力进行研究。

  • 早期计算社会模拟 (Early Computational Social Simulation): 经济学家 Guy Orcutt 在 20 世纪 50 年代就提出了微观模拟 (Microsimulation) 的思想,试图通过模拟大量个体单位(家庭、公司)的行为及其加总来预测宏观经济指标 (Orcutt, 1957)。社会学家和政治学家也开始尝试使用计算机模拟来研究投票行为、组织决策、国际关系等。这些早期探索虽然受限于当时的计算能力和数据可用性,但孕育了通过计算来“生成”社会过程以进行理解和预测的思想种子。计算经济学(Computational Economics)领域后来也发展出基于智能体的计算经济学(Agent-Based Computational Economics, ACE)等重要分支 (Tesfatsion & Judd, 2006)。

  • 赫伯特·西蒙 (Herbert A. Simon) 的跨学科遗产: 作为诺贝尔经济学奖得主和图灵奖得主,赫伯特·西蒙是一位横跨心理学、经济学、管理学、计算机科学和人工智能的巨人。他提出的有限理性 (Bounded Rationality) 概念,挑战了新古典经济学的完全理性假设,强调人类决策是在认知局限下进行的启发式搜索过程 (Simon, 1955)。他倡导将人类个体和组织视为信息处理系统 (Information Processing Systems),并探索了使用计算机程序来模拟人类问题解决和决策过程的研究。他对人工智能、组织理论、复杂系统建模的开创性贡献,深刻影响了后来 CSS 中对个体行为建模、组织模拟以及复杂性思维的应用 (Simon, 1996)。

来自相关科学与工程领域的理论与方法输入

进入 20 世纪末和 21 世纪初,一系列新兴交叉学科的崛起和关键计算技术的成熟,极大地催化了 CSS 的形成。

  • 复杂性科学 (Complexity Science): 兴起于圣塔菲研究所(Santa Fe Institute)等地的复杂性科学,提供了一套理解和分析复杂适应系统(CAS)的跨学科理论框架和方法论。它关注系统的涌现 (Emergence)、自组织 (Self-organization)、反馈 (Feedback)、非线性 (Non-linearity)、网络结构 (Network Structure) 和适应性行为 (Adaptive Behavior) 等共性特征。复杂性科学不仅为理解社会系统的内在复杂性提供了新的理论视角,也极大地推广了基于主体的建模 (Agent-Based Modeling, ABM) 作为研究复杂系统动力学的核心工具 (Holland, 1995; Mitchell, 2009; Miller & Page, 2007)。Axelrod (1997) 关于合作演化的研究、Epstein 和 Axtell (1996) 的“糖域”(Sugarscape)人工社会模型等,都是利用 ABM 研究社会现象的经典范例,深刻影响了 CSS 的模拟传统。

  • 网络科学 (Network Science, Modern): 在早期 SNA 的基础上,融合了统计物理学(如研究相变、标度律)、计算机科学(如图算法、大规模数据处理)和社会科学的洞察,现代网络科学作为一个独立领域在世纪之交蓬勃发展起来。以 Watts 和 Strogatz (1998) 的“小世界”模型、Barabási 和 Albert (1999) 的“无标度”网络模型为代表的研究,揭示了现实世界中各种复杂网络(包括社会网络、信息网络、技术网络、生物网络)普遍存在的非平凡拓扑结构特征及其形成机制。网络科学发展出了一整套分析大规模网络结构(如度分布、聚类、社群结构、中心性)、功能(如信息传播、韧性)和演化动力学的强大理论与计算工具,成为 CSS 研究社会关系、互动和传播现象的核心方法论支柱 (Newman, 2018; Barabási, 2016)。

  • 数据科学、机器学习与人工智能 (Data Science, Machine Learning, AI): 正如第一部分所述,计算机科学中的这些领域提供了处理和分析大规模、高维、异构数据的核心算法、工具和工程实践。机器学习(特别是深度学习)、自然语言处理、数据挖掘、模式识别等技术,为 CSS 提供了强大的描述性分析能力(如从文本中提取主题、从行为数据中发现模式)、预测能力(如预测用户行为、社会趋势)乃至辅助因果推断的能力(如用 ML 处理高维混淆)。数据科学强调从数据中学习、以预测为导向、以及处理现实世界 messy data 的整个工作流程(数据收集、清洗、探索、建模、评估、部署),其思维方式和技术栈对 CSS 的实践产生了深远影响 (Hastie et al., 2009; Murphy, 2022; Provost & Fawcett, 2013)。

表 1 计算社会科学的关键思想源流与学科基础

领域/方向
对 CSS 的贡献与关联
关键概念/方法列举

经典量化社会科学

提供研究设计基础、测量理论、统计推断框架、回归分析等核心方法论;构成 CSS 拓展和应对新挑战的起点。

Survey Methodology, Experimental Design, Inferential Statistics, Regression Analysis, Econometrics, Measurement Theory

数学社会学与形式理论

强调理论的形式化表达、逻辑推演和数学建模;培养形式化思维和模型化取向。

Mathematical Sociology, Formal Theory, Rational Choice Models, Game Theory

社会网络分析 (SNA)

开创对社会关系结构进行定量化、可视化分析;奠定现代网络科学在社会领域应用的基础。

Sociometry, Network Concepts (Centrality, Cliques, Structural Holes, Weak Ties)

定量地理学/GIScience

发展处理和分析空间数据的方法与技术;关注空间依赖性、异质性和互动;提供 GIS 工具。

GIS, Spatial Statistics, Geovisualization, Spatial Interaction Models, Tobler's First Law of Geography

早期计算模拟/计算经济学

探索使用计算机模拟研究经济社会过程;孕育基于计算的建模思想和微观模拟方法。

Microsimulation, Early Macroeconomic Models, Computational Economics, Agent-Based Computational Economics (ACE)

复杂性科学

提供理解复杂适应系统(涌现、自组织、反馈)的理论框架;推广基于主体的建模(ABM)等核心方法论。

Complexity Theory, Agent-Based Modeling (ABM), Emergence, Self-Organization, Chaos Theory, Networks

网络科学 (现代)

融合多学科视角,发展分析大规模复杂网络结构、功能、演化的强大理论与计算工具。

Network Science, Small-World Networks, Scale-Free Networks, Community Detection, Network Dynamics, Link Prediction

数据科学/机器学习/AI/NLP

提供处理大规模、高维、异构(含文本)数据,进行模式识别、预测建模、自然语言理解的先进算法、工具、工程实践和思维方式。

Machine Learning (Supervised, Unsupervised, Deep Learning), NLP , Data Mining, Statistical Learning, Data Science Workflow, AI for Social Science

这些来自不同学科的智识源流,如同众多支流,在数字时代提供的海量数据和强大算力这一历史性机遇的催化下,开始加速汇聚、交叉、碰撞、融合,最终共同塑造了计算社会科学这一新兴研究领域的理论基础、方法论工具箱和核心议题。特别是复杂性科学、网络科学和数据科学/人工智能这三大领域的蓬勃发展,极大地促进了不同学科背景的研究者之间的对话、合作与方法共享,使得运用计算思维和工具来系统性地研究人类行为和社会系统成为可能,并逐渐形成了一个具有共同身份认同的研究共同体。

计算社会科学的界定:以四大核心研究任务为导向的范式整合

尽管存在着长期的智识积累和跨学科融合的趋势,计算社会科学 (Computational Social Science, CSS) 作为一个具有明确学科身份、独特研究议程和广泛学术影响力的研究领域得以正式确立并迅速兴起,其公认的里程碑事件是 2009 年,由 David Lazer 领衔的一组跨学科研究者在《科学》(Science)杂志上发表的开创性论文《计算社会科学》(Computational Social Science) (Lazer et al., 2009)。 这篇文章的影响力不仅在于它为这个新兴领域提供了一个简洁响亮的名字,更重要的是,它系统性地论证了利用因数字技术(尤其是互联网和移动通信)而产生的海量人类行为数据(他们称之为“关于我们是谁、我们做什么以及我们为何如此行事的惊人细节的数字面包屑”),结合先进的计算方法(如网络分析、机器学习、自然语言处理、模拟),来研究个体行为、社会互动和社会组织的巨大潜力与时代必要性。这篇文章如同一声号角,迅速在全球范围内激发了关于 CSS 的研究热潮、学术会议、项目资助、课程设立和范式讨论,有力地推动了该领域的建制化进程。 在此之后,领域内的学者们(如 Conte et al., 2012; Cioffi-Revilla, 2017; Watts, 2014; Pentland, 2014; Salganik, 2019; Edelmann et al., 2020; 等)不断从不同角度深化、拓展和反思对 CSS 的理解。例如,Conte 等人 (2012) 发表的《计算社会科学宣言》(Manifesto of Computational Social Science),进一步明确了该领域的议程,特别强调了超越数据挖掘和模式发现,致力于通过构建生成性计算模型 (generative computational models)(尤其是 ABM)来理解社会现象背后的机制,实现对社会过程的“生成性解释”。 Cioffi-Revilla (2017) 在其著作《计算社会科学导论》(Introduction to Computational Social Science) 中,系统地梳理了 CSS 的历史渊源、核心概念(如计算、信息、网络、复杂性、模拟)、方法论(数据驱动、模型驱动)以及应用领域,试图勾勒出一个相对完整的学科版图。Matthew Salganik (2019) 在其广受欢迎的著作《比特与原子:数字时代的社会研究》(Bit by Bit: Social Research in the Digital Age) 中,虽然未使用“计算社会科学”作为核心标签,但其对利用数字痕迹数据(他称之为“发现的数据” found data,区别于“设计的数据” designed data)、进行在线实验、开展大规模合作等新型研究方式的系统阐述和深刻反思,实际上构成了对 CSS 核心实践的重要贡献和指南。Duncan Watts (2016) 则强调,CSS 的真正价值在于它能够帮助社会科学解决那些因规模、复杂性或数据限制而长期未能解决的“大问题”,并提出需要发展一种“计算社会科学的常识”,即理解何时以及如何有效地运用计算工具来增强社会科学洞察。 国内学者也对 CSS 的定义和范围进行了探讨。黄萃(2020)通过文献计量对比了国内外“社会计算”与“计算社会科学”的概念与研究热点,指出两者既有联系也有区别,需厘清范围。俞立平(2023)和吕鹏(2024)则尝试构建 CSS 的学科框架和体系,将其视为融合社会科学各分支(如计算社会学、计算政治学、计算经济学、计算传播学、计算法学、计算管理学、计算历史学、计算心理学、计算语言学等)与计算/数据科学方法的交叉领域集合。综合这些发展和论述,并结合第一部分对数字时代社会科学研究面临的挑战和任务拓展需求的分析,我们可以将计算社会科学 (Computational Social Science, CSS) 定义为:一个致力于深度整合社会科学(包括社会学、政治学、经济学、心理学、传播学、人类学、地理学、法学、历史学、管理学等)的理论洞察、研究问题与方法论传统,与计算机科学、数据科学、统计学、网络科学、复杂性科学、人工智能等领域的先进计算思维、算法工具和数据处理能力的跨学科研究领域。 它利用日益强大的计算能力和爆炸式增长的大规模、多来源、高维度、动态变化的数据,旨在系统性地、以前所未有的规模和精度,执行并拓展社会科学研究的四大核心任务:(1) 对日益复杂的社会现象进行更深入、更精细、更动态的描述;(2) 对社会结果和人类行为进行更准确、更及时、更具个性化的预测;(3) 在大规模观测数据和复杂系统中进行更稳健、更具机制性、更能处理异质性的因果推断;(4) 通过构建和分析计算模型(尤其是基于主体的模型)来模拟社会过程、探索微观机制如何生成宏观涌现模式,并深化对社会系统动态的生成性理解。 CSS 的最终目标是,通过这种整合与创新,突破传统方法的局限,在数据驱动(第四范式)和智能驱动(第五范式)下,深化我们对社会运行基本规律的认识,增强我们理解、预测和应对现实世界中重大社会挑战(如不平等、冲突、极化、传染病、气候变化、技术伦理、社会治理复杂性等)的能力,并为制定更有效、更公平的公共政策和社会干预提供基于证据的洞见和解决方案。 这一定义具有以下几个关键特征:

  • 强调跨学科整合 (Interdisciplinary Integration): CSS 不是计算机科学在社会领域的简单应用,也不是社会科学对新工具的被动接受,而是两者的深度融合与相互塑造。它需要研究者同时具备社会科学的理论素养、问题意识和批判性思维,以及计算科学的技术能力、算法理解和工程实践。

  • 以数据和计算为核心驱动力 (Data and Computation as Core Drivers): 海量、新型的数据资源和强大的计算能力是 CSS 得以兴起的物质基础和核心引擎。CSS 研究通常是数据密集型(Data-intensive)和计算密集型(Computation-intensive)的,处在第四范式向第五范式过渡的阶段。

  • 聚焦四大核心研究任务 (Focus on Four Core Research Tasks): 该定义明确地将描述 (Description)、预测 (Prediction)、因果推断/解释 (Causal Inference/Explanation)、模拟/生成性理解 (Simulation/Generative Understanding) 这四大任务置于计算社会科学的核心地位。CSS 的独特性和价值,很大程度上就体现在它如何利用新的数据和计算工具,极大地拓展和深化了社会科学执行这四大基本研究功能的能力。这四大任务构成本书后续章节展开的核心框架,也是吕鹏(2024)总结的 CSS 学科使命的重要体现。

  • 问题驱动与解决方案导向 (Problem-driven and Solution-oriented): CSS 的发展不仅是为了智识上的好奇,也常常与解决现实社会问题紧密相连(Watts, 2017)。它致力于将社会科学的洞察力应用于理解和应对紧迫的社会挑战,服务于社会治理现代化。

  • 方法论的多元性与创新性 (Methodological Pluralism and Innovation): CSS 并非单一方法论的代名词,而是包含了一系列利用计算手段进行社会研究的方法集合,并且鼓励在方法论层面的持续创新与交叉融合。它既包括对传统方法的计算化改造(如大规模问卷分析、计算文本分析),也包括引入全新的方法(如网络科学、机器学习、ABM、在线实验)。

  • 内含伦理与社会反思 (Embedded Ethics and Social Reflection): 随着 CSS 能力的增强,其潜在的社会影响和伦理风险也日益凸显。对数据隐私、算法偏见、数据垄断、研究伦理、技术滥用等问题的关注和反思,以及数据治理体系的建设,是 CSS 健康发展不可或缺的内在组成部分。可以说,计算社会科学的诞生,标志着社会科学研究范式的一次重要演进,是从主要依赖“小数据”、传统统计和简化模型的范式,向一个能够拥抱“大数据”、运用先进计算和模拟复杂性的新范式的转型。 这一转型仍在进行中,且新旧范式并非完全取代关系,而是共存、互补与融合,形成了理论、数据、模型之间的“三角对话”。理解 CSS 的核心理念、智识根源和基本界定,是进入这个快速发展的领域的第一步。接下来的部分,我们将聚焦于支撑这一定义的四大核心研究任务,详细阐述它们在 CSS 框架下如何被重新定义、拓展和实现。


最后更新于

这有帮助吗?