第一节——问题思维: 计算社会科学探究的源起与罗盘
科学研究始于问题 (Popper, 2002)。无论是自然科学还是社会科学,探究的动力往往源自对未知的好奇、对现有解释的不满、或对特定现象的困惑。问题不仅是研究的起点,更是指引研究方向、界定研究范围、确立研究目标的关键罗盘。缺乏清晰、有意义的问题意识,研究活动便容易迷失方向,沦为数据的堆砌或技术的炫耀 (Mills, 1959)。
在计算社会科学这一新兴交叉领域,培养深刻、敏锐且符合学科规范的“问题思维”尤为重要。这不仅要求研究者掌握社会科学的理论传统与核心议题,理解社会现象的复杂性与脉络性,还需要洞悉计算工具的潜力与局限,并能在二者之间建立有机的联系。
本节将从认识论的深度,系统考察社会科学问题的本体论与认识论预设,探讨问题的界定、分类与评价标准,分析理论与问题之间复杂而动态的互构关系,并着重阐述计算范式的引入如何深刻地重塑了我们对社会科学问题的认知、表述和探究方式,最终勾勒出在计算社会科学中发现和形成有价值研究问题的多元认识论路径。
社会科学问题的本体论与认识论基础
社会科学研究问题的提出,并非凭空而来,其背后必然蕴含着研究者关于社会实在(本体论)以及如何获得关于社会实在的知识(认识论)的基本假定 (Guba & Lincoln, 1994; Blaikie, 2007)。这些深层的哲学预设,深刻地影响着研究者“看到”什么样的问题、如何界定问题、以及认为哪些问题是“值得”研究的。
首先,本体论 (Ontology) 关乎“存在”的本质,即社会世界的构成要素及其性质。不同的本体论立场对“社会问题”的来源和性质有着截然不同的理解。实在论 (Realism),特别是科学实在论或结构实在论,倾向于认为社会世界存在着独立于我们意识之外的客观结构、机制和规律 (Bhaskar, 1979; Archer, 1995)。在此视角下,社会问题往往被视为这些客观结构失衡、机制失效或规律作用下产生的不良后果。研究者的任务是去“发现”(discover) 这些潜在的、真实的结构与机制,揭示问题的客观根源。例如,社会不平等问题可能被视为源于某种客观存在的阶级结构或制度安排。问题的客观性是其研究价值的基础。
与此相对,建构论 (Constructivism) 或社会建构论 (Social Constructivism) 则强调社会实在的主观性和互动建构性 (Berger & Luckmann, 1966; Gergen, 1985)。它认为我们所理解的“社会现实”,包括各种社会问题,并非纯粹客观的存在,而是在特定的历史、文化、社会互动和话语实践中被共同“建构”(construct) 出来的。在此视角下,关注点从“发现”问题转向了理解“问题化”(problematization) 的过程 (Foucault, 1988)——即某个社会现象是如何被定义为“问题”、被赋予特定含义、并引发社会关注和干预的?问题的界定本身就反映了权力关系、价值观念和社会规范。例如,贫困问题不仅是客观的物质匮乏,更是社会如何定义、衡量和应对贫困的过程。问题的意义和重要性是相对的、情境化的。
介于两者之间或试图超越二元对立的立场,如批判实在论 (Critical Realism) (Bhaskar, 1979, 1989),承认存在着独立于我们感知的深层社会结构和生成机制(本体论上的实在论),但同时强调我们对这些结构和机制的认识是理论负载的、易错的、并通过社会实践和话语间接获得的(认识论上的建构性或诠释性)。在此视角下,社会问题是深层结构和机制作用于经验层面的表现或后果。研究的目标是揭示这些不可直接观察的生成机制,并通过批判性反思推动社会结构的变革。它既承认问题的客观根源(源于潜在结构),也关注问题的社会呈现和认知建构。
其次,认识论 (Epistemology) 探讨知识的来源、性质、范围和确证方式。不同的认识论立场直接影响着研究者如何界定“有效”的知识主张,以及什么样的研究问题被认为是可以通过科学探究来回答的。实证主义 (Positivism) 及其现代变体后实证主义 (Post-positivism) (Comte, 1853; Popper, 1959; Phillips & Burbules, 2000),强调知识应建立在可观察的经验证据之上,追求客观性、普遍性和可证伪性。它倾向于提出可以转化为清晰变量关系、能够进行量化测量和统计检验的问题,旨在发现社会现象的模式、规律和因果联系。知识的确证依赖于逻辑演绎和经验数据的系统验证(或证伪)。模糊的、价值负载的或无法操作化的问题在此范式下可能被视为“非科学”的。
解释主义 (Interpretivism) 或诠释学 (Hermeneutics) (Weber, 1949; Geertz, 1973; Taylor, 1985),则认为社会科学研究的核心在于理解人类行动的主观意义、意图、信念和文化背景。社会现实是充满意义的世界,知识的获得依赖于研究者深入情境、“设身处地”地理解和阐释行动者的视角。因此,解释主义倾向于提出关于意义建构、文化象征、互动过程、社会规范解读等问题。知识的确证标准不是普适规律的发现,而是阐释的深度、融贯性 (coherence) 和说服力 (persuasiveness)。强调对特定情境的“深描”(thick description) 而非普遍性概括。
批判理论 (Critical Theory) (Horkheimer & Adorno, 1947; Habermas, 1984; Fay, 1987),不仅关心“是什么”和“为什么”,更关心“应该怎样”。它将知识与权力、利益和解放联系起来,旨在揭示社会中隐藏的支配结构、意识形态和不平等,并促进社会的批判性反思和变革。批判理论倾向于提出关于权力运作、意识形态批判、社会压迫机制、解放路径等问题。知识的有效性不仅在于其经验符合度或解释力,更在于其批判性和解放潜力。价值判断在此范式中不仅是不可避免的,而且是研究的内在驱动力。
表 1:不同认识论立场对研究问题的侧重
实证主义/后实证主义
追求客观性、普遍性、可证伪性,知识基于经验观察与逻辑推理。
可操作化测量、变量关系、模式发现、因果解释、预测。问题需清晰、经验可检验。
经验验证/证伪、统计推断、逻辑一致性。
解释主义/诠释学
关注主观意义、理解行动者视角、文化脉络。社会现实是意义建构的。
意义阐释、文化理解、互动过程分析、情境化描述。问题围绕“理解”而非“解释/预测”。
阐释的深度、融贯性、主体间验证、内部一致性。
批判理论
知识与权力、解放相关,旨在揭示不平等、批判意识形态、促进变革。
权力分析、意识形态批判、结构性压迫机制、解放策略。问题具有明确的价值导向和实践意图。
批判性反思、解放潜力、历史语境分析、实践检验。
最后,问题的提出也涉及 “给定性”与“选择性” 的张力。一方面,研究问题可能看似是由学科内部的逻辑发展、理论空白或关键辩论“给定”的 (Lakatos, 1970)。另一方面,问题的选择也深受研究者所处的社会历史脉络、文化背景、资助机构的议程、学术界的规范以及研究者个人的兴趣、价值观和生命体验的影响 (Bourdieu, 1975; Harding, 1991)。例如,特定社会问题的凸显(如气候变化、数字鸿沟)会引导研究资源的投入和学者的关注。认识到问题选择背后的这种复杂互动,有助于研究者进行自我反思,审视自身研究问题的潜在偏见和预设。
作为基础地,深刻理解研究问题背后的本体论与认识论基础,是进行严谨社会科学研究,尤其是跨学科的计算社会科学研究的必要前提。任何研究问题都不是纯粹技术性的,都携带着关于世界本质和我们如何认识世界的深刻哲学烙印。在计算社会科学中,这一点尤为重要,因为强大的计算工具可能诱使我们忽视这些基础性问题,陷入技术决定论或无批判的实证主义倾向 (Boyd & Crawford, 2012)。
研究问题的界定、分类学与评价准则
在明确了研究问题深层的哲学意涵之后,我们需要进一步探讨如何在实践中界定、分类和评价一个具体的社会科学研究问题。这不仅关乎研究设计的清晰性,更关乎研究工作的价值和贡献。
首先,界定科学研究问题是将其与日常生活的困惑、政策制定的议题或工程技术的挑战区分开来的关键一步。虽然它们之间可能存在联系与转化,但科学研究问题的核心指向是对知识本身的贡献——增进我们对社会现象的理解、解释或预测能力 (Booth, Colomb, & Williams, 2008)。一个合格的科学研究问题通常具备以下特征:它关乎某种普遍性的疑问,而不仅仅是个人或局部的疑虑;它能够(至少在原则上)通过系统的经验研究来探寻答案,而非仅仅依赖信仰、权威或纯粹思辨;它与现有的知识体系(理论、概念、先前研究)发生联系,旨在填补空白、解决矛盾或拓展认知;并且,它被表述得足够清晰、精确,能够引导后续的研究设计与操作 (Kerlinger & Lee, 2000)。例如,“如何解决失业问题?”更像一个政策议题,而“特定类型的劳动力市场政策对青年失业率的影响机制是什么?”则更接近一个可研究的科学问题。
为了更好地把握问题的性质和研究的目标,对研究问题进行分类是有益的。尽管存在多种分类方式,一个基础且常用的分类方式是基于研究的主要认知目标 (Kumar, 2018; Babbie, 2015):
描述性问题 (Descriptive Problems):旨在回答“是什么?”这类问题,致力于系统地描绘一个社会现象的特征、形态、结构、分布、频率或发展趋势。例如,特定人群的社交媒体使用模式是怎样的?某个社会运动的参与者构成是怎样的?描述性研究是许多更深入研究的基础,它提供现象的基本图景。
解释性/因果性问题 (Explanatory/Causal Problems):旨在回答“为什么?”或“如何起作用?”这类问题,试图识别导致现象发生的原因、影响因素、作用机制或后果。例如,社会经济地位如何影响个体的政治参与?在线社交网络的结构特征如何影响信息传播的速度和广度?这是社会科学研究中最核心也最具挑战性的问题类型之一,因为它涉及到复杂的因果推断 (Morgan & Winship, 2014)。
预测性问题 (Predictive Problems):旨在回答“将会怎样?”这类问题,基于对现有模式和关系的理解,预测未来的状态、趋势或事件发生的可能性。例如,基于历史投票数据和民意调查,预测选举结果;基于用户行为数据,预测其未来的购买行为或流失风险。预测本身不一定等同于解释,高预测精度也可能来自对机制尚不完全理解的“黑箱”模型 (Shmueli, 2010)。
探索性问题 (Exploratory Problems):通常在研究者对某个现象所知甚少、缺乏成熟理论指导的情况下提出,旨在“摸着石头过河”,发现新的模式、关联、变量,形成初步的理解或假设,为后续更深入、更聚焦的研究(描述性、解释性)奠定基础。例如,在一个新兴的在线社区中,用户互动呈现出哪些主要模式?
比较性问题 (Comparative Problems):旨在通过比较不同群体、社会、文化、制度或时间点的异同,来揭示现象的普遍性与特殊性,或者探究差异产生的原因。例如,不同国家的数字不平等程度及其影响因素有何异同?
评估性问题 (Evaluative Problems):旨在评估某项政策、计划或干预的效果和价值,常与因果推断紧密相关。
方法论问题 (Methodological Problems): 旨在评估或改进研究方法本身,虽服务于实质问题研究,但本身也可构成研究焦点。
表 2:研究问题的基本类型学
描述性 (Descriptive)
是什么?
刻画现象特征、结构、分布、趋势。
模式、构成、频率、发展阶段。
解释性/因果性 (Explanatory/Causal)
为什么?如何?
识别原因、机制、影响因素、后果。
变量关系、因果路径、作用过程。
预测性 (Predictive)
将会怎样?
预测未来状态、事件、趋势。
模型预测准确性、风险评估、趋势预测。
探索性 (Exploratory)
有哪些?
发现新模式、关联、变量,形成初步假设。
未知领域探索、初步概念化、假设生成。
比较性 (Comparative)
异同如何?
比较不同单元(群体/社会/时间)的差异及其原因。
普遍性与特殊性、跨情境差异、制度/文化影响。
评估性 (Evaluative)
有何价值?
评估某项政策、计划或干预的效果和价值。
效果、效应、差异、价值。
方法论 (Methodological)
如何研究?
评估或改进研究方法本身。
同时并非所有提出的问题都具有同等的研究价值。评价一个研究问题是否“好”,需要一套评价准则。虽然不同学科和认识论范式可能有所侧重,但一些核心准则被广泛认可 (King, Keohane, & Verba, 1994; Creswell & Creswell, 2017):
重要性 (Significance/Importance):问题是否足够重要?这包含两个层面:
智识重要性 (Intellectual Significance),即问题是否触及了学科的核心理论争论、挑战了既有认知、填补了重要的知识空白,其解答能否对学科知识体系产生实质性贡献?
社会重要性 (Societal Significance),即问题是否关涉重要的社会现象、公共议题或人类福祉,其解答是否具有潜在的应用价值、政策启示或社会影响?一个好的问题通常至少在其中一个层面具有显著的重要性。
原创性/新颖性 (Originality/Novelty):问题是否提供了新的视角?是否探索了未被充分研究的领域?是否以创新的方式联系了已知的概念或现象?是否采用了新的方法来审视旧问题?研究旨在创造新知识,避免对已知结论进行不必要的重复。原创性并非要求绝对“前无古人”,也可以体现在对已有研究的深化、拓展或批判性整合上。
可研究性/可行性 (Researchability/Feasibility):问题是否能够在现实条件下被研究?这包括:
概念清晰性,问题中的核心概念能否被清晰界定和操作化?
经验可及性,是否存在或可能获得研究所需的数据或经验证据?
方法可行性,是否存在合适的研究方法和技术来分析数据并回答问题?
资源可行性,研究者是否拥有或能够获得完成研究所需的时间、资金、技能和伦理许可?一个再重要、再原创的问题,如果完全无法研究,也难以构成一个有效的科研项目起点。
明确性/具体性 (Clarity/Specificity):问题是否被清晰、准确地表述出来?研究的范围、对象、核心变量或概念是否足够明确?过于宽泛、模糊或抽象的问题难以引导具体的研究设计和操作。好的问题通常是聚焦的,能够被分解为更具体、可操作的子问题。
这些评价准则之间可能存在张力。例如,极具原创性和重要性的问题可能研究难度极大,可行性较低;而高度可行的问题可能缺乏足够的原创性或重要性。研究者需要在这些准则之间进行权衡,结合自身的研究目标、能力和资源,选择或塑造出兼具价值与可行性的研究问题。在计算社会科学领域,评估“可研究性”时还需要特别考虑数据的可获得性、计算资源的需求以及相关算法或模型的适用性。
理论与问题的内在纠缠:互构与驱动机制
社会科学研究中,理论与问题之间存在着深刻而复杂的内在联系,远非简单的线性关系,而是一种动态的、相互塑造的纠缠状态 (Merton, 1967; Swedberg, 2014)。理解这种互构关系,对于把握问题的来源、深化问题的意义、以及推动理论发展都至关重要。
一方面,理论是研究问题的“母体”和源泉 (Theory as the Matrix of Problems)。理论,作为一套关于世界如何运作的系统化解释框架(包含概念、命题、假设和模型),为我们识别、界定和理解问题提供了基础。具体而言,理论可以通过多种方式催生研究问题:
揭示理论的解释边界 (Identifying Theoretical Boundaries):当现有理论无法解释某些新出现的或反常的经验现象 (anomalies) 时,这些“理论失效”之处就构成了重要的研究问题。这些问题旨在挑战、修正或补充现有理论,是推动理论进步的关键动力 (Kuhn, 1962)。例如,经典理性选择理论无法解释的利他行为或集体行动参与,就催生了对社会规范、身份认同、网络效应等新理论视角的研究需求。
解决理论的内在张力 (Resolving Internal Theoretical Tensions):理论体系内部可能存在逻辑上的不一致、概念模糊或不同假设之间的冲突。澄清这些内部张力、寻求更融贯的理论表述,本身就可以构成重要的研究问题。例如,社会学中关于结构与能动性 (structure vs. agency) 关系的持续辩论,就不断激发着试图整合或超越这一二元对立的新理论探索和相关经验研究。
检验理论的衍生预测 (Testing Theoretical Predictions):理论通常会产生一系列关于经验世界的可检验的预测或假设。将这些预测转化为具体的研究问题,并通过经验数据进行验证或证伪,是理论发展的重要环节 (Popper, 1959)。例如,社会资本理论预测更高的网络中心性可能带来更多的资源获取,这就引出了“个体在社交网络中的中心性与其职业成就之间是否存在正相关关系?”这样的研究问题。
拓展理论的应用范围 (Extending Theoretical Scope):将一个在特定领域被验证有效的理论框架,尝试应用于新的社会情境、人群或现象,探讨其适用性和边界条件,也是产生研究问题的常见途径。例如,将源于西方背景的现代化理论应用于非西方社会的研究,考察其解释力及需要进行的修正。
深化理论的核心概念 (Deepening Core Theoretical Concepts):对理论中的核心概念进行更深入的挖掘、辨析、操作化和测量,本身就可以形成研究问题。例如,对“社会资本”、“文化”、“权力”等复杂概念进行不同维度、不同测量方式的研究。
另一方面,问题也是理论发展的“引擎”和催化剂 (Problems as the Engine of Theoretical Development)。社会科学理论并非封闭的逻辑体系,其活力在于与经验世界的持续对话,而这种对话往往由具体的研究问题所驱动:
新现象呼唤新理论 (New Phenomena Demanding New Theories):社会现实的不断变迁会涌现出许多现有理论难以涵盖或解释的新现象。对这些新现象的深入探究,往往能够激发新的概念化努力和理论框架的构建。例如,互联网和社交媒体的普及,催生了关于网络社会、虚拟社区、数字劳动、算法规制等一系列新的研究问题和相应的理论思考 (Castells, 2000; Van Dijk, 2012)。
问题驱动理论整合 (Problem-Driven Theoretical Integration):为了解决某个复杂的、多层面的社会问题,研究者可能需要整合来自不同理论流派的洞见,从而促进理论的交叉、融合与创新。例如,理解健康不平等问题,可能需要整合社会分层理论、社会网络理论、文化社会学、行为经济学等多方面的视角。
经验发现修正理论 (Empirical Findings Refining Theory):旨在回答特定问题的经验研究,其结果可能支持、否定或要求修正现有理论的某些假设或命题。这种基于经验证据的反馈是理论实现自我完善和进步的重要机制。
聚焦“中层理论” (Focusing on Middle-Range Theories):许多富有成效的研究问题并非直接源自宏大理论 (grand theories),而是与特定经验领域或现象相关的“中层理论” (Merton, 1967) 发生联系。这些中层理论旨在解释有限范围内的社会现象,更容易转化为可操作的研究问题,其研究结果也更容易反馈并充实理论体系。例如,关于犯罪率的“破窗理论”、关于组织创新的理论等。
此外,理论并非总是在问题提出之前就已完整存在。在研究过程中,理论与问题之间常常呈现出一种循环与迭代 (Circularity and Iteration) 的关系。初步的问题意识可能引导研究者去寻找相关的理论资源,而理论的学习又会反过来帮助研究者澄清、聚焦或重塑最初的问题。在研究执行过程中,数据的分析结果可能与预期不符,迫使研究者重新审视理论假设或调整研究问题。这种在理论思考、问题界定和经验探索之间的持续往复,是社会科学研究,尤其是探索性研究的常态 (Alvesson & Sandberg, 2011)。理论不是僵化的教条,问题也不是一成不变的起点,二者在研究实践中相互激发、共同演进。
深刻的“问题思维”必然要求研究者具备扎实的理论素养。只有熟悉相关的理论图景、掌握核心的概念工具、了解主要的理论争论,研究者才能提出具有深度和意义的研究问题,才能将自己的研究定位于更广阔的知识脉络之中,也才能最终为理论的发展做出贡献。忽视理论根基的问题意识,容易导致研究的碎片化、表面化和重复性。
计算范式对问题思维的认识论重塑
计算社会科学的兴起,不仅仅是引入了一套新的研究工具和数据来源,更在深层次上重塑了社会科学研究的认识论景观,特别是对于我们如何构思、表述和探究研究问题产生了根本性的影响 (Lazer et al., 2009; Conte et al., 2012; Salganik, 2018)。这种重塑体现在多个维度,带来了新的可能性,也伴随着新的挑战。
无可置疑地,计算强化了问题的形式化潜能 (Enhanced Potential for Formalization)。传统社会科学理论,特别是宏大理论或解释性理论,往往包含丰富但有时也模糊的概念和复杂的因果叙事。计算方法,无论是基于数学模型的分析、计算机模拟,还是机器学习算法,都要求对研究对象进行精确、无歧义的定义和表述。将社会科学概念(如信任、影响力、社会规范、文化距离)转化为可计算的变量、数据结构(如网络、序列、向量空间)或模型参数(如状态、规则、转移概率),这个过程本身就迫使研究者进行更严格、更清晰的概念化工作 (Nowak & Vallacher, 1998; Cioffi-Revilla, 2017)。
这种形式化的压力,一方面可能过滤掉一些难以精确化的重要但模糊的社会维度,但另一方面,它也使得问题的表述更加严谨,逻辑关系更加清晰,从而增强了问题的可检验性和研究的可重复性。例如,关于社会影响的问题,可以被形式化为网络节点状态传播的动力学模型问题。形式化不仅是一种技术操作,更是一种认识论上的选择,它塑造了我们认为哪些问题是“可处理”的。
其次,计算极大地拓展了可观察性的边界 (Expanding the Boundaries of Observability)。传统社会科学研究依赖的调查、访谈、实验或档案数据,在规模、粒度、时间跨度和覆盖范围上往往受到限制。数字技术的发展,产生了海量的、被动收集的、细粒度的关于人类行为和互动的“数字足迹”(digital traces),如社交媒体记录、网络浏览历史、移动定位数据、在线交易信息等 (Lazer et al., 2009)。这些新型数据使得研究者能够观察到前所未有的社会现象:大规模人群的实时互动、个体层面细微行为的长期追踪、复杂网络结构的动态演化、跨越地理边界的信息流动等。
这种观察能力的革命性提升,直接催生了全新的研究问题领域,例如:在线社会运动的动员机制与线下有何不同?个体情绪如何在大型社交网络中传播?算法推荐系统如何塑造用户的认知与行为?城市内部的社会隔离模式如何在细粒度时空尺度上展现?可以说,计算范式通过改变“可见性”,重新定义了社会科学可以探索的问题空间。
第三,计算赋能了对社会复杂性的直接探究 (Enabling Direct Inquiry into Social Complexity)。社会系统本质上是复杂的自适应系统 (complex adaptive systems),充满了非线性互动、反馈循环、层级结构、涌现现象和路径依赖 。传统的研究方法(如基于线性模型的统计分析)在处理这种高度复杂性时常常力不从心,往往需要做出强烈的简化假设。计算工具,特别是基于主体的建模 (Agent-Based Modeling, ABM) 和复杂网络分析 (Complex Network Analysis),为直接模拟和分析这种复杂性提供了强大的武器 (Gilbert & Troitzsch, 2005; Newman, 2010)。
ABM 允许研究者设定微观个体(主体/代理人)的行为规则和互动模式,然后通过计算机模拟观察宏观层面的系统行为如何“涌现”出来。网络分析则提供了刻画和理解大规模社会结构、互动模式及其动力学后果的数学和计算框架。这些工具使得研究者能够提出并尝试回答关于系统整体行为、临界转变(tipping points)、结构韧性、干预措施的非预期后果等复杂性问题,这些问题在以往往往被视为难以处理或只能进行定性描述。
第四,计算促进了生成性理解与反事实思考 (Facilitating Generative Understanding and Counterfactual Thinking)。传统社会科学研究往往侧重于分析已有的数据,以解释“发生了什么”以及“为什么发生”。计算模型,特别是生成性模型(如 ABM),开辟了一种新的认识路径——“通过构建来理解”(understanding by building) 。研究者如果能够构建一个计算模型,使其能够生成(或“生长”出)与真实世界观察到的宏观模式(如财富分布、观点极化、城市形态)相类似的现象,那么他们就可能对产生这些现象的底层微观机制获得了更深的理解。
这种生成性的方法不仅服务于解释,还极大地便利了反事实思考 (counterfactual thinking)。研究者可以在模型中系统地改变某些参数、规则或初始条件(模拟政策干预、环境变化或历史偶然事件),观察其对系统演化结果的影响。这使得提出和探索“如果……(没有发生),会怎样?”(what if...?) 这类反事实问题成为可能,这对于理解因果机制和评估干预效果具有重要意义 (Pearl, 2009)。
此外,计算本身也成为了新的问题来源 (Computation Itself Becoming a Source of New Problems)。随着算法和数字平台日益深度地嵌入社会生活的方方面面,它们本身的行为、偏见及其社会后果,也成为了社会科学研究的重要议题。例如:搜索引擎或社交媒体推荐算法是否存在偏见,加剧了信息茧房或社会歧视 (Noble, 2018; O'Neil, 2016)?自动化决策系统(如招聘、信贷审批)的公平性如何衡量和保障?大规模数据收集和分析引发的隐私伦理问题如何应对?这些由计算技术自身引发的社会问题,构成了计算社会科学一个独特且日益重要的研究领域,需要社会科学家、计算机科学家、伦理学家和法学家的共同关注。计算范式带来的这些可能性也伴随着认识论上的风险。过度依赖数据驱动可能导致理论的空洞化;形式化的追求可能牺牲对复杂社会情境的深度理解;模型构建中的简化假设可能被忽视;算法的不透明性可能阻碍对其社会影响的真正理解。因此,拥抱计算范式带来的机遇,同时对其认识论预设和潜在局限保持批判性反思,是发展健康、负责任的计算社会科学的关键。
计算、理论、问题:一个动态的认识论三角
在计算社会科学的研究实践中,计算、理论与问题并非孤立存在,而是构成了一个相互依存、动态互构的认识论三角。理解这三者之间的复杂互动关系,对于避免研究中的陷阱、提升研究的深度和价值至关重要。它们之间的关系并非简单的线性链条,而是更接近于一个持续对话、相互塑造的网络。

计算为理论的检验、精炼与发展提供了前所未有的平台 (Computation as a Platform for Theory Testing, Refinement, and Development)。一方面,大规模数据的可得性与强大的计算分析能力,使得研究者能够以前所未有的规模和精度来检验 (test) 源自理论的预测和假设。例如,可以通过分析数百万用户的社交媒体数据来检验关于信息扩散或社会影响的理论模型 (Aral & Walker, 2012)。这种大规模经验检验有助于增强理论的经验基础或识别其局限性。另一方面,计算模型,特别是模拟模型(如 ABM),可以作为理论的“虚拟实验室”(virtual laboratory)。研究者可以将理论的核心假设和机制编码为模型规则,然后通过运行模拟来探索这些微观机制在逻辑上会产生什么样的宏观后果 (Gilbert & Conte, 1995)。这有助于检验理论的内在一致性 (internal consistency),探索理论的边界条件 (boundary conditions)(即理论在什么条件下成立),甚至发现理论的未预期后果 (unintended consequences)。例如,Axelrod (1984) 通过简单的计算模型模拟,揭示了即使在自私个体组成的群体中,合作规范也可能通过重复互动和“针锋相对”策略得以涌现和维持,极大地推动了合作理论的发展。
其次,计算也日益成为理论生成与启发的有力工具 (Computation as a Tool for Theory Generation and Inspiration)。传统上,理论的产生更多依赖于思想家的洞察、定性观察或对已有理论的逻辑推演。计算范式为此增添了新的路径。数据驱动的模式发现 (data-driven pattern discovery),即通过机器学习、数据挖掘等技术从大规模数据中识别出先前未知的、有趣的或反常的模式、关联或结构,可以成为提出新理论假设的起点 (Hastie, Tibshirani, & Friedman, 2009)。虽然这些模式本身不等于理论,但它们可以激发研究者去思考“为什么会出现这种模式?”,从而引导新的理论探索(需要警惕虚假关联的风险)。此外,生成性计算模型 (generative computational models) 本身也可以被视为一种形式化的、动态的理论表达。构建一个能够重现目标社会现象的计算模型的过程,本身就是一种理论构建活动,它要求研究者明确阐述机制、互动规则和关键参数。模型的行为和结果,可能揭示出超越初始理论设想的新洞见。
理论对于指导计算方法的应用和结果解读至关重要 (Theory Guiding Computational Application and Interpretation)。缺乏理论指导的计算分析,容易陷入“数据主义”(dataism) 或“方法论拜物教”(methodological fetishism) 的误区,即仅仅因为数据可用或技术新颖就进行分析,而忽视了研究的实质性意义 (Varian, 2014)。社会科学理论为计算研究提供了:1) 研究问题的来源和意义框架:理论帮助我们判断哪些计算发现是重要的、值得进一步探究的;2) 变量选择和模型构建的依据:理论指导我们应该关注哪些变量、它们之间可能存在何种关系、模型的关键假设应该是什么;3) 结果解释的透镜:理论提供了将计算结果(如统计显著性、预测准确率、模拟模式)翻译回有意义的社会科学语言、并将其与现有知识体系联系起来的概念框架。没有理论的导航,计算分析可能只是一堆缺乏解释力的数字或模式。例如,在社交网络分析中,不同的社会理论(如社会资本理论、结构洞理论、社会影响理论)会引导研究者关注不同的网络指标,并对相同的网络结构赋予不同的社会意义。
研究问题的性质深刻地塑造着计算策略的选择 (Problem Definition Shaping Computational Strategy)。如前所述,研究问题具有不同的认知目标(描述、解释、预测、模拟等)。问题的性质直接决定了研究所需的数据类型、合适的计算方法以及评估结果的标准。例如,如果问题是预测性的(如预测用户流失),那么机器学习模型(如逻辑回归、随机森林、神经网络)可能更受青睐,评估标准侧重于预测准确率,对模型的可解释性要求可能相对较低 (Breiman, 2001)。如果问题是解释性/因果性的(如评估某项政策干预的效果),那么研究者可能需要运用因果推断的统计模型(如回归分析、倾向得分匹配、双重差分法)或结构化的因果模型,并需要仔细考虑混淆变量、选择偏差等问题,对模型参数的因果解释力要求很高 (Pearl, 2009; Angrist & Pischke, 2008)。如果问题是探索复杂系统动态的(如理解社会规范的涌现),那么基于主体的建模或网络动力学模型可能是更合适的工具,评估标准可能侧重于模型能否重现关键的宏观模式或动态特征。问题的类型决定了我们应该向计算工具“索取”什么。
这个认识论三角可能存在的潜在失衡与风险。一个常见的风险是 “路灯效应”(streetlight effect),即研究者倾向于研究那些更容易用现有计算工具和数据处理的问题,而不是那些理论上或社会意义上更重要但计算上更困难的问题 (Kaplan, 1998)。计算方法的可行性反过来不成比例地影响了研究问题的选择,导致研究议程的偏斜。另一个风险是理论与计算的脱节,即计算分析完全由数据驱动,缺乏理论根基,导致结果难以解释或融入现有知识体系;或者,理论模型过于抽象,难以与经验数据和计算分析有效对接。
理想的计算社会科学研究,需要在计算能力、理论深度和问题意识这三者之间寻求一种动态的、建设性的平衡。研究者应具备在三者之间灵活穿梭、相互参照的能力,既能运用计算工具解决有意义的理论问题,也能从计算实践中获得理论启发,并始终保持对问题本身的批判性审视。
计算社会科学中问题发现的认识论路径
在计算社会科学这一充满活力的交叉领域,发现和形成有价值的研究问题可以遵循多种不同的认识论路径。这些路径并非相互排斥,在实际研究中常常交织融合,但区分它们有助于我们理解不同研究取向的逻辑起点和侧重点。
理论驱动路径 (Theory-Driven Pathway):这是社会科学研究的经典路径,其逻辑起点是现有的社会科学理论。研究者基于对某一理论(或多个竞争理论)的深入理解,识别出其中的逻辑缺口、经验争议、未解之谜或需要进一步检验的预测,然后思考如何利用计算方法或数据来解决这些理论问题。例如,检验经典社会流动理论在数字时代是否依然适用;利用大规模网络数据验证或修正社会影响理论;通过计算模型模拟来探索特定博弈论模型的均衡解在复杂社会互动中的稳定性。这条路径的认识论基础主要是演绎逻辑(从一般理论推导出具体可检验的假设)和理论证伪/确证的传统 (Popper, 1959; Lakatos, 1965)。它的优势在于能够确保研究与学科核心知识体系的紧密联系,直接贡献于理论积累。挑战在于需要深厚的理论功底,并且可能受限于现有理论的想象力。
经验/数据驱动路径 (Empirical/Data-Driven Pathway):这条路径的起点是数据,特别是新的、大规模的、或特殊类型的数据集(如数字痕迹、信令数据、大规模文本语料库)。研究者通过对数据进行探索性分析 (Exploratory Data Analysis, EDA) (Tukey, 1977),利用可视化、聚类、关联规则挖掘、异常检测等计算技术,识别出数据中显著的、有趣的、反常的或未预期的模式、趋势或结构。然后,围绕这些经验发现来构建研究问题,试图对其进行解释:“为什么我们会观察到这种模式?” 例如,在社交媒体数据中发现某种特定信息呈现出异常的传播模式,进而提出关于其背后机制的研究问题;发现某种在线行为与线下社会经济指标之间存在强相关性,进而探究其原因。这条路径的认识论基础主要是归纳逻辑(从具体观察中总结出一般模式或提出假设)。它的优势在于能够发现传统方法难以察觉的新现象和关联,具有较强的探索性。挑战在于容易产生虚假关联,且发现的模式可能缺乏理论意义或难以解释,需要后续与理论进行审慎对话,避免陷入“无理论的经验主义”。
方法驱动路径 (Method-Driven Pathway):这条路径的起点是一种新的计算方法、算法或分析技术。研究者掌握或开发了一种新的方法后,思考“这种方法能够用来解决社会科学中的哪些问题?”或者“将这种方法应用于社会数据,能够带来哪些新的洞见?” 例如,将自然语言处理中的深度学习模型(如 BERT, GPT)应用于分析大规模文本数据,以研究文化变迁、公众意见动态或社会心态;将计算机视觉技术应用于分析卫星图像或街景图片,以研究城市空间、社会不平等等问题。这条路径的认识论基础可以看作是一种工具理性或方法论创新驱动。它的优势在于能够推动研究范式的革新,开拓新的研究可能性。挑战在于可能导致“锤子找钉子”的倾向,即为了使用新方法而选择问题,而不是根据问题的重要性选择方法,容易脱离实质性的理论关怀,甚至产生“方法崇拜”。需要警惕将方法本身作为研究目的,而非服务于理解社会现象的工具。
现象驱动路径 (Phenomenon-Driven Pathway):这条路径的起点是社会现实中涌现出的新的、重要的、或令人困惑的社会现象,特别是那些与数字技术密切相关的现象。研究者被现象本身所吸引,旨在理解其特征、成因、演变过程或社会影响。例如,对“共享经济”模式的兴起及其对劳动关系的影响进行研究;对特定网络谣言的传播轨迹和公众反应进行分析;研究“取消文化”(cancel culture) 在社交媒体上的表现及其机制。这条路径的认识论基础是问题导向和对现实的回应。它的优势在于能够确保研究的现实相关性和社会意义。挑战在于新兴现象往往缺乏成熟的理论框架和数据支持,研究难度较大,需要较强的探索性和理论构建能力。
价值/规范驱动路径 (Value/Normative-Driven Pathway):这条路径的起点是对某些社会价值(如公平、正义、民主、福祉、隐私、可持续性)的关切。研究者旨在通过经验研究来揭示与这些价值相关的社会问题、评估相关政策或干预措施的效果、或者为实现这些价值提供知识支持。例如,研究算法决策中存在的偏见及其对社会公平的影响;评估数字技术对民主参与的促进或阻碍作用;分析不同信息架构对用户福祉的影响。这条路径的认识论基础涉及实践理性和社会责任感。虽然社会科学研究通常强调价值中立(至少在分析阶段),但问题的选择本身常常蕴含价值判断。批判理论更是将价值关切置于核心。计算社会科学由于其研究对象(如算法、平台)和研究能力(如大规模干预、预测)的特性,使其与价值和规范问题更加密不可分。挑战在于需要在坚持经验研究严谨性的同时,清晰地处理价值立场,区分经验分析与规范判断。
跨学科概念迁移路径 (Interdisciplinary Concept Transfer Pathway):这条路径的起点是借鉴其他学科(如物理学、生物学、生态学、计算机科学、复杂性科学)的概念、模型或理论框架,将其创造性地应用于理解社会现象。例如,将流行病学中的 SIR 模型应用于研究信息或行为的社会传染 (social contagion);将生态学中的概念(如生态位、种间竞争)应用于研究组织或市场的动态;将物理学中的相变理论应用于理解集体行为的突变。这条路径的认识论基础是类比推理和知识整合。它的优势在于能够提供全新的视角和分析工具,促进学科交叉和理论创新。挑战在于需要准确理解源学科的概念,并审慎评估其在社会领域的适用性与局限性,避免不恰当的或表面化的类比。
表 3:计算社会科学问题发现的认识论路径
理论驱动 (Theory)
现有社会科学理论
理论空白/争议/预测
演绎/理论证伪/确证
理论贡献明确,学科关联性强
可能受限于理论视野,需要理论功底
经验/数据驱动 (Data)
数据集(尤其是新的)
数据中的模式/异常/关联
归纳/模式识别
发现新现象/关联,探索性强
可能产生虚假关联,易脱离理论解释
方法驱动 (Method)
新的计算方法/技术
方法的应用潜力
工具理性/方法论创新
开拓新研究范式,推动方法创新
“锤子找钉子”,可能脱离实质问题/理论
现象驱动 (Phenomenon)
新兴/重要社会现象
理解现实/回应需求
问题导向/现实回应
现实相关性强,社会意义直接
可能缺乏理论/数据支持,研究难度大
价值/规范驱动 (Value)
社会价值/伦理关切
促进价值实现/评估影响
实践理性/社会责任
关切重要社会议题,具实践意义
需清晰处理价值立场,区分经验与规范
跨学科迁移 (Transfer)
其他学科概念/模型
类比/知识整合
类比推理/知识整合
提供新视角/工具,促进学科交叉
可能存在不当类比,需谨慎评估适用性
在实际研究中,一个好的研究项目往往是多种路径融合的结果。例如,一个由现象驱动的研究问题,可能需要借鉴跨学科的概念,利用数据驱动的方法发现模式,并最终与现有理论进行对话。关键在于研究者能够自觉地意识到自己问题意识的来源,批判性地评估不同路径的优劣,并在研究过程中保持开放性和灵活性。
在计算社会科学中,“问题思维”绝非仅仅是确定一个研究主题那么简单,它是一个贯穿研究全程的、需要持续反思和打磨的核心环节。它要求研究者不仅要掌握社会科学的理论遗产和现实关怀,熟悉计算工具的能力边界,更要具备深刻的认识论自觉——理解知识如何产生、证据如何解读、理论如何构建、价值如何安放。一个在认识论上成熟的问题意识,是引领计算社会科学研究穿越数据迷雾、避免技术陷阱、最终抵达有意义的知识彼岸的不可或缺的罗盘。接下来的章节将继续探讨构成计算社会科学研究思维范式的另外两个重要支柱:数据思维和模型思维。
参考文献
Alvesson M, Sandberg J, 2011. Generating research questions through problematization[J]. The Academy of Management Review, 36(2): 247-271.
Angrist J D, Pischke J S, 2009. Mostly Harmless Econometrics: An Empiricist’s Companion[M]. 1st edition. Princeton, New Jersey Oxford: Princeton University Press.
Archer M S, 1995. Realist Social Theory: The Morphogenetic Approach[M]. Cambridge: Cambridge University Press.
Audi R, 2015. The Cambridge Dictionary of Philosophy[M]. 3rd edition. New York City: Cambridge University Press.
Axelrod R, 1984. The Evolution of Cooperation[J].
Babbie E, 2015. The Practice of Social Research - Standalone Book[M]. 14th edition. Boston, MA: Cengage Learning.
Berger P L, Luckmann T, 1967. The Social Construction of Reality: A Treatise in the Sociology of Knowledge[M]. New York: Anchor.
Bhaskar R, 1989. Reclaiming Reality: A Critical Introduction to Contemporary Philosophy[M]. New York: Verso.
Bhaskar R, 1998. The Possibility of Naturalism: A Philosophical Critique of the Contemporary Human Sciences[M]. New York: Routledge.
Blaikie D N, 2007. Approaches to Social Enquiry: Advancing Knowledge[M]. 2nd edition. Cambridge: Polity.
Booth W C, Colomb G G, Williams J M, 2008. The Craft of Research, Third Edition[M]. Third edition. Chicago: University of Chicago Press.
Bourdieu P, 1975. The specificity of the scientific field and the social conditions of the progress of reason[J]. Social Science Information, 14(6): 19-47.
Boyd D, Crawford K, 2012. Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon[J]. Information, Communication & Society, 15(5): 662-679.
Cioffi-Revilla C, 2010. Computational social science[J]. WIREs Computational Statistics, 2(3): 259-271.
Cioffi-Revilla C, 2017. Computation and Social Science[M]//Cioffi-Revilla C. Introduction to Computational Social Science: Principles and Applications. Cham: Springer International Publishing: 35-102.
Comte A, 2009. The Positive Philosophy of Auguste Comte: 2 ed[M]. Martineau H, trans. Cambridge: Cambridge University Press.
Conte R, Gilbert N, Bonelli G, et al., 2012. Manifesto of computational social science[J]. The European Physical Journal Special Topics, 214(1): 325-346.
Creswell J W, Creswell J D, 2014. Research Design: Qualitative, Quantitative, and Mixed Methods Approaches[M]. 4th edition. Los Angeles, Calif.: SAGE Publications, Inc.
Editors Marsh D and G S, 2010. Theory and Methods in Political Science: Third Edition[M]. 3rd edition. Basingstoke, Hampshire: Palgrave Macmillan.
Fay B, 1987. Critical Social Science: Liberation and its Limits[M]. Ithaca, N.Y.: Cornell University Press.
Foucault M, 1988. Technologies of the Self: A Seminar with Michel Foucault[M]. First Edition. Amherst: University of Massachusetts Press.
Geertz C, 1973. Interpretation of Cultures[M]. Fifth Pr. edition. New York, NY: Basic Books, Inc.
Gergen K J, 1985. The social constructionist movement in modern psychology[J]. American Psychologist, 40(3): 266-275.
Gilbert N, Klaus T, 2005. Simulation for the Social Scientist[M]. 2 ed.
Guba E G, Lincoln Y S, 1994. Competing paradigms in qualitative research[M]//Handbook of qualitative research. Thousand Oaks, CA, US: Sage Publications, Inc: 105-117.
Habermas J, 1985. The Theory of Communicative Action, Volume 1: Reason and the Rationalization of Society[M]. McCarthy T, 译. Reprint edition. Boston: Beacon Press.
Harding S, 1991. Whose Science? Whose Knowledge? Thinking From Women’s Lives[M]. Cornell University.
Hastie T, Tibshirani R, Friedman J, 2009. Introduction[M]//Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. New York, NY: Springer: 1-8.
Horkheimer M, Adorno T W, 2007. Dialectic of Enlightenment[M]. Jephcott E, trans 1st edition. Stanford, Calif: Stanford University Press.
I. Lakatos, 1970. Criticism and the Growth of Knowledge: Falsification and the Methodology of Scientific Research Programmes[M]//Criticism and the Growth of Knowledge. Cambridge University Press: 91-196.
Italy N G U of S R C N R C of, 1995. Artificial Societies: The Computer Simulation Of Social Life[M]. 1st edition. Milton: Routledge.
Kaplan A, 1998. The Conduct of Inquiry: Methodology for Behavioural Science[M]. London: Routledge.
Kerlinger F N, Lee H B, 1999. Foundations of Behavioral Research[M]. 4th edition. Singapore: Wadsworth Publishing.
King G, Keohane R O, Verba S, 1994. Designing Social Inquiry: Scientific Inference in Qualitative Research[M]. Princeton, N.J: Princeton University Press.
Kuhn T S, 1962. The structure of scientific revolutions[M]. University of Chicago Press: Chicago.
Kumar R, 2014. Research Methodology: A Step-by-Step Guide for Beginners[M]. 4th edition. Los Angeles London New Delhi Singapore Washington DC: SAGE Publications Ltd.
Lazer D, Pentland A, Adamic L, et al., 2009. Computational Social Science[J]. Science, 323(5915): 721-723.
Merton R K, 1967. On Theoretical Sociology: Five Essays, Old and New[M]. 624th ed. edition. New York, NY: Free Press.
Morgan S L, Winship C, 2007. Counterfactuals and Causal Inference: Methods and Principles for Social Research[M]. 1st edition. Cambridge: Cambridge University Press.
Newman M E J, 2010. Social networks: A discussion of social networks and the empirical techniques used to probe their structure[M]//Newman M. Networks: An Introduction. Oxford University Press: 0.
Noble S U, 2018. Algorithms of Oppression: How Search Engines Reinforce Racism[M]. Illustrated edition. New York: NYU Press.
Nowak A, Vallacher R R, 1998. Dynamical social psychology[M]. New York, NY, US: Guilford Press: xvi, 318.
O’Neil C, 2016. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy[M]. 1st edition. New York: Crown.
Pearl J, 2009. Causality: Models, Reasoning and Inference[M]. 2nd edition. Cambridge, U.K. ; New York: Cambridge University Press.
Phillips D C, Burbules N C, 2000. Postpositivism and educational research[M]. Lanham, MD, US: Rowman & Littlefield: ix, 101.
Popper K, 2002. Conjectures and Refutations: The Growth of Scientific Knowledge[M]. 2nd edition. London: Routledge.
Popper K R, 1959. The logic of scientific discovery[M]. Oxford, England: Basic Books: 480.
Salganik M J, 2018. Bit by bit: Social research in the digital age[M]. Princeton, NJ, US: Princeton University Press: xix, 423.
Shmueli G, 2010. To Explain or to Predict?[J]. Statistical Science, 25(3): 289-310.
Swedberg R, 2014. Theorizing in Social Science: The Context of Discovery[M]. Stanford, California: Stanford University Press.
Taylor C, 1985. Human Agency and Language[M]. New York: Cambridge University Press.
Tukey J, 1977. Exploratory Data Analysis[M]. 1st edition. Reading, Mass.: Pearson.
van Dijk H, van Engen M L, van Knippenberg D, 2012. Defying conventional wisdom: A meta-analytical examination of the differences between demographic and job-related diversity relationships with performance[J]. Organizational Behavior and Human Decision Processes, 119(1): 38-53.
Varian H R, 2014. Big Data: New Tricks for Econometrics[J]. Journal of Economic Perspectives, 28(2): 3-28.
Weber M, 1949. The Methodology Of The Social Sciences[M]. Shils E A, Finch H A, trans. Free Press.
最后更新于
这有帮助吗?