當前位置: 華文頭條 > 文化

從數據中浮現「社會實體」——定量社會研究的方法論反思

2023-12-04文化


摘要: 當前定量社會研究的主流範式,容易停留在碎片化的變量內容層面,缺失甚至遮蔽了對於實質性社會過程的洞察與觀照。借鑒塗爾幹的經典研究文獻,可探討與「假設—演繹主義」完全不同的一種研究旨趣和方法路徑:致力於揭示有關「事物本性」的根本原因,而不是對眾多因素的窮盡式列舉;註重在理論邏輯的指引下,對變量之間的交織關系進行深入辨析與整體描畫,逐層去除種種表象因素的遮蔽;伴隨背後的社會實體原因逐步湧現和提煉,單個變量的真正意蘊才得以充分呈現。這種方法論路徑與中國社會的內在特征更為貼合,蘊含了中國定量社會學的創新方向。

關鍵詞: 定量社會研究 方法論 社會實體 變量關系

作者 高勇,中國政法大學社會學院教授(北京100088)。

來源: 【中國社會科學】2022年第10期P44—P59

責任編輯: 李淩靜 王寧


中國社會學定量研究已取得的成就是多方面的。各種高級統計模型和模擬方法透過各種渠道得以迅速推廣,實用性的工具技術不斷叠代更新,技術性的探討進入更為精細的層面。一系列方法論反思深化了我們對於定量研究過程基本邏輯的理解,因果推斷和可復制性等議題得到了廣泛關註。諸多全國性調查專案,如「中國綜合社會調查」「中國社會狀況綜合調查」「中國家庭追蹤調查」等,為研究工作提供了可靠的資料來源,數據收集和共享作為一項基礎工作得到快速推進。借由定量方法而獲得的一系列研究成果,對於理解中國社會的內在特性作出了重要貢獻。

更為重要的是,研究者開始比較深入地討論定量研究範式背後的一些根本假設及其現實適用性。作為當前定量研究主流範式的「假設—演繹主義」(hypothetico-deductivism)路數,在某種程度上源自「實用性方法的理性化過程」。在最原初的層面上,實驗操控研究被作為方法上的黃金規則受到尊崇。在實驗操控研究中,研究物件不是復雜的社會構成,而是某種明確的幹預行動;研究實體與統計變量是同一的;研究的目標指向是高度實用性的。然而,實驗操控研究的基本原則在經過一系列改造之後,成為定量社會研究的基本準則。在實驗操控研究中,變量指涉的就是實體——某種幹涉手段,其意蘊也是單一而確定的,因此我們根本沒有必要對於結構性實體和變量意蘊問題進行深入的思考。但是,除了社會評估專案外,社會學的研究旨趣與這樣的實用性取向並不完全吻合。在這樣的研究範式中,對於結構性實體和變量意蘊問題的追問很容易被懸置。

在對中國社會的定量研究中,這一問題尤其值得反思。因為我們最為關心的社會學問題恰恰是那些普遍施加於個體身上、具有某種恒常性的結構動力,是處於不斷變化和成形當中的觀念意蘊和機制要素。它們與變量之間的關系,遠不是通常的「概念操作化」程式可以把握的。在根本的意義上,社會學對研究方法的討論,就是要找到最能夠充分表達其研究物件的內在特性、與其核心關切最恰如其分的分析方式和表述方式。這種討論不可避免地與對研究物件的特性的理解聯系在一起。對於定量社會學研究來說,同樣必須考慮到它所面對的社會內在特性。

事實上,在經典社會學家那裏,就有一個以數據分析方式揭示真正的結構性力量和社會最深處的觀念意蘊變遷的研究——【自殺論】。本文試圖借鑒這一經典文獻,比較其論證邏輯與「假設—演繹主義」之間的根本差異,討論透過變量來抵達對社會實體的實質討論的可能途徑,以及這一途徑的困難之處與解決之道。立足於對變量關系的結構分析,但最終上升到對社會實體的討論,進而在對社會實體的洞察中呈現變量的真正意蘊,這構成了與「假設—演繹主義」完全不同的一種研究旨趣和方法路徑。對於中國定量社會學的發展來說,探索這一方法路徑有著重要意義:它既貼合中國社會的內在特征、有助於理解和回應當下諸多現實問題,也有助於闡明社會學學科的根本價值,對於知識生成過程有更為普遍而深入的理解。

0 1
研究困境與經典啟示

諸多研究者指出,中國社會在結構、制度及倫理層面,都有某些較為穩定的要素在發揮著重要作用。 有學者稱之為「社會底蘊」,即「在歷史變遷中,中國社會自發保存的那些具備相對穩定特征的‘恒常’」。 這種恒常力量在切實地發揮著作用,但也正因為無處不在的滲透作用,使得一般的定量研究難以把握其脈動。 因為在既定的「假設—演繹主義」模式下的定量研究中,所有的因素都必須以變量的形式出場才能被納入分析之中。 因此,某些恒常力量盡管在實際的社會運作機制中發揮著核心作用,但如果無法以變量的形式出場,那在研究中甚至不會被意識到。 李伯森(Lieberson)曾經講過,我們可以設想一下定量社會學家通常會如何來研究「重力」: 研究者會觀察不同物體的自由落體運動,希望知曉什麽因素會影響它們下落觸地所用的時間; 然後他們找到物體的密度、形狀、重量等因素,這些影響因素最終會使我們能夠解釋甚至預測不同物體的落體速度; 由此研究者能夠宣稱自己找到了影響落體的主要因素,因為因變量中的變異得到了充分解釋。 我們甚至可以猜想,會有學者提出密度和形狀是某一個概念「X」的操作性測量指標,從而提出某一種「理論假說」來,由此完成完全符合「假設—演繹主義」模式的完整研究流程。 但是,推動這一現象發生的真正結構性力量(「重力」),我們甚至根本沒有觸及。 因為,真正的結構性力量恰是普遍施加於所有物體之上的,因此它在某種程度上是一種常量,而通常的定量分析的前提恰恰是「變量」,是每個個體自身所具有的某種內容與具體特性。 我們不能否認這種研究的知識貢獻,但是同樣不能否認的是,它有可能遮蔽和忽略那些具有穩定性的結構力量。 在中國社會這樣一個有著深厚歷史底蘊的文明體中,即便我們研究的只是一種局部的制度或現象,忽略那些結構力量也會造成比較嚴重的問題。

此外,社會過程中又有諸多具體因素(如職業範疇、制度安排、語言內涵)處在劇烈的變動之中,種種觀念形態可能還處在成形的過程當中。此時,同樣的變量取值和測量結果可能在現實生活的不同情境中有著非常不同的意蘊,現有的變量分析程式對此缺乏足夠的敏感。社會身份和社會行動的本質特點恰恰在於,某種名稱的意義會隨著社會情勢不同而得到重新界定,在不同行動者那裏會有不同的觀念認知,甚至在不同的研究問題中會顯現出不同的側面。如果我們在進行數據比較時忽視這種意蘊的差異,那麽相關的數據有可能在同一變量名稱下混雜了不同內容的資訊,它無法清晰地對應於相應的實際社會物件和社會過程,因此能夠告訴我們的東西也就極其有限,甚至會引發某些誤解。然而,在一般的定量研究範式中,變量的意蘊是在分析前的操作化階段得以確定的,它假定變量的意義至少在分析涉及的時間段中是固定不變的。在制度安排與語言內涵都發生顯著變動的社會中,這種處理方式是否最為合適?有沒有其他的分析方式能夠更有效地辨析和應對這種意蘊的變化以及背後的深層原因?

中國社會的上述特征,應該成為我們討論方法時的基本出發點。已有研究者指出,定量社會研究在迅速發展的同時,也遇到了所謂「雙重危機」:「基於內生性問題的因果邏輯危機和基於時空問題的理論視野危機」。這種反思極其重要,因為它關涉的不僅是分析技術問題,還與如何認識研究物件的內在特性密切相關。事實上,要解決「基於時空問題的理論視野危機」,固然需要數據類別的擴充和分析技術的革新,但更根本的還是要回到方法論的層面去反思與探討,尤其是要思考在當前盛行的「假設—演繹主義」研究範式之外,經典社會學是否還向我們提供了其他的數據分析路數。

在某種程度上,當下的定量社會研究是一種主張不斷朝前看的研究路徑,最新的研究技術、數據資料總能更吸引人們的關註。定量研究者很少轉過頭去,看看某種研究技術的起源與流變,看看某種研究技術背後的假定與前提,那似乎只是少數學科史研究者才需要去註意的問題。不過,在研究技術的初始階段,其技術細節固然是質樸初級的,卻也可能保留了方法路徑未加固化之前的多種發展可能性。在後來發展出來的方法路徑形成套路、日益僵化之時,那些保留在經典研究文獻中的素樸筆觸,反倒更可能給後人以新鮮而興奮的感受,甚至可能開辟出新的路數走向。塗爾幹的【自殺論】就是這樣一部重要的研究文獻。

【自殺論】長久以來就被認為是利用統計數據進行社會學分析的典範性著作,但多數社會學者並不會對其中的統計論證部份進行精研細讀。理論研究者關註它在洞察現代社會道德人心時的過人眼光,往往認為那些統計表格只是塗爾幹分析過程中的一個中間手段,甚至是在得到結論之後就可以跳過和擯棄的贅物。定量研究者則只是給予它某種儀式上的敬意,以為它的歷史功績在於引入了經驗數據作為重要的研究資料,或引入了數據分析作為重要的研究方式,抑或引入了社會變量來解釋自殺率高低;但是,其中的統計方式是初等的表格分析,連相關系數都未曾出現,因此人們在閱讀時大多略過。或者,研究者會從【自殺論】中挑揀一些論證片段,來說明塗爾幹對於統計學的使用方式其實合乎日後成為主流的「假設—演繹主義」模式或變量相關模式。這使得塗爾幹的方法路數與日後的主流得以並軌,既可以使我們當下的做法有了淵源,又可以使得方法與理論在此順暢而合乎情理地進行合流。

然而,只要回到文本進行辨析,就會意識到上述認知是基於後來的主流框架來套塗爾幹的分析思路。首先,回到當時的歷史情境看,【自殺論】的方法貢獻並不在於它率先用統計學的手段發現了一系列變量關系。根據史帝芬·端拿對於與塗爾幹同時代的眾多統計學者作品的細致研讀,「道德統計學」的學者們對於與自殺相關的各種因素積累了極其詳盡的資料,發現了與自殺相關的眾多因素,包括地理、氣候、生理、心理、社會等。許多基本的變量關系在當時學術界並不新鮮,如自殺與教育、教派等因素之間的穩定關聯,自殺與季節的周期性變動關系,等等。【自殺論】的方法貢獻也不在於其數據分析技術。當時的其他學者也意識到了變量關系並不能等於客觀的「法則」:兩個因素之間的關聯完全有可能是由於背後共同的原因造成的,或者,表格中的關聯可能是兩種不同因素的混雜而形成的。如何從這種表格中尋找到「原因」成為重要的挑戰,一系列新的表格分析方式為此而被發明出來。塗爾幹在【自殺論】中大量沿用了莫塞利的細分表格分析方法和貝蒂榮(Bertillon)的「凈效應」分解方法,並稱贊這種分析技術是「一種巧妙的計算」,在自己的分析中「重復了這種計算」。在【自殺論】中,塗爾幹的數據分析是非常細致周詳的,但從分析技術上來說,與當時的道德統計學家並無根本差異。甚至,從社會因素來解釋自殺,采用一種社會決定論的視角來進行分析,也並非【自殺論】的獨特之處。人們通常認為,【自殺論】最不同尋常之處就是確立了對自殺現象解釋的社會決定論。這一點當然有其道理,但多少也有歷史回溯中常見的光環效應。端拿就指出,早在【自殺論】出版的15年前,莫塞利在其著作【自殺:關於比較的道德統計學的論文】中就不僅采用了社會決定論的視角來分析自殺,而且還用文明的增進與自利主義來解釋自殺。

塗爾幹的獨特貢獻在於,他在旨趣和方法路徑上與當時的道德統計學分道揚鑣,創立了一種蘊含社會學獨特技藝的數據分析路徑。他采納了道德統計學的一些基本材料和分析技術,但在核心旨趣和基本原則上進行了重要改造。端拿曾慨嘆,「塗爾幹在統計傳統與哲學傳統上都是一個異類」。塗爾幹的異類之處,就表現在他使用統計工具進行論證的方式既不合乎當時流行的「道德統計學」的路數,更不同於日後主流的「假設—演繹主義」的路數,而是形成了獨具一格的方式。已有學者將塗爾幹的研究置於歷史的學術脈絡中,指出了它與道德統計學等分析傳統的異同及其緊張關系,澄清了其「集體類別」概念對「平均人」概念的超越,將它與以塔爾德為代表的其他理解現代社會特征的路徑進行了比較。另有學者對塗爾幹分析中的因果觀念進行了詳盡的概念梳理,尤其澄清了美國定量研究的主流範式對這一因果觀念的改造與修正。但是總體而言,塗爾幹在定量數據分析方式上的獨特貢獻目前尚未被完整呈現,這種研究方式與其理論關懷的契合關系還沒有得到充分探討,尤其是它對於當下定量社會研究在方法論層面上的啟示並沒有得到揭示。

0 2
旨趣與途徑
|
對根本原因和恒定關系結構的探究

在先於【自殺論】發表的【社會學方法的準則】中,塗爾幹已勾勒出他對道德統計學進行改造的根本思路,這集中體現於書中的第六章「關於求證的準則」中。 塗爾幹首先反駁了「同一結果可能會有不同原因」的命題。 這段論述是以與密爾論辯的形式展開的,在此似乎顯得突兀而令人不解。 多因共同導致同一結果,難道不更符合常識嗎? 其實,只有結合當時「道德統計學」研究的一些基本狀況,我們才會對塗爾幹的上述觀念有更準確的理解。 「道德統計學」基於種種因素之間的關聯進行研究,其結果有一個十分顯著的特點,即強調結果的多因性。 畢竟,我們總是能夠發現多個與結果相關聯的因素,如教育、教派、性別、婚姻,這幾乎能夠無窮無盡地列舉下去(塗爾幹稱之為「支離破碎的列舉」)。 此外,這些因素的效應又確實是混雜在一起的,盡管我們可以透過某些技術手段(如細分表格)來盡可能地去擇出某些因素的「凈效應」來。 結果,在「道德統計學」的研究中,要麽是充斥著一長串的相關要素而顯得零碎繁復; 要麽是像莫塞利那樣,把這些零碎化的相關要素籠在一個「社會決定論」或者「文明代價」的框架之中而顯得大而無當。

塗爾幹顯然對此不滿,所以才有針對性地提出批評。他認為,因果關系必然是「一種來自事物的本性的關系」,它「只能表現一種本性」。因此,對因果關系的分析必然基於對事物本性的洞察,而不能被表面的紛繁復雜性所遮蔽。因果關系包括「效力、生成力以及作用力的觀念」,原因則是「內部能量尚未顯露的力」,而不是脫離事物本身的觀念聯系。正是由於這一點,他提出了那個備受爭議的命題:同樣的結果總是有其同樣的原因。在經驗世界中,我們可能經常會看到多個原因導致同一結果,但是如果我們能夠真正理解「事物的本性」,就能夠看出這裏的「多個原因」在本性上就是同一的,是同一原因在具體情境中的不同表現而已;或者,會看出這裏的「同一結果」在本性上根本不是同一的,而是內容的相似。他援引當時的科學發現進行說明:「一般常識認為,‘發燒’這個詞只表示同一種疾病,而從科學上來說,有許多種性質不同的發燒,有多少種原因就產生多少種結果。」在另一方面,「根據現代的理論,摩擦、撞擊和化學作用等產生熱,都是同一原因所致。」如果不是基於事物的本性來進行推斷,那麽「即使可以搜集到足夠多的事實,也永遠不可能得出正確的規律和明確的因果關系來」,而只能得到「一大堆含混不清的前提」。

在【自殺論】中,塗爾幹嘗試探究的也是這樣一種「根本原因」(la cause fondamentale),或者自殺的「根本形式」(forms fondamentales)。其深意在於:塗爾幹對於將眾多因素歸並在一起來解釋某種現象的方式並不滿意,他要做的是在這些眾多因素中透過自己的分析手段和邏輯推斷來發現「根本原因」,而不是所謂的「影響因素」。「根本原因」和「影響因素」並不處於同一層面,「根本原因」甚至可能會被「並不根本的原因」所幹擾和掩蓋而難以直接分析。社會學的真正使命是去揭示這些有關「事物本性」的根本原因,而不是對眾多因素的窮盡式列舉。

如何才能發現基於「事物的本性」、真正的因果關系?塗爾幹轉向了所謂的「共變法」。要強調的是,這裏的「共變法」源自密爾,但卻是經過塗爾幹改造與闡發的全新的「共變法」。它有自身的一套邏輯與流程,最佳的範例就是隨後不久發表的【自殺論】。這種研究的第一步是要發現「恒定的共存關系」。這裏的關鍵在於「恒定」:這種關系要被足夠數量的事例所證實,要有規律地發生變化,不僅體現於整體模式,也體現在局部變化當中。這種關系的恒定,本身表明了它「不像前述地那樣從事物的外部進行,而是在事物的內部進行」,表明了「兩種事實至少在量上互相參與」。研究需要表明,即便存在著少數特例,這種關系的規律性也是穩健存在的。

在19世紀上半葉,道德統計學傳統有一個基礎性命題:社會事件發生率(死亡率、自殺率……)的穩定性。這樣一種穩定性構成了學者們認為社會科學得以成立的一個客觀理據。塗爾幹沿襲了道德統計學對於穩定性的強調。但是,他強調的重點卻並沒有局限於發生率(rates)的穩定,而是因素之間關聯的穩定存在。如果因素之間的關聯不夠穩定,在分析之後不能呈現出接近固定的對應關系,那就說明它並不是根本原因,也就不值得投入力量去深入討論。在塗爾幹那裏,「對應關系」(parallélisme)一詞有著特殊意義:它不同於一般的統計關聯,而是有著更為嚴苛的標準。塗爾幹把那種一般性的關聯稱為「斷斷續續的契合」,認為從中並不能得出任何一般結論。例如,他駁斥自然因素與自殺關系時,就認為「在氣溫的變化和自殺人數的變化之間,並沒有固定不變的對應關系」,而白晝時間與自殺人數之間「如此有規律和精確的對應關系不可能是偶然的」。真正的對應關系必須比普通的關聯具有更強的一致性和匹配性,最終構成「按規律形成的、彼此先後連貫的、並盡可能是遞進的、而且具有足夠的廣泛範圍的變化系列」。塗爾幹透過細致的工作,發現一系列能夠達到這一標準的關聯。例如,自殺率與宗教派別間的關聯模式就不僅體現於不同國家之間的比較,而且體現於同一國家內部的各個王國之間的比較、同一個王國中的不同省的比較,以及同一國家內部不同人群的比較。這是揭示出「事物本性」發展方向的關鍵一環,關聯的穩定存在揭示了這一經驗事實背後應當存在重要的社會基礎。

但是,恒定的對應關系仍需「用理智對它所確定的事實進行加工」。塗爾幹詳盡說明了這一過程:「首先,是借助於演繹法來查明兩項之中的一項怎樣產生了另一樣,然後是借助於經驗即重新比較來設法驗證演繹法所得的結果。如果演繹法是可行的,並證實它的結果是正確的,那就可以認為證明是成立的。相反,如果發現兩個事實之間並無直接聯系,尤其是關於它們之間有某種聯系的假設是與已經證明了的規律相悖時,那就要去尋找兩個事實都依存的或在它們之間起媒介作用的第三現象。」這一過程的本質,是在「理智」的指導下「以嚴格的批判態度」對經驗材料進行細致的比較分析,以便排除對前述對應關系的某些解釋。在塗爾幹看來,社會學家最足以自誇的優勢恰恰就是他能夠進行各種靈活的比較。社會生活本身持續不斷的變化,以及社會現象在不同情境中的差異,為社會學家的比較提供了取之不竭的靈感來源,使他「在使用共變法時會有無與倫比的能力」。

比較的前提,是必須公正地對待其他可能解釋。例如,對於宗教教派與自殺率之間的關系就有一種可能解釋:不同宗教自殺率的差異,根源在於兩種宗教在社會上的相對比例不同。天主教在歐洲多數國家都是少數派;少數派不得不面對周遭的敵意。為了維護自身的生存,他們對自身實行嚴格的控制,特別在意輿論,故而自殺率少。但塗爾幹提出,我們可以在那些天主教占多數的國家和地區內部,來比較天主教徒與新教徒的自殺率。數據表明,即便在那些天主教徒占多數的國家中,天主教徒的自殺率仍顯著低於新教徒。因此,這種少數派不得不采取的謹慎態度就不可能是導致這兩種宗教之間如此巨大差異的主要原因。

塗爾幹不僅比較了不同教派之間的差異,還在同一教派內部進行比較。如果自殺率背後的真正推動力是共同信仰的動搖和團結程度的下降,那麽即便是新教國家,那些教會整體化程度更高的國家自殺率也會較低。數據表明,英國的教會整體化程度更高:它的法律承認許多宗教法規,對傳統的尊重更普遍而且強烈,神職人員數量較多且有等級;與此同時,它的自殺率也明顯低於其他新教國家。

因此,要揭示教派與自殺率之間關聯的實質,我們恰恰需要在同一教派內部進行繁復的統計比較。這種對共變關系的細致探求過程,非常近似於某種在理論邏輯指引下利用數據進行的深入描畫,即「多層級、多角度地勘探社會構成的各種要素及其相互關聯」。事實上,深入描畫並不一定要和解釋預測對立起來,它們可能只是達到同一工作目標的不同方式。正是在深入比較與描畫當中,我們逼近了對事實的本質性解釋。

尤其值得註意的是塗爾幹在數據比較過程中對待例外和反常的方式。塗爾幹不僅在尋求一種可以被表述為普遍規則的關系性陳述,還始終保持著對例外和反常的敏感。例如,在前述過程中,塗爾幹就遇到了一個重大的反常:猶太人的受教育程度相當高,但他們的自殺率卻非常低。這正是洞察事實背後的深層邏輯的好機會。塗爾幹所發現的,用現代定量研究的語言來講,就是「教育」這一個變量對於不同的人來說意味著本質不同的東西。猶太人所表現出來的對教育的興趣具有非常特殊的根源。「猶太教徒力求受教育,不是為了用經過深思熟慮的觀念來取代集體的偏見,而只是為了在鬥爭中更好地武裝自己。……這種例外甚至肯定了這種規律。……當教育具有另一種原因和滿足其他需要時,這種例外就會消失。」事實上,這種「例外甚至肯定了這種規律」的事例,最能夠體現出塗爾幹在面對數據時的研究取向。

這種對待例外與反常的方式,可能會被批評為是事後(ad hoc)解釋。但那種事後解釋之所以不可靠,是因為它進行的是分散而孤立的解釋;而塗爾幹對待反常的方式,則總是在其中尋求更深層而總體性的解釋。兩者的邏輯完全不同。在比較過程中,新的維度被不斷引入,但這些新的維度始終不是彼此獨立的,而是在一個統一的論證邏輯下構成了彼此勾連的整體結構。正是在這種邏輯推動的深入描畫和層層疊疊的比較過程中,「我們終於找到了真正的規律,這些規律可以使我們嘗試對自殺的類別進行系統的分類。由此確定的社會學原因給我們解釋了這些不同的偶合」。然而,為了探尋有關「事物本性」的根本原因,我們還需要一個重要的立足點,那就是回到社會實體的層面去思考。

0 3
立足點
|
對社會實體與變量意蘊的考察

透過對於恒定的對應關系的考察,人們可以得出像「自殺人數的多少與宗教社會一體化的程度成反比」之類的命題,但塗爾幹認為,這和有關「事物本性」的根本原因仍有一段距離。 恒定的對應關系中包括的那些因素,是根本原因在個體內容上的表現,而並非根本原因本身。 在統計層面上,我們可以看到個體內容與自殺率之間的確定性關系,但社會研究卻不能就此在這些個體內容中去尋找事情發展之因,而必須去討論這種關聯背後的社會實體到底是什麽,它的作用方式又是怎樣的。 根本原因不是那些變量或內容本身,而是在數據關聯分析的過程中,透過對社會實體的推理與思考而「湧現」出來的。 正如社會與個體之間的湧現關系一樣,最終原因與那些變量內容也有這樣一種湧現關系。 在這種探求中,塗爾幹發現自殺背後的根本原因是利己主義、失範、利他主義、宿命主義等種種社會潮流,進而對於社會潮流本身的形成、社會潮流對個體的作用方式、在個體身上的表現形態進行了透徹分析,由此完成了他對於現代社會病理學的闡釋。 正如端拿所言,「【自殺論】的成就在於構建了一個綜合解釋,來把多個極其不同的關系壓縮成為少數幾種基本社會動因,每種動因又可以用具有完美或接近完美的對應關系的表格來展示」。

在塗爾幹的思想中,社會實體(le substrat social)指的是最具基礎性地位、結晶化程度最高的那部份社會實在,它是社會基本構成要素(如群體層級、制度要件、觀念要素)以特定數量、性質、結合方式、凝結程度而構成的整體,它有實在的引發變化的力量,因此「社會學不能不關心與集體生活的實體有關的事情」。它當然首先是一種區別於個人特質的社會實在:「社會並不是個人相加的簡單總和,而是由個人的結合而形成的體系,而這個體系則是一種具有自身內容的獨特的實在。」但它不僅是一般的社會實在,還是「集體的存在方式」,構成了「社會的內部環境」,而「一切比較重要的社會過程的最初起源,應該到社會內部環境的構成中去尋找」。社會實體與其他社會事實之間在結晶化和定型化程度上存在區分,因此「對於關系到社會實體的社會事實保留形態學的這一修飾語可能是有益的」,但同時也「不能忘記這些事實在性質上是彼此一致的」。

只有最終落實到社會實體的層面,而不是個體內容的層面,才能找到有關「事物本性」的根本原因。正是在這裏,塗爾幹與道德統計學派發生了最根本的分歧,以至於他在基本完成自己的類別學分析之後仍要透過與凱特萊的辯論,來更充分地說明自己的方法取向。塗爾幹對於凱特萊「平均人」理論的不滿,根本點在於:「平均人」的解釋方式,是將原因落在了「多數人身上表現出來的共同的肉體和精神特征」上,即「多數人」表現出的內容。但自殺傾向並不是多數人身上表現出來的內容特征。更重要的一點在於,內容並不構成一種實體,不能構成一種能夠有辦法影響人的力量。因此,以凱特萊為代表的道德統計學派的根本缺陷就是,他們用「平均人」的說法回避了實體到底是什麽、實體如何起作用的問題,而只停留在內容及內容間關聯的層面。「平均人」只是根據這種內容及關聯而「虛擬」出來的實體。塗爾幹敏銳地指出,「平均人」是根本不會自殺的;凱特萊的處理方式,實際上是「把標記當作被標出的事物」。這是道德統計學派與後世「假設—演繹主義」的共同缺陷:「它以名詞代表實物,以名詞的恒定不變代表實物的恒定不變,它將附屬於行動者的那些內容視為可以獨立的力量,而忘記了它們身處其間的關系。這樣便消解了問題:決定變量中到底是什麽在作決定?被決定變量中到底是什麽被決定?」

對於內容間關聯的討論必須伴隨著對於社會實體層面的思考,研究者才能最終找到根本原因。內容間關聯的討論,本身就如同梯子一樣,它必須靠在社會實體這樣一堵堅實的墻上,並最終到達社會實體這一堵墻的高處;但梯子並不是墻體本身。正如葉啟政指出的,道德統計學派「不自覺地撤銷了……原先關心原始源起場景的企圖,而且也把其所具的社會學意義一並給架空掉了」。

在自殺的研究中,社會聯結與集體表象就是這樣的一些實體:它不能被抽象地理解為「個別狀態間的某種平均數」,而要被看成現實、有支配力的特殊力量。「如果(作為社會學研究物件的)這個世界不是一系列的現實事物,它就什麽也不是。」那麽,這種實體如何運作?「個人聯合起來形成一種新的精神存在,因此這種精神存在有它自己的思維和感覺方式。……當某些意識不再是彼此獨立,而是集合和結合在一起時,世界上就會有某種變化。」由此,聯合本身就產生了新的精神狀態,產生了與個人的表象屬於不同性質的集體表象。實體層面的考察引出了集體表象何以形成這樣一個過程性的問題,也引出了塗爾幹在【宗教生活的基本形式】中對這一問題更加精細的分析。

在這樣一種研究路數中,「根本原因」並不是在「自變量」當中(如果可以采用這樣一種現代分析術語的話)。塗爾幹並沒有透過某種統計操作而去確定哪個「自變量」是真正的因,以及其因果凈效應有多大。他確實是從變量關系著手進行分析,但最終找到的真正原因卻不是數據中的某個變量,或某些變量的集合。如同他認為社會不能簡單等於個體之集合一樣,在分析方法上,塗爾幹也認為透過變量分析找到的根本原因並不能簡單等於一系列自變量之集合。「原因」應該是有支配力的社會實體,而不是某種個體內容。把原因訴諸個體內容,就有可能誤把原本的直接物件當成有支配力的主導者。統計學計算出來的變量關系效應,可能是揭示真正社會學意義上的效應的工具,但也可能成為某種遮蔽真相的幕布。要想透過形形色色的變量關系來獲得對「社會學的恒常關系」(sociologically constant relationships)的洞察,前提是要能夠澄清變量在研究問題所處情境中的社會學意蘊。這只有透過對變量彼此交織的關系結構的細致描述和對社會實體層面的追索才能做到。

這樣一種對於「原因」的理解,與現代「假設—演繹主義」研究路徑理解的「原因」完全不同,也根本不可能像當代路數設想的那樣可以事先界定,然後透過操作化手段來測量。在這裏,塗爾幹展現了一種與現代「假設—演繹主義」完全相反的思路。以他對於利己主義自殺的分析為例,當他發現自殺率與宗教教派、教育程度、自由職業等因素都具有穩定的對應關系,而且它們往往又彼此交織在一起時,他並沒有力圖去用統計操作來獲取各個因素單獨的「凈效應」,而是借此洞察到了所有這些變量關系中蘊含的共通之意:人與社會聯系紐帶的松弛。在這裏,變量之間的種種交織關系,並不是我們進行所謂「因果推斷」的障礙;恰恰相反,它是社會實體向我們展示自身真正秘密的一把鑰匙。透過這把鑰匙,我們從可觀察的變量關系著手,開啟了不可直接觀察的社會意義世界的大門。

我們要特別指出,那種把「操作化」的邏輯套用在塗爾幹的論證上的理解方式是不能成立的。在那種理解中,塗爾幹仿佛是先有「社會整合」的概念,然後再把它分解為若幹指標(如宗教、教育、職業)的。然而,這些指標一旦孤立存在,都未必和社會整合有契合關系。這些指標之所以能夠呈現出「社會整合」的意義,是因為它們在這一具體分析中呈現出了關系整體結構。「假設—演繹主義」範式似乎非常重視理論的指導作用,將理論命題視為提出假設命題的源頭,將理論概念視為操作化的起點。但是,在「操作化」的實踐過程中,研究者需要在探討和澄清變量關系結構之前就事先敲定其概念意義,結果使得概念的操作化容易變成脫離具體情境與問題的「常識認知」,反而喪失了提煉核心概念的可能性。塗爾幹則是在研究過程中不斷探索各種變量關系的結構,在這個過程中社會實體層面的真正原因逐漸浮現;最終在真正原因的映照下,每個變量的真正意蘊又得以顯現。


結語
|
定量研究的方法論創新

綜上所述,塗爾幹的研究方式為我們展現了一條從變量關系結構分析上升到對社會實體的討論,再從社會實體的洞察中呈現變量的真正意蘊的研究路徑。 塗爾幹並不是簡單沿襲了道德統計學的研究方式。 早在寫作【社會學方法的準則】時,他就已經開始對道德統計學進行批判與改造,這一工作最終在【自殺論】的寫作過程中得以完善與展開。 也正是在這種批判與改造的過程中,塗爾幹後期關於集體表象的思考開始顯露,他構想的利用數據方法來研究社會實體的獨特路數也得以被闡明。 簡言之,這種路數的獨特性表現在如下幾個方面。 第一,研究的目標是揭示有關「事物本性」的根本原因,而不是對眾多因素的窮盡式列舉。 第二,在各種各樣的因素關聯中,要尤其重視某些「恒定的對應關系」。 第三,最終將變量關系的整體結構視為一種「標記」,而去討論「被標記的事物」,即背後的社會實體。 第四,在社會實體層面的原因得到澄清之後,單個變量的真正意蘊才借此得到了最充分的呈現。

塗爾幹的研究路徑與後世的「假設—演繹主義」截然不同,它絕不是「假設—演繹主義」的雛形或母體,而是暗含著另一種方法論主張。在這種研究路數中,對數據關系的考察與社會實體層面的考察呈現出一種回環往復的復雜關系,而不是通常教科書中呈現的簡單對應關系。但塗爾幹的上述方法路數並沒有得到足夠重視。原因在於,隨著相關分析和回歸分析被引入統計學,早期的表格分析和發生率的分析被迅速替代。基於個體內容的分析技術進步,以邏輯實證主義為後盾的哲學論證,使得現代的「假設—演繹主義」路數成了無可置疑的定量分析主流範式。

首先,在這種研究範式的「操作化」過程中,原本是在變量結構整體上才湧現出的結構性概念,被當成了與其他影響因素並列的眾多自變量之一,由此變得十分單薄。例如,我們看到在這樣的研究範式中,即使最具有塗爾幹色彩的「失範」概念也僅僅被當成了一種個體心理內容,然後與其他個體特性放在一起來進行統計分析。在變量分析完成之後,我們也不再深究背後的社會實體與根本原因。如阿博特曾指出的,我們透過定量統計分析會得出結論說,薪金差異是由性別、組織科層化等引起的,但是從語意學角度來看,變量語言只是一種幻象:性別和組織科層化並不指涉任何實體,它們只是實在事物的內容而已。因此,雖然因果分析的形式框架成了主導,塗爾幹那種對於「根本原因」的探究卻被棄置了。當初被塗爾幹視為道德統計學研究缺陷的某些癥候,仍然可以在此類研究中看到:「支離破碎的列舉」和「斷斷續續的契合」,以及停留在個體內容層面而缺失對社會實體的歸因。

其次,變量意蘊在這種研究範式中也沒有被足夠重視。變量意蘊是在操作化階段解決的,但這裏的意蘊是脫離變量關系而事先確定的。如我們在【自殺論】的論證過程中看到的,這是一種並不完善的處理方式。在研究之初,我們面對的往往是「通常被混為一談、似乎只是程度不同而實際上有著明顯區別的事實」;只有對變量的關系結構進行詳盡描繪之後,我們才能分辨出它們背後所包括的「道德意義和社會意義也不盡相同」。如果不進行這樣的工作,我們就無法有層次豐富的辨析與理解。如布迪厄所言,「如果不去確定變量在某一種具體情境中(即在這一對具體的變量關系中)標示的是什麽內容,那麽統計關系縱然在數值上再精確,也仍然是缺乏意義的純粹資料。在這種情形下,社會學家往往只滿足於直覺性的淺薄理解,而專註對關系強度的測量精益求精。此外,他們又有一種錯覺,以為從名字相同的指標中得出的變量或因素就是恒定不變的。上述淺薄理解和恒定錯覺,使得他們對關系當中變量的意義不進行任何探究;然而,變量的意義只有在具體關系中才得以生成,只有在具體關系中才得以呈現」。

因此,塗爾幹對於道德統計學傳統的思考和批判在當下仍有重要意義。在使用各種變量關系進行因果討論的過程中,精深的數理方法的作用只是提升參數估計的精準性。但是社會學家的難題並不在於參數估計的精準性,而在於如何借助估計去了解背後各種真正的社會實在。如果意識不到這一點,我們仍會落入過去道德統計學者曾經落入的陷阱之中:只在各種碎片化的、抽象的變量內容中思考問題,而完全觸及不到甚至忘卻了背後那些基本的制度要件與觀念要素。

流程和技術工具都是有益的,但只有在理解研究物件特性的前提下才是如此,否則它們就可能如削足適履般傷害研究本身。隨著對研究物件理解的深入,方法本身也得到提升;隨著方法的提升,對研究物件的理解又進一步深化,這是學科發展的常態。能夠滋養社會學研究方法成長的核心要素,既不可能來自統計學技術,也不可能來自科學哲學,而一定是社會學本身的知識推進。借助對數據的深入辨析與比較,逐層去除種種表象因素的遮蔽,闡明來自事物本性的根本原因,最終浮現背後的社會實體與意蘊,這才是社會學定量方法獨特的核心技藝。從變量關系上升到社會實體分析,是上述方法路數的關鍵,也是它的難點所在。必須指出,某種方法路數一旦被誤用,其最大魅力也往往成為它最大的陷阱。塗爾幹的這種方法路數確實可能引出一種誤用傾向:對社會實體進行簡單的「擬人化」比附,由此來實作這種跨越。比如說,我們觀察到不同世代間在某些觀念上發生了變化,由此就認定有一種擬人化的宏觀「風尚」是背後的驅動力。但這有可能只是由於不同世代的構成成分有所改變,而同一構成成分的觀念其實並無變動。這種錯誤的根源既在於數據分析工作不夠精細,也在於對問題中社會實體的理解不夠切實。這一難點是無法用某種單一的抽象方案和標準程式來解決的;它只能在具體的研究實踐中由研究者解決,並由此錘煉自己的方法技藝。對於中國社會學的發展探索來說,這一點尤其緊迫而重要。在具體的定量研究中,我們必須結合中國社會的內在特性,充分挖掘它在群體層級、制度要件、觀念要素等方面的具體內容,進而明確研究焦點,擴充數據類別,創新分析技術。

在研究焦點上,定量分析不能只滿足於分析各種孤立離散的「影響因素」,而要思考背後所涉及的「基本動因」,透過數據探討形塑社會生活和世道人心的核心制度與觀念。這些結構動力和觀念意蘊,並不直接對應於數據中被直接測量到的某種內容,必須依靠社會學的技藝來挖掘與探討。以社會分層與流動研究為例,長期以來,雖然其出發點帶有很強的結構意味,但多數具體研究往往圍繞「分層結構給定條件下個體如何在其中定位」展開,從而喪失了原初的結構性關懷:一方面,客觀分層與主觀認同被視為彼此割裂的不同過程;另一方面,實質意義截然不同的機制卻被混合在同一種量表中加以測度。一旦我們采用「透過變量關系浮現社會實體」這樣一種方法論路徑,就可能將研究重心轉向「分層本身如何形成」(分層機制)。透過追問和辨析分層與流動涉及的那些真正的社會實體和過程,我們就能以完全不同的提問方式來面對分層流動現象。當然,現階段我們完全可以對分層機制中「社會實體」的含義作一種開放式的理解:它可能是人們對於理想社會結構位置的價值期許,或是生活經歷與體驗所形塑出來的群體認同,抑或是各種具體情境下的評價機制和組織機制,還可能是不同群體對彼此的理解與看待方式;但它應該是超越通常個體內容層面的內容。這樣的研究方式,就能夠把對「客觀位置」與「主觀認同」的研究貫通起來,同時從更基礎的層面深入辨析背後的動力機制。

在數據類別上,除了積極擁抱「大數據」帶來的機遇之外,更要致力於增強數據的厚度與密集度。當前,統計技術和數據生產中的諸多推進是激動人心的;大數據和計算社會科學的出現,為我們提供了借變量關系結構來洞察社會實體的更寬廣的渠道。技術手段將使我們能夠處理更為復雜的變量關系結構,借此理解變量彼此互依背後的實體運作,進而真正洞察變量在不同情境中的意蘊差異。但是,數據量再大,如果涉及的層面與變量太少,它也無法支撐起豐富的社會結構性分析。聚焦於重要的制度要件與觀念要素,采用不同層面、不同來源的多重數據,將不同類別的數據疊加交叉,密集地對同一主題進行描畫與比較,透過這樣的做法更可能得到對社會結構的真正洞察力。這就要求研究者一方面要對於新的數據來源始終保持開放與探索精神,另一方面要更加重視對不同數據的整合性利用。

在分析技術上,要思考如何將社會學對結構、情境、認知的洞察與現有的前沿因果辨識技術創造性地結合起來。方法論的討論與具體技術的提升是彼此促進的關系,深入討論塗爾幹的分析邏輯,並不意味著在具體技術上的保守立場。恰恰相反,深入的方法論討論與前沿的技術工具是可以密切關聯起來的。因果推斷無疑是過去數十年間定量方法領域最重要的推進。以「因果推斷」和解決內生性問題為核心的一系列技術工具,同樣可以與本文討論的方法路數結合起來。從現有的發展狀況來看,技術手段並不可能完全解決因果推斷問題,如優秀的工具變量往往可遇而不可求,自然實驗往往只是稀少的例外。事實上,只有在結構和意蘊視角下理解了人們現實的「選擇行為」,我們才可能更透徹地了解統計學意義上的「選擇性難題」;只有洞察結構背景下變量間可能的交織關系,我們才可能對於因果推斷中存在的各種混淆因素更加敏感,才能更精準地找到因果推斷的關鍵線索,進而發展出具有社會學特色的因果辨識路徑。定量社會學者必須把握自身研究物件的內在特性,才能在面對技術手段的快速更叠時占據主動,提供其他學科無法替代的學術洞見。