您當前的位置:首頁 > 體育

多即是不同

作者:由 焦糖瓜子好吃 發表于 體育時間:2022-04-10

當人們的行動或決策取決於他人的行動和決策時,僅用累加或者外推(extrapolation)的方法,很難對群體的表現做出預測。—— 托馬斯 C。謝林[1]

人類認識自然規律的圖式幾經變化,還原論可以說是最早的一種。其早期提倡者笛卡爾認為,要解釋複雜的事情,必須將事情拆分到足以得出最優解那般細小的程度,隨後再一步步上升,對總體加以理解和描述。

但人們漸漸發現,即使我們對細微個體足夠了解,也很難由個體的性質去分析聚合的宏觀現象。學科劃分的出現就是一個典型的例子:物理學家瞭解原子,但沒人要求他們必須是優秀的化學家、細胞學家、生物學家和生態學家,儘管無可否認的是,這些學科的研究物件都由原子構成。再比如,心理學研究個體思想與行為,但研究個體心理彼此作用所產生的現象,卻是社會學的任務。諾貝尓物理學獎得主安德森的話發人深省——“多即是不同”(More is different)[2]。零散的個體,一旦彼此作用時,總會表現出超乎尋常的不確定性和複雜性,難以僅憑個體的性質去預測。

時至今日,“整體大於部分之和”似乎早已是常識,也為大多數公眾所知。但是,在進行分析和推斷的過程中,不僅僅是公眾,很多專業的研究者也會犯混淆整體與個體的錯誤。本文目的之一,即是反思這些錯誤和常識,同時作個人學習梳理之用。

一 地鐵中的老鼠

所有模型都是錯的,但是一些是有用的。——喬治E。P。博克斯[3]

2018年7月4號,臺北的一輛地鐵正從大安開往向山站。突然,一隻十公分大小的老鼠從車廂角落裡竄出,引得部分乘客恐慌、尖叫。尖叫聲讓其他不明就裡的旅客恐慌起來,也跟著一起尖叫,繼而逃竄。逃散的人群越來越多,地面上到處是旅客散落的鞋子和行李。最終,一隻小老鼠引發了一場百人騷亂,多人受傷的鬧劇。

新聞下評論的網友,主要抱著嘲諷的心態。大意在說,臺灣人膽子小,連一隻老鼠都會怕成這樣。說這些不痛不癢的話,自然是網民的自由,但嚴謹來看,這種從百餘人逃散推測每個個體都是膽小的的邏輯,無疑是錯誤的。

首先,百餘人逃散,並不代表百餘人都怕老鼠。事實上,很多人逃散的人都沒有看見老鼠,而他們之所以也會跟著這樣做,僅僅就是因為周圍很多人都在尖叫逃跑。不幸的是,他們跟著做出的選擇,被其他人看到和捕捉,進而也轉化為了其他人跟著這樣做的原因。試想,當你看到百餘人一邊喊叫一邊向一個方向奔逃時,似乎趕緊跟上才是上策。

其次,可以說最開始尖叫的那幾個人是怕老鼠的,甚至有點反應過度了,但假如他們是不怕老鼠的人呢?老鼠畏光,或許在車廂暴露一小會就逃到陰暗的角落裡去了,多數人難以注意到的。如果最初看到的人只是撇撇嘴,感嘆一下地鐵糟糕的衛生條件,或許整場鬧劇就不會發生。從0到100的改變,並沒有組織權力的參與,也可以僅僅只由少部分人而決定。

社會學家格蘭諾維特的“門檻模型”對該類現象有很強的解釋力[4]。格氏提出,在某些事件中,個人之所以會做某件事,僅僅是因為周圍有足夠多的人在做這件事,而無論個人最初是如何想的。就像地鐵事件中那樣,大多數個體之所以會逃竄,並不是因為他看到老鼠抑或是別的什麼,僅僅是因為有足夠多的人在逃竄,促使他做出同樣的行為。

“閾值”(threshold)是格氏理論中的核心概念,群體中每個個體都有一個閾值,它代表著群體中有多少人在做該件事時,他自己也會跟著一起做。

以暴動為例,有的人是超級活躍分子,即使沒人暴動,他們也會主動暴動,其閾值就是0。有的人是次活躍分子,不願意打頭陣,但哪怕有一個人暴動,他們也會跟上,其閾值就是1。試想某群體有100人,他們能觀察到彼此的狀態。

如果其閾值分佈是一個從0到99的等差數列,那麼結果就是,第一個閾值為0的人先暴動,引發了第二個閾值為1的暴動,而他的加入又引發了閾值為2的人的暴動,以此類推,直到所有人都加入了暴動。有趣的是,如果我們找到閾值為1的那個人,將其閾值變為2,就會發現從始至終,只有一個人在暴動,99人作壁上觀。

對於閾值為0的個體來說,這一微小的改變,或許代表著兩種不同的命運,前一種情況中他可能會成為領袖與英雄,後一種情況中他可能會成為出頭鳥和階下囚。個體層面的微小差異,就會造成宏觀現象翻天覆地的變化。

當然,任何人都可以指出這個模型的不足之處,因為現實中永遠找不到門檻模型中那樣理想的情景,但該模型的意義卻十分重大。它告訴我們:如果僅考慮單維因素,個體聚合後的行為都如此複雜多變。誰又能奢望在無窮維度的真實社會里,由宏觀表現對微觀性質做出穩健的推斷呢?

二 能夠“預測”成功?

書賣得好,是因為有很多人買它。——琳尼·瓊斯[5]

文化領域,電影、書刊和音樂等產品的成功總是令人難以捉摸。比如,周星馳的《大話西遊》系列上映時不溫不火,但時至今日卻被奉為經典神作;達芬奇的《蒙娜麗莎》開始並不出名,也沒被盧浮宮當作鎮館之寶,直到1911年8月20日一位油漆匠將它偷走,才逐漸有了知名度;甚至我們上節提到的社會學家格蘭諾維特,據說他在社會關係上的研究曾多次被拒稿,好容易發表之後,卻意外成了相關領域被引數量最多的論文。

每當這種情況發生時,總會有評論家會從大眾偏好、產品質量等方面入手做一番解釋。他們聲稱,某些產品之所以品質不錯卻並未取得應得的成績,是因為當時大眾有著與當今不同的審美取向,而某些品質不好的產品大獲成功,是因為大眾平均審美能力相對低下。這些說法或許正確,但解釋僅止於此嗎?

沃茨(Watts)和薩爾加尼克(Salganik)透過實驗的方法,給了我們一個更為有趣的答案[6]:即使你掌握了所有可能的客戶對歌曲的喜好情況,一旦客戶之間存在相互的影響,你也無法預測產品最終會成功還是失敗。

他們招募了一批實驗參與者,將他們隨機指派到兩個組。每位參與者會被要求進入一個預先設計好的音樂網站,網站上預存了48首從未在市面上出現過的歌曲。參與者可以任意傾聽,然後下載,沃茨他們則在後臺記錄每首歌的下載數量。

區別在於,實驗組中的參與者看到的是歌曲“榜單”,即每首歌曲後面不僅寫明瞭當前已有的下載量,還按照下載量從高到低依次排列完畢了;對照組則沒有相關設定,僅僅是將歌曲隨機打亂順序後呈現給參與者。

由於其他影響因素都被隨機指派所控制,所以,如果實驗組和對照組中歌曲的下載排名有差異,只能解釋為個體間“社會影響”(social influence)的結果。

進一步說。對照組類似機構在進行市場調查時的情況,每個個體“獨立”對產品進行點評,最後彙總每個個體的意見,生成一份排名,該排名反映了這些歌曲對大眾真實吸引力的高低;實驗組則類似真實世界的情況,音樂產業中,各種類似“Billboard”的榜單並不少見。這些榜單用下載量等指標對歌曲進行排名,並且影響力廣泛,造成火爆的產品具有更高的曝光率高,進而更加火爆。

結果令人大跌眼睛,相比於乾脆直接推測實驗組中所有歌曲下載量完全一樣,根據對照組的情況對實驗組的排名情況做出的預測,只提高了16%的精準度。這說明,哪怕你知曉了每首歌的綜合受歡迎程度,一旦人們的決策互相影響,你對將會發生什麼依然一無所知。沃茨他們後來又招募了另一組具有不同人口學特徵的實驗參與者,採用了相對的對照組和實驗組設定進行實驗。結果顯示,根據對照組下載量對實驗組做出的預測,甚至比直接推斷所有歌曲下載量相同這種預測方法造成的誤差還要大。

事實上,選舉中也會產生類似的情況。選舉之前,很多媒體、機構會進行支援率的預調查,即使這些調查的抽樣方案足夠理想,調查出的候選人支援率仍然可能與真實投票結果相距甚遠。之所出現這種誤差,很可能是因為,受訪者在回答電話調查時是獨立做出的決定,但在真實投票中卻很容易受到其他人的影響,而他本身,又成為了其他人受到的影響的一部分。

三 “少”即是“多”

常識不過是人在十八歲之前積累的偏見。——阿爾伯特·愛因斯坦

前一陣子,家鄉這邊一直在修路。新的規劃裡,城東西各增設了一座高架,為了儘快完工,施工隊輪班上陣,風雨無阻。每天開車繞行時,都可以看到灰黑的水泥墩柱上顯眼的紅色橫幅,基本都是施工方立下軍令狀,說要不辭辛苦,加快程序。等我再次返回家鄉的時候,橋樑已經完工了,但駕駛在家鄉的路上,我卻感覺,似乎與修路之前相比道路更堵了。每當我和家鄉的親人、同學和老師們聊起這件事,他們幾乎都表示有相同的感受。

多即是不同

圖1

道路有沒有更堵呢?別說一兩個人的感覺,就算全城人都是這種感覺,也無法給出肯定的答案,回答這一問題這需要定量的計算與比較。但是,增加道路反而使整體交通狀況變差,抑或減少道路卻讓交通變好的情況,卻真實在美國、韓國等地發生過。交通網流理論中的佈雷斯悖論(Braess Paradox)就專門用來解釋這種現象。

設想A、B、C、D四個地點由四條路連線,有4000輛汽車要從A地同時出發前往B地。每條道路上的數字,代表了通行所要花費的時間。A到D和C到B,路上都需要45分鐘。A到C和D到B,路上都需要x/45分鐘,其中,x為選擇該條道路的車輛的數量。比如,有1000輛車選擇A到C再到B這一條路,每輛車就需要1000/100+45=55分鐘。具體情況如圖1所示[7]。

我們假設每個司機都嘗試儘可能用最短的時間到達目的地,而且他們已經一起重複從A到B行駛過多次了(可以想象成每天早上都要開一次車去上班)。那麼,最後均衡的結果是,A-C-B和A-D-B路徑上各行駛2000人。每個人花費的時間都是2000/100+45=65分鐘,沒有人有另尋他路的動機。嚴謹地證明這一結論並不容易,但結論卻是顯而易見的。

讀者可以將自己代入場景,假設自己是一位司機,那麼,你會發現,任何試圖變更路徑的行為,都會讓你在路上花費的時間變長。

假設現在來了一位新市長,為了便於大家通行,他主持在C和D之間修建了一條新道路。而且,這條道路所花費的通行時間很少,少到可以忽略不計,可以粗略視其通行時間為0。那麼,一段時間之後,新的均衡結果是怎樣呢?

事實上,所有人都會走A-C-D-B這條路,每個人花費的時間都是4000/10+0+4000/10=80。同樣,不會有任何人有改變道路的動機,那必將讓自己花費更多的時間。

得出這樣的結論並不需要思考多長的時間。沒錯,修了更多的路,大家通行時間的花費卻變長了,交通狀況搞得更砸了。

但仔細想來,這種反直覺的事也並不出乎意料。社會治安狀況差,並不意味著增設一個類似警察局的機構就能改善治安;有人心臟不好,並不意味著再移植一顆心臟就會更加健康;橋樑設計中,無用的結構不僅不能提升安全性,反而會增加橋樑負重,釀成慘痛後果。

這些問題的癥結在於:當事物之間彼此作用構成複雜的系統之時,事態的發展規律已經變成非線性的了,而不是線性的。一顆石頭產生有一倍的質量,十顆石頭有十倍的質量,石頭數目和質量就是線性因果,但在非線性的複雜系統中,微小變化都可能帶來質的偏差。

正如龐加萊在著名的“三體問題”,洛倫茲在“蝴蝶效應”中揭示的那樣,非線性系統會怎樣演變,除非經過仔細推算,否則斷不可能透過直覺得出結果。

四 排座難題

每個人依據個人環境而做出的選擇有多好,和他們總體的狀態有多好,是完全兩回事。——托馬斯 C。 謝林[8]

每次參加高中同學聚會,總有一件令人費解的事情困擾著我——男性總是和男性坐在一起交談,女性總是和女性坐在一起交談。多次週年聚會,這種情況在不同規模、桌椅設定的聚會都穩定出現。顯然,即使不經計算,也可以顯著否定排座位是完全隨機的假設。

因此,必須給這類現象一個更加合理的說法。解釋一是,人們更喜歡和同性的人互動。當一個男性和女性同時出現在個體面前,如果該個體是男性,他更願意找男性互動,如果該個體是女性,更願意找女性互動。但是,這種說法經不起太多推敲,至少它違背了進化心理學的基本假設。

從進化心理學角度,更喜歡和異性交往的個體,在生存繁衍上應該更具優勢。而作為進化過程中成功者的後代,我們在普遍意義上應該也具有與異性交往的傾向。解釋二是,恰巧同性之間友誼更加深厚,所以選座位時無關男女,大家僅僅是走到比較要好的朋友那裡,這或許是個合理的解釋。

謝林的“隔離模型”給了我們另一個思路。謝林透過模型證明,未經組織兩類人群,即使都沒有明顯的排斥對方那類人群的意向,也很容易形成彼此隔離的格局[9]。

比如,一位男性希望同桌超過一半的人都是男性,一位女性希望同桌超過一半的人都是女性,那麼,男女交錯落座的場景永遠不可能讓所有人都滿意。因為讓男性滿意的環境,意味著男性超過50%,女性就不可能滿意。

同樣,讓女性滿意的環境,意味著女性超過50%,男性就不可能滿意。儘管兩性都能夠接受和異性同桌,但當彼此決策相互作用時,卻無法形成兩性同桌的情況。

有意思的是,謝林將這一個體允許周邊存在其他型別人群比例的限度,也稱為“閾值”。有一款叫做Netlogo的軟體專門對多元主體互動進行計算機建模,其模型案例庫中有一個叫做聚會“Party”的模型,探討的就是聚會時兩性選取座位的問題[10]。

計算機模擬發現,即使對同桌異性比例的容忍度(也就是閾值)超過50%,達到55%,模擬的10張桌子中,仍會可能有接近9張桌子是單性別的,也就是說,這9張桌子,要麼只有女性,要麼只有男性。

將謝林的理論,和我們之前提到的解釋二結合起來,似乎能得到一個更加合理的結論。剛開始聚會時,大家受到閾值系統的左右,同性更容易在一張桌子上。

考慮到畢業分離之後,聚會很可能是雙方少有的見面機會。所以,聚會時的同桌情境,構成了維繫和發展友誼的全部契機,而不同桌的異性,互動少,友誼也很快就淡了下來。

等到後來,不管閾值情況如何,友誼已經發揮了絕對作用了,大家只是在尋找那些更熟悉的夥伴。換句話說,一開始閾值系統所決定的格局,在友誼系統的作用下被鎖定了,經過多次聚會的迭代,從而最終形成了我所觀察到的現象。

涂爾幹作為實證社會學的代表人物,寫過一本叫《自殺論》的書。一般認為,這本書最主要的意義在於將實證社會學的思想觀念第一次系統性的付諸了實踐。但是,該作品同樣偉大之處在於,涂爾幹注意到要用“社會事實”來解釋“社會事實”,換句話說,社會層次的現象,絕不能以個體水平的行為邏輯來進行簡單的推測。

必須承認的是,格氏和謝林及其後續研究的模型,儘管兼顧了簡潔和解釋範圍兩點,但歸根到底還是基於某種既定的假設,在複雜的社會現象中,我們很難把握,這些模型的解釋邊界在哪裡。

一種窘境始終存在著:以模型來證明社會的複雜性,複雜性證明的越成功,越是否定了模型本身的穩健性,沒有人有在文章中把握這個世界所有因素的能力,除非,他寫文章的紙和整個世界一樣大。

但是,這些模型在方法論上具有顯著的意義,它們時刻提醒著我們,在分析宏觀現象時,個體的性質並不是最重要的,重要的是他們彼此之間如何相互作用。多,即是不同。

備註:

謝林是諾貝爾經濟學獎獲得者,參見:Schelling, T。 C。 1978 “

Micromotives and Macrobehavior”

p。14, New York: W • W • NORTON & COMPANY。 ↑

參見:Anderson, P。 W。 。 (1972)。 More is different。 Science, 177(4047), 393-396。 ↑

喬治E。P。博克斯,著名統計學家。 ↑

參見:Mark Granovetter, “Threshold Models of Collective Behavior,” American Journal of Sociology 83, no。 6 (May, 1978): 1420-1443。 ↑

Lynne Truss 是暢銷書“Eats Shoots and Leaves”的作者,在面對記者提出的“為什麼你的書賣的那麼好?”這一問題時,給出了這樣的答案 。參見:Watts, J。 Watts 2011, “Everything is Obvious”, New York: Crown Bussiness:81。 。 ↑

參見他們的系列研究:Matthew J。 Salganik, Peter Sheridan Dodds, Duncan J。 Watts 2006 Experimental Study of Inequality and Unpredictability in an Artificial Cultural Market, Science 5762; Matthew J Salganik, Duncan J Watts 2008, “Leading the herd astray: An experimental study of self-fulfilling prophecies in an artificial cultural market”, Social psychology quarterly 4; Matthew J Salganik, Duncan J Watts 2009, “Web‐based experiments for the study of collective social dynamics in cultural markets”, Topics in cognitive science 3。 這裡主要涉及的是第三篇(2009)中的兩組實驗。 ↑

對於該例子更詳細的解釋和計算,參見:Easley, D。 and J。 Kleinberg, 2010, “Networks, Crowds, and Markets: Reasoning About a Highly Connected World。” New York: Cambridge University Press。 本例子的圖片也引自該書。 ↑

參見:Schelling, T。 C。 1978 “Micromotives and Macrobehavior” p。19, New York: W • W • NORTON & COMPANY。 ↑

參見:Schelling, T。 C。 1971 “Dynamics of Segeration” , The Journal of Mathematical Sociology 1。 ↑

參見:Wilensky, U。 (1999)。 NetLogo。

http://

ccl。northwestern。edu/ne

tlogo/

。 Center for Connected Learning and Computer-Based Modeling, Northwestern University, Evanston, IL。 ↑

標簽: 閾值  個體  模型  謝林  實驗組