Reply to this topicStart new topicStart Poll

> [轉載]別用「常識」理解複雜世界
徐元直
發表於: Dec 11 2011, 14:36  評價+10
Quote Post


攤抖首領
************

發表數: 7,909
所屬群組: 君主
註冊日期: 9-18-2003

活躍:61
聲望:4175


很久沒有貼過東西了。順帶一提,此人文章不錯,博客值得訂閱。

=================================

別用「常識」理解複雜世界

http://www.geekonomics10000.com/624

同人於野

(《東方早報·上海書評》,2011年10月29日)

如果一個物理學家談物理,哪怕他只是用大家都能聽懂的語言做科普,外行一般也不太敢提出質疑。人們知道物理學是一個非常專業的尖端科學,沒經過多年訓練的人胡亂說話只能鬧笑話。可是當一個社會學家談論社會問題的時候,哪怕他旁徵博引了好多東西方先賢的經典理論,別人還是可以毫無壓力地批評他。不管專家怎麼說,每一個出租車司機都認為自己知道汽油漲價是怎麼回事,每一個網友都認為反腐敗的出路是明擺著的,每一個球迷都認為如果從來沒搞過足球的韋迪能當足協主席,那麼我也能當。

這也許怪不得大眾。實踐表明,像政治學這樣的軟科學,其「專家」的實用程度很可能並不顯著高於「磚家」。1984年,伯克利的心理學家Philip Tetlock做了一個影響深遠的研究。他調查284個專門以預測政治經濟趨勢為職業的政治學家、智囊和外交官,向他們提出各種預測問題,比如說戈爾巴喬夫有沒有可能被政變搞下台。Tetlock要求專家們對其中大多數問題,比如某個國家的未來政治自由狀況,提供出現三種可能性(保持現狀,加強或者減弱)的大致概率。這個研究做了二十年,一直等到當年預測的事情全部水落石出。到2003年,Tetlock總結了這些專家給的答案,發現他們的總成績還不如索性把每個問題的三種可能性都均等的設為33%。也就是說,專家的預測水平還比不上直接拋硬幣。更有諷刺意味的是,這些專家對自己專業領域的預測得分居然比在自己專業外領域更差。

所以《紐約人》雜誌在評論Tetlock描寫自己此項研究的《政治專家可靠麼?》( Expert Political Judgement: How Good Is It? How Can We Know? )這本書的時候對專家相當悲觀,最後得出的結論居然是我們還是自己思考算了 – 儘管Tetlock的研究顯示專家的得分其實還是比普通人略高一點。

但社會科學並非無路可走,它可能正處在一個大發展的前夜。哥倫比亞大學Duncan Watts的新書《什麼都是顯然的–如果你知道答案的話》(Everything Is Obvious* Once You Know the Answer)提出,社會科學的發展方向應該是像硬科學一樣,依靠實驗和數據。傳統專家的預測之所以不行,是因為他們依賴的很多直觀「常識」,其實是一廂情願的想當然。事實上,哪怕一個最簡陋的統計模型,也能比專家預測得更好。Watts 這個說法當然並不新,已經有越來越多的人呼籲把數理方法作為社會科學研究的主要方法,而且這個方法也的確正在成為主流,現在大概已經很少有人在論文裡拿一百年前的所謂經典說事了。此書的最大新意在於,因為Watts同時在Yahoo!研究院研究社交網絡,他在書中描述了幾個其本人參與的有趣研究。

談起社交網絡,中國讀者會立即想到格拉德維爾(Malcolm Gladwell)的《引爆流行》(The Tipping Point)。這本書提出,一件東西要想在人群中流行開來,需要某些特別有影響力的關鍵人物在其中推波助瀾。這些關鍵人物是社交網絡中的節點,是普羅大眾中的意見領袖,正是因為他們的存在我們才可能實現把地球上任意兩個人用不多於六個人相互聯繫起來,也就是所謂「六度分隔」。根據這個理論,擴大知名度的最好辦法是找名人做廣告。名人在微博上說一句話,應該比普通人的「口碑」重要得多。有傳聞說現在中國有百萬粉絲的名人發一條營銷微博可以獲得一千元,其實這個數字還算是少的。美國女星Kim Kardashian一條tweet的價格是一萬美元。

「關鍵人物」理論完美符合人們的思維常識。我們總是強調偉人對歷史的推動,強調「一小撮」壞分子對社會秩序的破壞,強調明星對時尚潮流的引領。問題是,這個理論沒有獲得大規模統計實驗的支持。

在現實生活中統計影響力非常困難,因為我們很難測量一個人是被誰影響的。現在微博客Twitter的出現給這種測量提供了可能。Twitter的一個特別有利於研究的特點是,如果用戶分享一個網址,這個網址的URL會被縮短,自動形成一個唯一的代碼。通過跟蹤這些短代碼,Watts與合作者就可以分析信息如何在Twitter上擴散傳播。具體說來,就是如果有人發佈了這麼一條代碼,而他的一個「粉絲」如果轉發這條代碼的話,那麼這次轉發就可以被視為一次可觀測的影響。廣告商的願望,是希望信息能夠這樣被一層接一層的轉發傳播開來,形成所謂「Twitter瀑布」。然而通過分析2009年兩個月之內160萬用戶的七千四百萬條信息鏈,研究人員發現98%的信息根本就沒有被推廣傳播。在這千萬條信息中只有幾十條被轉發超過千次,而轉發次數達到萬次以上的只有一兩條!我們平時看到的那些被反覆轉發的消息其實是特例中的特例。由此可見想要通過微博成名,就好像買彩票中頭獎一樣困難。

那麼名人的影響力到底怎麼樣呢?Watts等人使用了一個巧妙辦法。他們使用統計模型根據第一個月的數據把那些粉絲眾多,並且成功引發了Twitter瀑布的「關鍵人物」挑出來,然後看他們在第二個月中的表現。結果相當出人意料:這些人在第二個月再次引發瀑布的可能性相當的隨機。平均而言,「名人」的確比一般人更容易導致一條消息被廣泛傳播,但這個能力的實際效果起伏極大,一點都不可靠。也許最好的營銷方式不是拿大價錢請少數名人,而是批量僱傭有一般影響力的人。

如果一個東西突然流行開來,我們的常識思維總是以為這個東西一定有特別出類拔萃之處,或者就是其幕後一定有推手。但Twitter上的研究表明所謂幕後推手其實並沒有那麼厲害。那麼為什麼某些書能夠暢銷,某些電影能夠賣座,某些音樂能夠上榜呢?完全是因為它們出類拔萃麼?Watts參與的另一項研究表明,成功很可能主要是因為……運氣。

這是一個相當有名的實驗。實驗者創辦了一個叫做Music Lab的網站,在幾周之內招募到一萬四千名受試者來給48首歌曲評分,如果他們願意,也可以下載其中的歌曲。有些受試者的評分是完全獨立的,他們只能看到歌曲的名字。而其餘受試者則被分為八個組,他們可以看到每首歌被自己所在組的其他受試者下載的次數 – 他們可能會設想被下載次數越多的歌曲越好聽,這樣一來他們打分就會受到社會影響的左右。

實驗表明那些好歌,也就是在獨立組獲得高分的歌曲,在社會影響組也是好歌,而且其流行程度比在獨立組更高;而壞歌在社會影響組的表現也更差。所以當聽眾能夠被彼此的選擇影響的時候,流行的東西就會變得更加流行,出現勝者通吃的局面。然而這個實驗最重要的結果是,具體哪首歌能夠登上排行榜的最前列,則是非常偶然的事件。有些歌曲可能會因為實驗初期純粹偶然地獲得更多下載次數,後來的受試者受這個影響就會以為這首歌好聽,以至於給予它更多的關注,形成正反饋。最初的運氣很大程度上決定了最後誰能脫穎而出。獨立組僅獲第26名的一首歌,在一個社會影響組居然排第一,而在另一個社會影響組則排第14名。儘管特別不好的歌肯定不能流行,但好歌想要流行還是需要很大的運氣成分。總體來說,獨立組排名前五的歌曲只有50%的可能性在社會影響組也進前五。

對能夠互相影響的一群人,不能以常理度之。撒切爾夫人曾經說,「根本就沒有社會這種東西。只有作為個人的男人和女人,以及他們的家庭。」可是你不能用研究一個人的辦法來研究一群人。就算你能理解這群人中的每個人,你也未必能理解把這群人放在一起會發生什麼。他們之間的社交網絡結構,會導致一些非常偶然的事情發生,這些事情無法用任何常識去預測。一般人的歷史觀總是有意無意的把一個集團,比如說清廷,想像成一個有思想有行動的個人,好像辛亥革命就是清廷,孫中山和袁世凱三個人之間的事一樣。這樣的理論無法解釋為什麼孫黃數次起義數次失敗,最後居然在一個完全想不到的時機成功了。

我們生活在一個彼此互相影響的社會。我們想起來去聽一首歌,也許只不過因為朋友的推薦。我們想起來去看某個電影,也許只不過因為我們恰好在微博上跟隨某人。旭日陽剛可能的確唱的不錯,但在某個平行宇宙裡他們將不會登上春晚舞台。如果歷史重演一遍,芙蓉姐姐、周迅甚至李谷一都未必能成名,《哈利波特》的第一集未必能獲得出版。我們總是習慣於把事情的成敗歸結為人的素質,歸結為領袖人物,甚至歸結為陰謀論,好像什麼都是注定的一樣,而事實卻是很多事情只不過是偶然而已。

常識只是特別善於在事後「解釋」事件,這種解釋根本談不上真正的理解。十月革命爆發了,我們就說俄國局勢導致革命必然要爆發,可是革命之前有誰能這麼肯定呢?中國女籃以三分優勢擊敗韓國取得奧運參賽權,賽後總結自然全是成功經驗,可是如果中國隊最後幾個球偶然沒投進,媒體上必然又全是失敗的反思。我們看這些事後的經驗總結或者反思,總是覺得它們說的都挺有道理,簡直是常識。專家們也正是根據這些道理去預測未來。可是事先你怎麼就不知道這些完全相反的道理哪個會起作用呢?

比如如果有人說來自農村的士兵會比城市士兵更適合部隊生活,讀者很可能會認為這是顯然的 – 農村本來條件就比較艱苦,需要更多的體力勞動,所以農村士兵肯定更能適應部隊。然而據社會學家Paul Lazarsfeld對二戰期間美軍的調查,事實恰恰相反。其實是城市士兵更適應部隊生活,因為他們更習慣於擁擠、合作、命令、嚴格的衣著規定和社會禮儀。這兩方面的常識看上去都有道理,在沒有統計的情況下我們根本不知道哪個更重要。這就是為什麼不做調查研究就沒有發言權。

要想從複雜的隨機事件中看到真正的規律,最好的辦法是像搞自然科學一樣進行大規模的重複實驗。如果中國女籃跟韓國隊在同樣的條件下打100次能贏95次,我們就可以確信中國隊強於韓國隊。如果一首歌能在每一個社會影響組都進前五名,我們就可以確信這首歌的素質的確出眾。然而歷史不能重複,我們不知道最後發生的結局是不是一個小概率事件,但我們卻總能用「常識」給這個結局一個解釋!像這樣的解釋如果用於預測未來,甚至制定計劃,怎麼可能不失敗呢?一個更實用的歷史觀是放棄「一切都是注定的」這個思想,把歷史事件當成眾多可能性中的一種,把未來當成一個概率分佈,然後盡可能地使用統計方法,通過歷史數據去計算未來事件的概率。與其追求用各種想當然的常識指導未來,不如把歷史當做一個數據庫,從中發掘統計規律。

搞自然科學的科學家經常認為社會科學更簡單。如果你看那些社會科學的論文,會發現其中邏輯通俗易懂,結論往往也是顯然的。物理學經常能得出一些違反直覺而又絕對正確的結論,然而社會科學中常識卻總能大行其道。現在這種局面正在改觀,自然科學的方法正在被引進到社會科學中去。但這個過程並不容易。亨廷頓曾經在某項研究中頗有科學精神地寫道「62個國家的社會挫折和不穩定之間的相關係數是0.5」,然後一個數學教授跳出來說這純屬胡扯,「亨廷頓是怎麼測量社會挫折的?難道他有一個社會挫折表麼?」其實像這樣的批評也許只不過說明社會科學比自然科學更難做。

在沒有互聯網的年代想要找幾萬人做歌曲評分實驗,或者分析成百上千萬的社交網絡和信息傳播,都是根本不可能的事情。現在有了互聯網,社會科學終於可以帶給我們一些「不顯然」的研究結果了。所以社會學家已經在使用新方法搞科研,遺憾的是實用專家們仍然停留在過去的理論上。一個原因也許是統計方法還沒有來得及作出更多有實用價值的判斷。但不論如何,正如Watts所說,現在社會科學已經有了自己的天文望遠鏡,就等開普勒出來總結行星運動三大定律了。

————

幾點說明:

1. 此文中關鍵事實,凡是沒有直接標明出處或給出鏈接的,一律來自這本書。以後寫書評也是如此,不再註明。

2. 我曾經在《分析 Facebook 上的兩場捐款戰》一文中使用過「關鍵人物理論」,並且以此對比中國用戶的捐款數據,得出結論是中國用戶對網絡的使用習慣還停留在論壇時代。而當時數據的確顯示有些人是有一定的影響力的。現在看來這兩篇文章似乎有點矛盾,但數據也許並不矛盾。「影響力」肯定是存在的,但也許並沒有人們事先設想的那麼強。另一方面,這個捐款「實驗」也可以作為對本文提到的url轉發統計的一個很好的補充。

3. 我覺得新浪微博可能比 Twitter 更容易用來進行社交網絡研究。首先轉發次數是明擺著的,其次也許用戶量更大,另外新浪這種明星體制也許會導致整個網絡結構跟 Twitter 很不同。不論如何,希望能看到有人對新浪微博進行類似的大規模統計分析!

本篇文章已被 徐元直 於 Dec 12 2011, 16:10 編輯過


--------------------
......
PMEmail Poster
Top
0 位使用者正在閱讀本主題 (0 位訪客及 0 位匿名使用者)
0 位會員:

Topic Options Reply to this topicStart new topicStart Poll

 



[ Script Execution time: 0.0176 ]   [ 13 queries used ]   [ GZIP 啟用 ]