特斯拉 CEO 埃隆?馬斯克 (Elon Musk) 稱,為了弄清楚推特上的虛假 / 垃圾賬號是否像該公司長期宣稱的那樣低于 5%,他將隨機抽取 100 名粉絲作為研究樣本。然而,社交媒體、虛假信息和統計分析方面的專家表示,馬斯克的分析方法存在嚴重缺陷。
“為了找到答案,我的團隊將隨機抽取 100 名 @twitter 粉絲。我會邀請其他人重復同樣的過程,看看他們會發現什么,”馬斯克在推特中闡明了自己的方法,并補充說,“選擇任何有大量粉絲的賬戶,忽略前 1000 個粉絲,然后每 10 個選擇一個。我愿意接受更好的想法。”
Facebook 聯合創始人達斯汀?莫斯科維茨 (Dustin Moskovitz) 通過自己的推特賬號對這個問題進行了評論。他指出,馬斯克的方法實際上不是隨機的,使用的樣本太少,存在巨大的錯誤空間。“我覺得‘不相信推特團隊會幫忙提取樣本’本身就是個危險信號。”他表示。
華盛頓大學教授卡爾?T?伯格斯特羅姆 (Carl T. Bergstrom) 與人合寫了一本書,幫助人們理解數據,避免被網絡上的虛假言論所欺騙。他表示,對任何一個推特賬戶的 100 名粉絲進行抽樣調查,都不應該成為進行一筆 440 億美元收購的“盡職調查”。
他說,100 人的樣本規模比社交媒體研究人員研究這類事情的標準小了幾個數量級。馬斯克使用這種方法面臨的最大問題將是選擇偏差。“沒有理由相信推特官方賬戶的粉絲是該平臺賬戶的代表性樣本。也許機器人不太可能關注這個賬戶以避免被發現,也許他們更有可能關注以便看起來像是正常賬號。誰知道呢?但我只是無法理解,馬斯克除了用這個愚蠢的抽樣計劃來欺騙我們之外,他還做了什么。”