短視頻、短信息時代蒸蒸日上,改變了公眾話語的內容和意義,政治、宗教、教育、體育、商業和任何其他公共領域的內容,都逐漸以“短娛樂”的形式出現,并成為一種文化習慣。
然而這種容易傳播的短視頻、短信息,大量參雜著真話和謬誤。
基思·斯坦諾維奇說,偽科學的傳播所導致的代價是巨大的。如何在錯綜復雜的信息上面,去偽存真,幫助自己剖析判定,須要我們有一定的思辨能力,去辨識信息中的垃圾信息。
一、如何辨識垃圾信息?1.大話、空話;讓人不知所云
在抒發中使用一堆假大空的詞匯,每位詞你都認識,組合在一起也如同說得都對,并且就是不曉得對方在說哪些。例如各類黑話手冊:
并不是說只要有這種詞匯,就是垃圾信息。而是抒發者通過一頓組合測量平均速度實驗反思,讓你不曉得所云,只有套話的,肯定是垃圾信息。諸如:
此次我們要以價錢為契機,縱向打通品類覆蓋,還要增強內容可復制性,重視投放顆粒度,覆蓋消費升級到下沉市場的全域流量,加碼打出一套組合拳。
看完以后,一臉問號,他在說啥?
向飆說:“社會生活里有好多問題都是老問題,一定要把老問題吃透。不要制造新的詞匯,沒有太大的意思”。
2.缺位的信息
之前文章《如何正確讀數和更優決策》,講了一個關于缺位數據做決策的故事。賽車隊成員須要決定是否要參與一場重要的球賽。根據之前的經驗,24場聯賽中有7場車輛引擎出現故障,故障情況和天氣濕度之間的關系如右圖:
圖片來始于《成長邊界》
團隊上面大部份人的判定都是要參賽。并且當我們把缺位的賽事數據補足時,我們看見:
圖片來始于《成長邊界》
40華氏度引擎出問題的機率很高,參賽的結果可想而知。賽車隊故事背后是NASA真實的案例。1986年,在一次灰熊發射風波中,NASA的高層基于部份數據,對于密封湖人推進器一個聯接處的O型圈失效可能性作出了判別。最終結果是,劇烈燃燒的二氧化碳直接從聯接處沖向外部,“挑戰者號”在升空73秒后就爆燃了,7位宇航員全部遇難。
當有人和你揭示數據和觀點的時侯,你可以思索以下幾個問題:
3.錯把關聯當因果
還有一類常常被你們弄錯的是,誤把關聯關系當做因果關系。
多年前,日本地區有一個研究表明,家用家電的數目和避孕工具的使用最相關。并且你應當不會有這樣的看法,在小學領取免費的烤爐以解決青年早孕的問題。由于這兩個變量存在相關,并且沒有因果關系。
例如你發覺車輛兒童坐椅銷量變高,同時小孩出生數目也在變高,是一個正相關的關系。并且不能說,由于兒童坐椅銷量變高了,所以造成新生兒出生率變高。這是邏輯是謬誤。
造成兩個變量之間形成欺騙性關聯的第三變量,有時侯很容易看下來。例如,披薩賣得越多,落水就越多。是由于吃披薩的人好多,游泳的人也好多,所以落水的人才好多。
我們在研究一個現象的時侯,會帶著自己的預設偏見理解為,兩個相關誘因是因果關系。而相關關系之所以形成,可能是由于這兩個變量都與某個甚至仍未被檢測的第三變量相關。
讀數據的時侯,當我們聽到相關關系,須要繼續提問或則反省,背后的緣由是哪些,是否還有其他可能性。
4.當心平均值和中位數
平均數代表一個樣本的平均水平。并且當你在查看平均值的時侯要留心,樣本上面是否有極值(極大值,極小值這種),倘若有的話,平均值都會不準。據悉,假如你的樣本小,也容易形成更多極端的值。這個時侯用中位數更合適。如右圖:
圖片來始于B站公開課程
5.正確理解p值
哪些是p值?
我們來說一個故事。假定你是一個律師,如今法院要審判一起殺人案件,而你的辯護人被指認謀殺。并且案發時,你當事人在面包房上面做面包,并不在案發覺場。如今你要為他辯護。
庭上法院掏出DNA檢查報告表明,案發覺場兇器上的DNA和你當事人DNA完全吻合。所以你的當事人才被指認。
作為律師你說,“等一等,法院你確定DNA匹配不是巧合?”
法院說,“當然,DNA匹配機率是百萬分之一。你的當事人是嫌犯無疑。”
你說,“別急,我們來畫一個圖。百萬分之一的可能性抒發的是所有人群上面,錯誤辨識的可能性。并且我們這兒應當要看的是,辨識下來的結果上面,被誤辨識的可能性。”
圖片來始于B站公開課程
“雖然對于整體樣本來說,檢錯機率很低,為百萬分之一。并且在判定為主謀的結果里,總共5個人,只有1個是真正的主謀,其他4個都是錯判,只有20%的正確率。沒有辦法判定我當事人就是主謀。”
這則小故事告訴你不能絕對相信p值。由于p值不是拿來告訴你假定的正確性的。而是拿來告訴你,在整個群體中檢查錯誤的可能性有多大。
所以對于一個很低的p值,不要覺得這事就肯定創立了。
6.欺騙性座標軸(axes)
數據可視化可以減少看數據的難度,并且在數據以圖表的形式呈現下來以后,我們也須要去關注一些細節。由于圖表會給出一些誘導性的抒發形式,影響我們判別。例如欺騙性座標軸(axes)。
以右圖為例,作者給你看的圖是這樣的,我們會快速覺得,yes和no的比列是5/5開。并且細看我們會發覺,這兩個分類一側的y軸并不一樣,根本不是5/5開的關系。
圖片來始于B站公開課程
7.操作箱規格
圖表也可以操控每位袋子的規格大小來抒發他想要的意思。例如下文是華爾街一篇臭名昭著的報導。這張圖乍一看中間部份的y值最大。
圖片來始于B站公開課程
然而當我們放大橫坐標的時侯仔細一看,會發覺,橫座標根本不是等分的。從最開始的每5k一個間隔,到前面5百萬一個單位。
圖片來始于B站公開課程
8.過度裝潢
過度裝潢的圖被叫做dataducks。ducks本意是用在建筑領域指過度裝潢的建筑。圖表也是這么測量平均速度實驗反思,好的圖表不要過度裝潢,過度裝潢反倒會喪失了他原本想要抒發的內容。由于ducks會妨礙信息的交流。
(假新聞&過度裝潢)圖片來始于B站公開課程
(畫個人形,讀數反倒顯得很困難)圖片來始于B站公開課程
(視覺注意力都被大披薩和蘇打水奪走了)圖片來始于B站公開課程
(用嘴型來抒發家庭的財務安全度)圖片來始于B站公開課程
(非要用圍欄抒發房子價錢,讓人看不懂)圖片來始于B站公開課程
(過度裝潢&欺騙性座標軸)圖片來始于B站公開課程
9.科學的可復制和可重復性
?你看見的信息能夠被復制和重復,這也是推論是否科學的一個重要判定誘因。要將一個研究發覺認定為確鑿的科學事實,它的可重復性至關重要。由于科學理論的一個重要定義就是可證偽性。
可證偽性標準申明,一個理論要有用,對其所做的預測必須是具體的。它在告訴我們什么事情會發生的同時,必須強調什么事情不會發生。若果不會發生的事情確實發生了,我們就得到了一個明晰的訊號,這個理論有問題。
越具體的預測在被否認后,給我們的打動越大。預測越具體,越精確,有可能證偽它的觀察現象就越多。
只有當一個理論并不企圖預知一切,而是作出具體的預測,提早告訴我們世界上會發生哪些具體的事情時,該理論才能進步。
所以偽科學/信息的另外一個特點就是不可證偽。不管如何解釋它,都對的。
這種不可證偽理論有著巨大心理吸引力,其奧秘在于它們解釋一切的能力。預先曉得無論發生哪些,你都能理解它,除了給你一種把握知識的覺得,并且更重要的是,給你應對這個世界所須要的情緒上的安全感。
然而這些安全感是以知識發展的停滯為代價的。例如我們經常癡迷的占卜、星座解釋、通靈術等。
二、最后
Pink說過:活著好過死亡,健康好過癌癥,富足好過短缺,自由好過脅迫,幸福好過苦難,知識好過迷信和無知。
在這個不確定性極高的后疫情時代,多多提升自己對信息的分辨能力,更好的生活,從指責垃圾信息開始。
參考資料:
《大數據時代,怎樣辨識》,
《The》2020on,
《成長邊界》
《這就是心理學》
#專欄畫家#