短視頻、短信息時(shí)代蒸蒸日上，改變了公眾話(huà)語(yǔ)的內(nèi)容和意義，政治、宗教、教育、體育、商業(yè)和任何其他公共領(lǐng)域的內(nèi)容，都逐漸以“短娛樂(lè)”的形式出現(xiàn)，并成為一種文化習(xí)慣。

然而這種容易傳播的短視頻、短信息，大量參雜著真話(huà)和謬誤。

基思·斯坦諾維奇說(shuō)，偽科學(xué)的傳播所導(dǎo)致的代價(jià)是巨大的。如何在錯(cuò)綜復(fù)雜的信息上面，去偽存真，幫助自己剖析判定，須要我們有一定的思辨能力，去辨識(shí)信息中的垃圾信息。

一、如何辨識(shí)垃圾信息？1.大話(huà)、空話(huà)；讓人不知所云

在抒發(fā)中使用一堆假大空的詞匯，每位詞你都認(rèn)識(shí)，組合在一起也如同說(shuō)得都對(duì)，并且就是不曉得對(duì)方在說(shuō)哪些。例如各類(lèi)黑話(huà)手冊(cè)：

并不是說(shuō)只要有這種詞匯，就是垃圾信息。而是抒發(fā)者通過(guò)一頓組合測(cè)量平均速度實(shí)驗(yàn)反思，讓你不曉得所云，只有套話(huà)的，肯定是垃圾信息。諸如：

此次我們要以?xún)r(jià)錢(qián)為契機(jī)，縱向打通品類(lèi)覆蓋，還要增強(qiáng)內(nèi)容可復(fù)制性，重視投放顆粒度，覆蓋消費(fèi)升級(jí)到下沉市場(chǎng)的全域流量，加碼打出一套組合拳。

看完以后，一臉問(wèn)號(hào)，他在說(shuō)啥？

向飆說(shuō)：“社會(huì)生活里有好多問(wèn)題都是老問(wèn)題，一定要把老問(wèn)題吃透。不要制造新的詞匯，沒(méi)有太大的意思”。

2.缺位的信息

之前文章《如何正確讀數(shù)和更優(yōu)決策》，講了一個(gè)關(guān)于缺位數(shù)據(jù)做決策的故事。賽車(chē)隊(duì)成員須要決定是否要參與一場(chǎng)重要的球賽。根據(jù)之前的經(jīng)驗(yàn)，24場(chǎng)聯(lián)賽中有7場(chǎng)車(chē)輛引擎出現(xiàn)故障，故障情況和天氣濕度之間的關(guān)系如右圖：

圖片來(lái)始于《成長(zhǎng)邊界》

團(tuán)隊(duì)上面大部份人的判定都是要參賽。并且當(dāng)我們把缺位的賽事數(shù)據(jù)補(bǔ)足時(shí)，我們看見(jiàn)：

圖片來(lái)始于《成長(zhǎng)邊界》

40華氏度引擎出問(wèn)題的機(jī)率很高，參賽的結(jié)果可想而知。賽車(chē)隊(duì)故事背后是NASA真實(shí)的案例。1986年，在一次灰熊發(fā)射風(fēng)波中，NASA的高層基于部份數(shù)據(jù)，對(duì)于密封湖人推進(jìn)器一個(gè)聯(lián)接處的O型圈失效可能性作出了判別。最終結(jié)果是，劇烈燃燒的二氧化碳直接從聯(lián)接處沖向外部，“挑戰(zhàn)者號(hào)”在升空73秒后就爆燃了，7位宇航員全部遇難。

當(dāng)有人和你揭示數(shù)據(jù)和觀點(diǎn)的時(shí)侯，你可以思索以下幾個(gè)問(wèn)題：

3.錯(cuò)把關(guān)聯(lián)當(dāng)因果

還有一類(lèi)常常被你們弄錯(cuò)的是，誤把關(guān)聯(lián)關(guān)系當(dāng)做因果關(guān)系。

多年前，日本地區(qū)有一個(gè)研究表明，家用家電的數(shù)目和避孕工具的使用最相關(guān)。并且你應(yīng)當(dāng)不會(huì)有這樣的看法，在小學(xué)領(lǐng)取免費(fèi)的烤爐以解決青年早孕的問(wèn)題。由于這兩個(gè)變量存在相關(guān)，并且沒(méi)有因果關(guān)系。

例如你發(fā)覺(jué)車(chē)輛兒童坐椅銷(xiāo)量變高，同時(shí)小孩出生數(shù)目也在變高，是一個(gè)正相關(guān)的關(guān)系。并且不能說(shuō)，由于兒童坐椅銷(xiāo)量變高了，所以造成新生兒出生率變高。這是邏輯是謬誤。

造成兩個(gè)變量之間形成欺騙性關(guān)聯(lián)的第三變量，有時(shí)侯很容易看下來(lái)。例如，披薩賣(mài)得越多，落水就越多。是由于吃披薩的人好多，游泳的人也好多，所以落水的人才好多。

我們?cè)谘芯恳粋€(gè)現(xiàn)象的時(shí)侯，會(huì)帶著自己的預(yù)設(shè)偏見(jiàn)理解為，兩個(gè)相關(guān)誘因是因果關(guān)系。而相關(guān)關(guān)系之所以形成，可能是由于這兩個(gè)變量都與某個(gè)甚至仍未被檢測(cè)的第三變量相關(guān)。

讀數(shù)據(jù)的時(shí)侯，當(dāng)我們聽(tīng)到相關(guān)關(guān)系，須要繼續(xù)提問(wèn)或則反省，背后的緣由是哪些，是否還有其他可能性。

4.當(dāng)心平均值和中位數(shù)

平均數(shù)代表一個(gè)樣本的平均水平。并且當(dāng)你在查看平均值的時(shí)侯要留心，樣本上面是否有極值（極大值，極小值這種），倘若有的話(huà)，平均值都會(huì)不準(zhǔn)。據(jù)悉，假如你的樣本小，也容易形成更多極端的值。這個(gè)時(shí)侯用中位數(shù)更合適。如右圖：

測(cè)量平均速度實(shí)驗(yàn)感受_測(cè)量平均速度實(shí)驗(yàn)反思_平均測(cè)量反思實(shí)驗(yàn)速度的方法

圖片來(lái)始于B站公開(kāi)課程

5.正確理解p值

哪些是p值？

我們來(lái)說(shuō)一個(gè)故事。假定你是一個(gè)律師，如今法院要審判一起殺人案件，而你的辯護(hù)人被指認(rèn)謀殺。并且案發(fā)時(shí)，你當(dāng)事人在面包房上面做面包，并不在案發(fā)覺(jué)場(chǎng)。如今你要為他辯護(hù)。

庭上法院掏出DNA檢查報(bào)告表明，案發(fā)覺(jué)場(chǎng)兇器上的DNA和你當(dāng)事人DNA完全吻合。所以你的當(dāng)事人才被指認(rèn)。

作為律師你說(shuō)，“等一等，法院你確定DNA匹配不是巧合？”

法院說(shuō)，“當(dāng)然，DNA匹配機(jī)率是百萬(wàn)分之一。你的當(dāng)事人是嫌犯無(wú)疑。”

你說(shuō)，“別急，我們來(lái)畫(huà)一個(gè)圖。百萬(wàn)分之一的可能性抒發(fā)的是所有人群上面，錯(cuò)誤辨識(shí)的可能性。并且我們這兒應(yīng)當(dāng)要看的是，辨識(shí)下來(lái)的結(jié)果上面，被誤辨識(shí)的可能性。”

圖片來(lái)始于B站公開(kāi)課程

“雖然對(duì)于整體樣本來(lái)說(shuō)，檢錯(cuò)機(jī)率很低，為百萬(wàn)分之一。并且在判定為主謀的結(jié)果里，總共5個(gè)人，只有1個(gè)是真正的主謀，其他4個(gè)都是錯(cuò)判，只有20%的正確率。沒(méi)有辦法判定我當(dāng)事人就是主謀。”

這則小故事告訴你不能絕對(duì)相信p值。由于p值不是拿來(lái)告訴你假定的正確性的。而是拿來(lái)告訴你，在整個(gè)群體中檢查錯(cuò)誤的可能性有多大。

所以對(duì)于一個(gè)很低的p值，不要覺(jué)得這事就肯定創(chuàng)立了。

6.欺騙性座標(biāo)軸（axes）

數(shù)據(jù)可視化可以減少看數(shù)據(jù)的難度，并且在數(shù)據(jù)以圖表的形式呈現(xiàn)下來(lái)以后，我們也須要去關(guān)注一些細(xì)節(jié)。由于圖表會(huì)給出一些誘導(dǎo)性的抒發(fā)形式，影響我們判別。例如欺騙性座標(biāo)軸（axes）。

以右圖為例，作者給你看的圖是這樣的，我們會(huì)快速覺(jué)得，yes和no的比列是5/5開(kāi)。并且細(xì)看我們會(huì)發(fā)覺(jué)，這兩個(gè)分類(lèi)一側(cè)的y軸并不一樣，根本不是5/5開(kāi)的關(guān)系。

圖片來(lái)始于B站公開(kāi)課程

7.操作箱規(guī)格

圖表也可以操控每位袋子的規(guī)格大小來(lái)抒發(fā)他想要的意思。例如下文是華爾街一篇臭名昭著的報(bào)導(dǎo)。這張圖乍一看中間部份的y值最大。

圖片來(lái)始于B站公開(kāi)課程

然而當(dāng)我們放大橫坐標(biāo)的時(shí)侯仔細(xì)一看，會(huì)發(fā)覺(jué)，橫座標(biāo)根本不是等分的。從最開(kāi)始的每5k一個(gè)間隔，到前面5百萬(wàn)一個(gè)單位。

圖片來(lái)始于B站公開(kāi)課程

8.過(guò)度裝潢

過(guò)度裝潢的圖被叫做dataducks。ducks本意是用在建筑領(lǐng)域指過(guò)度裝潢的建筑。圖表也是這么測(cè)量平均速度實(shí)驗(yàn)反思，好的圖表不要過(guò)度裝潢，過(guò)度裝潢反倒會(huì)喪失了他原本想要抒發(fā)的內(nèi)容。由于ducks會(huì)妨礙信息的交流。

測(cè)量平均速度實(shí)驗(yàn)反思_平均測(cè)量反思實(shí)驗(yàn)速度的方法_測(cè)量平均速度實(shí)驗(yàn)感受

（假新聞&過(guò)度裝潢）圖片來(lái)始于B站公開(kāi)課程

（畫(huà)個(gè)人形，讀數(shù)反倒顯得很困難）圖片來(lái)始于B站公開(kāi)課程

（視覺(jué)注意力都被大披薩和蘇打水奪走了）圖片來(lái)始于B站公開(kāi)課程

（用嘴型來(lái)抒發(fā)家庭的財(cái)務(wù)安全度）圖片來(lái)始于B站公開(kāi)課程

（非要用圍欄抒發(fā)房子價(jià)錢(qián)，讓人看不懂）圖片來(lái)始于B站公開(kāi)課程

（過(guò)度裝潢&欺騙性座標(biāo)軸）圖片來(lái)始于B站公開(kāi)課程

9.科學(xué)的可復(fù)制和可重復(fù)性

?你看見(jiàn)的信息能夠被復(fù)制和重復(fù)，這也是推論是否科學(xué)的一個(gè)重要判定誘因。要將一個(gè)研究發(fā)覺(jué)認(rèn)定為確鑿的科學(xué)事實(shí)，它的可重復(fù)性至關(guān)重要。由于科學(xué)理論的一個(gè)重要定義就是可證偽性。

可證偽性標(biāo)準(zhǔn)申明，一個(gè)理論要有用，對(duì)其所做的預(yù)測(cè)必須是具體的。它在告訴我們什么事情會(huì)發(fā)生的同時(shí)，必須強(qiáng)調(diào)什么事情不會(huì)發(fā)生。若果不會(huì)發(fā)生的事情確實(shí)發(fā)生了，我們就得到了一個(gè)明晰的訊號(hào)，這個(gè)理論有問(wèn)題。

越具體的預(yù)測(cè)在被否認(rèn)后，給我們的打動(dòng)越大。預(yù)測(cè)越具體，越精確，有可能證偽它的觀察現(xiàn)象就越多。

只有當(dāng)一個(gè)理論并不企圖預(yù)知一切，而是作出具體的預(yù)測(cè)，提早告訴我們世界上會(huì)發(fā)生哪些具體的事情時(shí)，該理論才能進(jìn)步。

所以偽科學(xué)/信息的另外一個(gè)特點(diǎn)就是不可證偽。不管如何解釋它，都對(duì)的。

這種不可證偽理論有著巨大心理吸引力，其奧秘在于它們解釋一切的能力。預(yù)先曉得無(wú)論發(fā)生哪些，你都能理解它，除了給你一種把握知識(shí)的覺(jué)得，并且更重要的是，給你應(yīng)對(duì)這個(gè)世界所須要的情緒上的安全感。

然而這些安全感是以知識(shí)發(fā)展的停滯為代價(jià)的。例如我們經(jīng)常癡迷的占卜、星座解釋、通靈術(shù)等。

二、最后

Pink說(shuō)過(guò)：活著好過(guò)死亡，健康好過(guò)癌癥，富足好過(guò)短缺，自由好過(guò)脅迫，幸福好過(guò)苦難，知識(shí)好過(guò)迷信和無(wú)知。

在這個(gè)不確定性極高的后疫情時(shí)代，多多提升自己對(duì)信息的分辨能力，更好的生活，從指責(zé)垃圾信息開(kāi)始。

參考資料：

《大數(shù)據(jù)時(shí)代，怎樣辨識(shí)》，

《The》2020on,

《成長(zhǎng)邊界》

《這就是心理學(xué)》

#專(zhuān)欄畫(huà)家#

久久天天躁狠狠躁夜夜躁,国产精品入口福利,97久久精品人人爽人人爽蜜臀 ,中文字幕国产精品一区二区

當(dāng)前位置首頁(yè) > 教育資訊

大數(shù)據(jù)時(shí)代下，怎樣辨識(shí)垃圾信息？

發(fā)表評(píng)論