中读

“狗屁”鉴别指南

作者:陈赛

2020-09-28·阅读时长7分钟

2855人看过

本文需付费阅读

文章共计3769个字,产生50条评论

如您已购买,请登录


卡尔·伯格斯特罗姆(右)和杰文·韦斯特


1914年,牛津大学的哲学教授约翰·亚历山大·史密斯曾经告诉他的学生:“你们今天学的所有这些东西,对于未来将毫无用处。但记住这一点:如果你足够努力而聪慧,你应该能辨别一个人是否在胡扯。在我看来,这是教育的主要(如果不是唯一的)目的。”

胡扯,英文是bullshit,在中文里有很多不同的翻译,根据粗俗的程度不同,可以翻译成“狗屎”“狗屁”“胡扯”“扯淡”等。

在这里,我选择了“狗屁”,就是因为够粗俗,而在应对“狗屁”时,粗俗会有一种特殊的力量。

这话是美国华盛顿大学的两位教授卡尔·伯格斯特罗姆(Carl Bergstrom)和杰文·韦斯特(Jevin West)说的。伯格斯特罗姆是生物学家,而韦斯特是信息科学家。几年前,他们就合作在华盛顿大学开设了一门网络课程叫“在大数据时代抵制狗屁”(YouTube上可以免费观看全部课程)。而且,他们重点抵制的,是一种属于新时代的新型狗屁——数据狗屁。

两位教授说,我们都习惯了语言上的狗屁,对于政客和商家假大空的承诺和宣传伎俩,我们多少都有些经验。但随着这个世界变得越来越量化,越来越多罔顾事实和逻辑的狗屁,被包装在数字、表格、图表、统计模型等视觉化形式里,看上去很科学、很权威、很可信的样子。在这个数据崇拜时代,它们几乎无处不在,新闻报道、科学论文,还有Ted的演讲里都可见到。

在这门课里,他们介绍了很多鉴别狗屁的方法,比如可视化数据常见的误导伎俩、变量的操纵、算法内置的傲慢与偏见等。比如一个预测犯罪行为的算法,被发现有针对少数族裔的偏见,很可能是因为他们用来训练算法的数据本身就存在既定的文化偏见。

他们认为,抵制这种狗屁,并不需要统计学的学位,而是一些常识和思考习惯,比如一点点质疑精神。你要知道,数据是可以造假的。即使不造假,数据经过挑选和操纵,也会把我们引向完全不同的结论。算法是人编写的,又经过数据的训练,必然内置了人的偏见。

全球新冠疫情暴发以来,他们的课变得更受欢迎。因为新冠疫情同时触发了一场信息流行病,社交媒体上充斥着谣言、阴谋论、误解以及政治化的科学辩论。为了在这种信息的泥石流里生存,训练一双鉴别“狗屁”的火眼金睛变得更加重要。

文章作者

陈赛

发表文章232篇 获得20个推荐 粉丝4111人

《三联生活周刊》资深主笔

中读签约作者

收录专栏

中国扶贫的道路选择

昭平 盐池 尉犁 云龙 榕江

19060人订阅

现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里

下载中读APP

全部评论(50)

发评论

作者热门文章

推荐阅读