人类真的正在变笨吗?
日期:2025-11-28 19:48:59 / 人气:3

人类真的正在变笨吗?答案是肯定的。
曾经,人类的智力水平在持续上升,这就是著名的“弗林效应”(Flynn Effect):20世纪以来,全球智商(IQ)测试分数每十年上升大约3分。原因很清楚:教育质量提升、营养改善、媒体普及、工作方式从体力转向脑力……
现代生活在不知不觉中“升级”了我们的思维方式。人类学会从具体走向抽象,从经验走向逻辑,从“狗追兔子”变成“它们是哺乳动物”。
但现在,研究发现这一趋势正在逆转。最新数据显示,美国人在流体智力(应变能力)、图形推理和语言推理方面的测试成绩正在下降,尤其在年轻人群体中更为显著。这不仅仅是教育或疫情的问题,而是我们好像大抵确实变“笨”了。
很多人第一反应是:是不是手机和互联网毁了我们的大脑?但问题恐怕更复杂。今天的信息环境对人类认知的挑战,远超以往。
我们的祖先每天只需要处理几十个熟人的信息,而今天,我们每小时都在接收成百上千个陌生人分享的观点、情绪和冲突。社交媒体、算法推荐、短视频、播客、评论区……把每个人都变成了信息生产者,也变成了他人的“信息污染源”。
我们进入了一个“连接即干扰”的时代。
人类从未设计来应对这种“信息无限量供应”的状态。过去,愚蠢往往是局部现象,但今天,每一个荒谬的想法都可以在全球范围内迅速传播、复制、放大。
而我们看到的信息,往往不是原始知识,而是“压缩版”:“二手轶事+主观解读+一条评论+一张图表+一个梗”,层层简化,最终只剩“情绪快感”。
讽刺的是,大语言模型也开始出现类似的问题。如果它们反复学习自己或其他模型生成的内容,准确性、逻辑性和创造力都会退化——这一过程被称为“模型崩塌”。
人类社会,或许也正在经历某种“认知崩塌”:我们不断摄入由他人观点构成的“认知二手烟”,最终迷失在信息的回声中。
然而,真正潜藏的更深层次的问题是:我们生活在一个不再奖励“思考”的世界或系统里。
曾经,认知能力是一种社会资本。深度、理性、抽象推理是你进入精英阶层的门票。而现在,整个社会的价值体系正在逆转:
拥有知识不如拥有话题感;
解读问题不如制造“情绪共鸣”;
逻辑分析被视为“钻牛角尖”,而“懂 vibe(氛围)”才显得进步。
AI 正在蚕食高端脑力劳动,从初级程序员到金融分析师、医生、律师都不再“铁饭碗”;高校研究岗位减少,终身教职难求;知识型表达被视为“精英主义”;播客、TikTok、梗图制造者成了时代的意见领袖。
社会正系统性地把奖励从“深度思考”转向“煽动情绪”。
于是我们越来越少地追问“为什么”,越来越多地说“就是这样”;我们不再尝试理解复杂系统,而是渴望一句总结、一个金句、一个“氛围感”。
过去的媒体让我们看到一个比我们自己更大的世界;今天的媒体只让我们沉浸在自己喜欢的回音室中。世界没有变简单,但我们越来越希望它是简单的。
从“人人有话说”到“人人都在说废话”,信息的民主化也许正在反过来稀释人类的智力分布。不是我们的思维系统被降级了,而是我们关掉了自己的防火墙。
在这个喧嚣、浮躁、AI 泛滥的时代,还有人坚持“用脑子”吗?
有,而且他们通常是这个世界的赢家。
《华尔街日报》发表了一篇独家报道,揭秘了查理·芒格人生日子的生活片段。据芒格的一个亲戚回忆说,“直到他离世那天,他的大脑都在转个不停。他从未停止学习。”
不仅如此,在去世前的一年里,芒格还靠押注一个自己60年来一直回避的“冷门”行业,赚了5000多万美元。
几十年来,芒格几乎从不看煤炭股票,但到了2023年,这些公司引起了他的兴趣。虽然煤炭使用处于长期下降趋势,投资者对行业前景极度悲观。
芒格向朋友们解释,随着全球能源需求增长,煤炭仍是不可或缺的能源。他看了一篇说煤炭行业完蛋了的文章,斥之为胡说八道。
2023年5月,芒格买入了Consol Energy(康索尔能源)的股票。年底,他又买入了Alpha Metallurgical Resources(阿尔法冶金资源)的股票。到芒格去世时,Consol的股价已经翻倍,Alpha也大幅上涨。据朋友说,他账面盈利超过5000万美元。
芒格最后的故事,告诉我们一个朴素的真相: 在这个 AI 能够以毫秒级速度生成平庸答案的时代,“深度思考”没有贬值,反而成了最稀缺、最昂贵的奢侈品。
但问题在于,大多数人已经被困在了那个奖励即时多巴胺的系统里。
分享一篇关于愚蠢和变笨的深度长文——《一种关于“变笨”的理论》,作者:Lane Brown(《纽约杂志(New York Magazine)》特稿作者),以下为编译内容:
专家们曾确信,20世纪会让我们变笨。文化与科技以前从未如此快速地重塑日常生活,每一项新发明都引发恐慌,人们担心这些东西会伤害我们脆弱而无助的大脑。
电灯泡、收音机、漫画、电影、电视、摇滚乐、电子游戏、计算器、随点即播的色情片、拨号上网、乔尔·舒马赫(Joel Schumacher)执导的《蝙蝠侠(Batman)》系列,所有这些东西都曾被“合理”地警告为会把我们变成口水横流的白痴。
但测试结果却讲述了一个不同的故事。上世纪30年代,在美国和其他许多发达国家,智商(IQ)测试的平均分数开始稳步上升,每十年大约提高三分。这种增长积累到一个程度,以至于一个平平无奇的2000年“蠢蛋”,在纸面上看起来也像个比大萧条时期的祖先更聪明的天才。
这个现象被称为“弗林效应(Flynn Effect)”,以发现该现象的社会科学家詹姆斯·弗林(James Flynn)命名,他在1980年代首次提出这一概念。
由于这种跃升仅在几代人之间发生,弗林排除了遗传因素。进化变化需要数十万年,而1900年与2000年的人类在“硬件”上是一样的。
弗林认为,变的是“软件”,由现代生活本身推送到人类集体大脑中的一次“系统更新”。更好的教育让学生学会假设推理,而不仅仅是死记硬背;办公室和工厂工作要求员工处理的是“观念”,而非实物;大众媒体则让观众接触到陌生的地点与视角。
人们在分类、概括和跳出日常经验进行思考的能力上得到了提升,而这些正是智商测试所评估的基本技能之一。弗林常用一个例子来说明这种从“字面理解”到“抽象思维”的转变:一个世纪前,如果你问人狗和兔子有什么共同点,他们可能会说:“狗会猎兔”,而不是“它们都是哺乳动物”。
或许,我们所担心的那些噪音和新奇事物,不仅没有腐蚀我们的思维,反而是在升级它。(一些研究还指出,更好的营养和铅暴露减少也可能是因素之一。)
总之,弗林效应持续了这么久,横跨无数“威胁”,似乎根本没有理由怀疑它会停止,哪怕未来某天,有人发明出能写作业的聊天机器人,或者喜剧演员西奥·冯(Theo Von)开起播客。
伊丽莎白·德沃拉克(Elizabeth Dworak)也是这么想的。她目前是西北大学医学院的助理教授,在2023年完成硕士论文时,她选择研究这个主题。她决定分析2006年至2018年间,美国境内394,378份智商测试结果,看看是否也显示出类似的上升趋势。
“我当时有一大堆认知数据,就想,‘嘿,这里应该有弗林效应的迹象吧。’”她说。但当她跑完数据后,“感觉就像是在电影《别抬头(Don’t Look Up)》里的詹妮弗·劳伦斯(Jennifer Lawrence)——她在片中发现有颗彗星正朝地球飞来。我花了几周重新审查代码,以为自己算错了要延迟提交。但我导师看了说,‘没有错,你算得没问题。’”
她的统计结果显示,三个关键测试项目的分数都在下降:矩阵推理(抽象图形谜题)、字母和数字序列(模式识别)以及语言推理(基于语言的逻辑解题)。其中前两项下降最为严重,而它们主要评估的是心理学家所说的“流体智力(fluid intelligence)”——应对新情境、即兴思考的能力。这些下降出现在所有年龄、性别与受教育程度人群中,但在18至22岁和教育程度最低的人群中最为明显。
德沃拉克知道她的发现意味着什么,但作为科学家,她必须补充一些说明。首先,并非所有项目的分数都在下降。例如,空间推理——即在脑中旋转三维物体的能力——是提升的,这一能力对打《堡垒之夜(Fortnite)》尤为重要。
其次,她所用的数据来自“自愿且无人监考的在线测试”。“这不像SAT考试,有人可能是在公交车上做的测试,”她说,“但我也有将近40万个样本。”第三,也是最重要的一点是:“我们并不能断定人真的变笨了,只能说这些类别的得分下降了。”
智商测试从来都不是衡量智力的精确工具,更像是反映社会所重视的某些思维习惯。其评分标准每十年都会重新校准,统计学家对其含义也始终存在争议,一些人甚至怀疑原始弗林效应和现在的逆转是否仅仅是方法不一致造成的幻象,而非真实的认知变化。
“我后来找了一些该领域非常资深的评审沟通,得到了很棒的反馈,我也得以加入一些重要的细节说明,这样我发表的论文就不会变成标题党。”德沃拉克说,“可等论文一发表,不论是学界还是大众的反应几乎都是:‘哦,智商下降?这不是早就知道了吗?’”
这个世界确实更蠢了,而我们都心知肚明。现在的感觉是,曾经推动我们思维操作系统升级的文化浪潮,已经倒退回了一个更老旧、更多漏洞的版本。
“愚蠢”,就像“智慧”一样,是个模糊的概念,难以准确定义,却又极易在现实中识别。现在的问题不仅是孩子们在标准化考试中惨败(美国大学入学考试 ACT 分数跌至30多年来最低,高中毕业生的数学平均分是自2005年以来的最低水平),也不仅是超过四分之一的美国成年人如今的阅读能力处于最低等级。
而是我们在生活的几乎每个方面,都选择了那些对大脑要求越来越低的做法、娱乐形式,甚至是整套信仰体系。曾经与“无知”挂钩的耻辱感早已消失,如今最响亮的往往是那些最无知的声音,它们主导了社会对话,迫使其他人不得不用他们的语言说话。
比如,有民调显示,选民中约有四分之一属于“低信息选民(low-information voters)”,这类人往往说不出自己选区的代表是谁,获取新闻主要靠网络梗图(memes),但与信息更充分的选民相比,他们反而更容易被说服。这使得他们在关键选举中拥有巨大影响力,只要候选人能用够简单、够煽动的口号打动他们那为数不多的认知基础。
在金融领域,经济基本面已变得无足轻重,投资者采用了类似达达主义(Dada-esque)的非理性逻辑,像玩通灵板(Ouija board)一样操作股市,把钱投向他们认为“最蠢的人群”可能会追捧的方向。
最新的结果是一个几乎没人能正经解释的庞氏结构式人工智能泡沫。而就在不久前,英伟达——人工智能第一概念股的 CEO 黄仁勋被拍到在一家韩式炸鸡餐厅吃饭,结果一堆与此毫无关联的韩式炸鸡公司股价暴涨了 30%。根据当前市场的“逻辑”,这似乎又是完全合理的。
当然,人们很容易把这些现象归咎于疫情。毕竟新冠是一场前所未有的人类压力测试——我们在沙发上度过了几年时光,盯着屏幕,反复感染带有神经系统副作用的病毒,然后茫然地重新走向阳光,发现注意力被腰斩,孩子成绩暴跌,朋友在封锁期间竟都在钻研诸如 5G 或巴氏消毒奶的阴谋论。
但事实上,这场“脑雾”的酝酿已久。趋势早在2020年之前就已成型。
这大概也不是进化的问题。我们并没有陷入《白痴进化论(Idiocracy)》式的情境——即最笨的人生得最多。2018年一项对挪威家庭的研究发现,不仅智商的长期上升在家庭内部可观察到,最近的下降趋势也是如此;孩子的分数与父母相比,是沿着整体趋势变化的。
所以,如果像詹姆斯·弗林所说,20世纪的智商增长是由环境因素导致的,那么如今的下降几乎也肯定是环境造成的。
这些环境因素可能包括教育、营养、家庭结构和经济压力的变化,也可能是一系列潜在的“脑损害暴露因素”的混合——例如微塑料、抗抑郁药、野火烟雾等等。但到了2025年,人们越来越一致地将责任归咎于一样东西:我们口袋里的那台设备。
对大多数人来说,手机既是一个外接硬盘(储存我们曾经用脑记住的一切),又是一台移动拉斯维加斯,让我们从不必忍受哪怕一分钟的无聊。这玩意儿肯定烧坏了我们某些认知电路吧?但在实验室里证明这一点却比想象中困难。
大脑是一个嘈杂、变化巨大的器官,而目前大多数关于它的研究都是观察性研究。2022年,《自然(Nature)》期刊的一项分析发现,过去20年中多数将行为与大脑结构或功能相关联的研究规模都太小,不值得信赖,通常只涉及几十个参与者。要获得可信的结果,样本量至少需要达到几千人。(这并没有阻止各类研究登上耸动头条,比如“智能手机正在重塑我们的脑结构”之类。)
甚至连“社交媒体像毒品、性或赌博一样刺激我们的多巴胺系统”这一广为接受的观点都站不住脚。“我没见过哪怕一项在同一个人身上研究多巴胺水平如何因社交媒体使用而变化的研究,”华盛顿大学医学院(Washington University School of Medicine)研究员斯科特·马雷克(Scott Marek)说,他也是上述2022年《自然》论文的合著者。
但即使手机并没有字面意义上重塑我们的灰质,我们大多数人还是觉得,它一定在某种程度上促成了我们的认知萎缩,因为它让我们远离了那些更具挑战性的精神活动。
这一观点也有数据支持,比如一项近期民调显示,在过去20年中,美国人“因兴趣而阅读”的比例下降了40%。但这个观点也可能稍显自恋——仿佛在 iPhone 诞生前,我们都在课余钻研微积分,或认真阅读《芬尼根的守灵夜(Finnegans Wake)》。如果你细看那项民调,会发现其实2004年也只有28%的美国人表示自己会“因兴趣阅读”,而他们当年最可能读的其实是《达·芬奇密码(The Da Vinci Code)》。
如今关于数字时代导致我们精神萎靡的讨论,很多都还沿用了马歇尔·麦克卢汉(Marshall McLuhan)和尼尔·波兹曼(Neil Postman)的理论——这两位“潮人媒体理论家”在互联网出现前就告诉我们:每一种新媒介都会改变我们的思维方式。
他们的看法没错,只可惜没活够久来警告我们关于视频播客的风险。但他们所处的时代,仅是从书本到电视的温和转变;而后来的变化,比他们所能想象的更加剧烈。结果就是,今天的许多评论仍然把注意力集中在“设备”或“应用”本身,仿佛物理媒介就是全部。
但真正深刻的变化可能不是技术层面的,而是社交层面的:我们如今接入的人类噪声的体量。
或许,我们的“思维软件”并没有被降级,而是我们自己关闭了防火墙。现在,发达国家的每个人都能 Airdrop 式地接收到其他所有人的思想。如果我们真的变笨了,很可能是我们彼此“带笨”的。
人脑大致在1万年前的上旧石器时代末期就演化到了现代形态,那时人类生活在20到50人的部落中,很少与外人接触。我们是被进化编程为处理小群体中的面孔、情绪与八卦的。
即便到了上世纪90年代,大多数人每天也只与亲人、同事、朋友接触,顶多加上电视里的本地新闻主播。而如今,这些旧石器时代的大脑每小时都在被成百上千个陌生人的想法轰炸。现代通讯的各种形式让我们接触到远超处理能力的人类大脑,而我们的心智似乎正在这一负荷下枯萎。
不久前,那些头脑简单的人至少还能安安静静地沉浸在自己的想法中,没什么便捷的方式去传播它们。最糟糕的情况也不过是一个人在自己家人或保龄球队面前出丑。愚蠢的想法不容易传播和复制,大多数的“傻气”都停留在了本地,这也让其他人能更乐观地高估人类的平均智力水平——因为我们很少看到真正的大规模“蠢”。
但现在,我们把全世界的人都连在了一起,给他们每个人都配上了相当于印刷机、电台和电视台的传播工具。即使是那些毫无可说之处的人,也可以随时向全世界传达他们(更常见的情况是)模糊不清的看法。
当然,要说明白一点,这并不是怀念那个“少数人能发声、多数人沉默”的旧世界。对话范围的扩大,在某些方面确实是好事:我们得以听到更多的观点,看到更多的问责,甚至还能刷到“Rizzler”在 TikTok 上的视频。[译注:Rizzler 是一位因“搭讪术”走红网络的 TikToker,象征年轻人文化中社交技能的极致体现]
但问题在于,我们现在可以通过无限刷屏的方式,看到人类思想的完整分布——结果发现,中位数远比我们想象的低得多。理论上说,这是一种“表达的民主化”;可实际上,它更像是一次群众外科手术般的脑叶切除术。
问题不在于某一个设备、平台或网红。你不能仅仅通过退出Instagram 或取消所有新闻订阅来逃避这种影响。我们生活在一个不可避免的现实中:一个巨大的、去中心化的“人类蜂群”正在不断地说话、争论、发表意见,无处不在、无时无刻。如果你想说点什么,或者哪怕只是想弄明白现在发生了什么,你都必须穿越这片汪洋人声。
“媒介即信息(The medium is the message)”这句话仍然成立,但如今的“媒介”,其实就是那片不断喧哗的人群。
也许你觉得这一切早已在悄悄发生,其实确实如此。但最近的某些变化显示:我们已经越过了某个门槛。
今年6月,路透社研究所(Reuters Institute)发布报告称:社交媒体已经成为美国人获取新闻的主要来源,首次超过传统媒体。全球范围内,有17%的人把 TikTok 当作可靠的新闻平台。
而这些数字其实还低估了这一转变的戏剧性以及我们的信息生态系统已变得多么“古怪”。传统媒体的规模日益缩水,被迫躲到付费墙后面;而谷歌、脸书、X(原 Twitter)等平台的推荐机制又让人更难找到这些媒体的内容。就算有人愿意寻找,也常常被信息流中涌现的大量娱乐内容、胡言乱语和各类越来越细分的色情亚文化所冲散。
更别提唐纳德·特朗普总统仍在积极拥抱史蒂夫·班农提出的“用垃圾信息淹没信息空间”战略,即向所有渠道注入干扰信号,并不断加大音量。
在这种噪音中想传递任何有营养的内容,你需要的不是专业知识,也不是独家报道或原创观点,而是——压缩力。
赢家是那些能将复杂现象压缩成最小信息单位的人:
•一位播客主持人转述的“二手轶事”;
•一位TikToker 在23秒内解释地缘政治;
•一条引用截图的引用推文;
•一个Reddit 热门评论;
•一段YouTube 视频,抄袭自那个 Reddit 评论;
•一张图表,somehow 凝练了我们这个时代的全部意义。
我们接触绝大多数信息的第一个触点,已经很少是原始信息本身,而是它经过一连串简化和再解释之后的衍生品。每一层处理都加上一些偏差,每一个平台的跳跃都引入新的误读和“变异”。
作为信息消费者,我们很难逃离这个循环。因为在生存压力下,传统媒体也加入了这场“压缩竞赛”。
现在的新闻更少是“报道”,而更多是“评论报道”,甚至是“评论评论”。原本由“第一手新闻+解读”构成的“新闻金字塔”,如今已经倒转,变成了一个建立在越来越小的事实基座上的“观点塔”。
当然,并不是所有的压缩都是坏事,有些也是必要的。但每一层的压缩与扭曲,都会累积成“系统性失真”。
不妨试试追踪任何一条信息的流转路径——无论是一篇科学论文、一句名人金句,还是一条突发新闻标题,只要它开始在互联网的“肠道”中穿行,你就会看到它的意义如何在过程中被“消化”得支离破碎。
你可以问问德沃拉克(Dworak)。她那篇关于“逆弗林效应(reverse Flynn Effect)”的论文在2023年发表后,被育儿网站 Fatherly 报道。
值得称赞的是,Fatherly 至少努力保留了她所强调的“复杂性”:文章解释说智商下降不一定意味着人变笨了。但文章标题却采用了“好奇心缺口式(curiosity-gap)”风格的迷惑标题:《美国人智商在下降,但这或许不是什么坏事(American IQs Are Dropping. Here’s Why It Might Not Be a Bad Thing)》。
然后呢?德沃拉克说:“塔克·卡尔森(Tucker Carlson,当时还在福克斯新闻)就拿着 Fatherly 的文章做了一期节目。”
结果,观众误以为德沃拉克在主张“智商下降是件好事”,于是她收到了许多指责她“卑劣无耻”的推文。
我们对这种“信息碾压”的现实已经习以为常,以至于如今很多我们“知道”的东西,或者说我们“自以为知道”的知识,其实只是多年积累的“拼凑物(confabulation)”。
我们的集体知识库被“间接智慧”、四手观点、讨好智商的流行社会科学所覆盖——这些东西让我们感觉自己“聪明”,却又不需要真正付出理解的努力。
在这个越来越复杂的世界中,我们用来解释它的比喻却越来越粗糙:
• 任何变糟的过程都叫“屎化(enshittification)”;
• 任何审美趋势都被称为“某某core”;
• 主宰我们生活的广告驱动、数据推动的个性化系统被统称为“算法(the algorithm)”;
• 而那些解释不了的现象?只好说是“氛围(vibes)”。
这些“太长不看(Too Long; Didn’t Read)”式的压缩,很快将被新一波的“垃圾信息”进一步恶化——这些由大语言模型生成的内容,将进一步充斥网络空间。
不过,正是这些技术——即会吞噬海量互联网“废料”并试图“用它来思考”的大语言模型,——也许正给我们提供了一个线索,说明这类信息环境正在如何影响我们自身。
我们还不清楚 LLM 与人脑的相似程度;也许它们唯一的共同点,就是我们对它们的运行机制都无法完全理解。但即便它们的思维方式与人类不同,它们似乎也会像我们一样“退化”。
当AI进化到可以“一句话生成一个世界”,普通人能把握的财富还有什么?
今年,来自德克萨斯大学奥斯汀分校、德州农工大学(Texas A&M)和普渡大学的一个研究团队对 LLM 做了一项实验。他们让模型连续几个月阅读社交媒体上的“低质量推文”,其中包括被分类为“阴谋论、夸张说法、无依据断言”或“缺乏深度思考风格”的内容。
结果表明,这些输入会诱发一种类似“脑腐(brain rot)”的状态。模型表现出更差的推理能力、对长文本的理解下降、道德规范减弱,并出现了新的“社会性不良人格特征”。
它们开始“跳过思考过程”,直接得出结论,却省略了推理的步骤。甚至连代数能力也退化了。该研究的作者之一洪俊元(Junyuan Hong)解释说:“这不是你从推特(Twitter/X)学来的内容,而是它影响了你的结构。”
另一个可能对我们人脑“腐烂”现象有启示的实验,由人工智能安全科学家、前 Google DeepMind 研究员伊利亚·舒马伊洛夫(Ilia Shumailov)主导。他试图弄清,如果 LLM 长期摄取“自己的排泄物”,会发生什么。[译注:此处“排泄物”指 LLM 生成的内容]
舒马伊洛夫思考的是一个AI 研究中的悖论(Catch-22):
LLM 需要大量高质量的人类文本作为训练数据,而 AI 公司通常会无差别地抓取整个互联网进行训练。但现在,越来越多的网络内容本身就是 AI 生成的。据一项统计,截至 2025 年,网络上发布的文章和列表中,有约一半是由聊天机器人撰写的。
这意味着,未来的LLM 将在吸收前代 AI 所产出的“压缩且退化”的知识基础上进行学习;而它们生成的内容,又将继续成为新一代模型的训练素材。随着时间推移,这种“反馈回路”可能会腐蚀原始数据的基础,使得人类思维的痕迹被机器生成的“废话”所稀释。
为了模拟这种情况,舒马伊洛夫进行了一项实验:他让十代LLM 几乎只训练于前一代模型生成的文本上。结果完全不出意料:模型一代比一代更差。
想象你走进一座图书馆,书架上只剩下一群高中生写的读书报告;第二天你再来,只剩下浣熊写的这些报告的总结稿。
舒马伊洛夫发现,这些模型逐渐失去了对原始数据逻辑的理解,每一代都继承并放大了前一代的错误。
随着知识库的“稀薄化”和“扭曲化”,模型开始出现所谓的“过拟合(overfitting)”——这是 AI 术语,指一个模型因过度依赖狭窄的训练内容而丧失泛化能力。就像一个学生死记了练习题的答案,但面对真实考题却无从应对。(2021年一项独立研究指出,人脑也可能像 LLM 一样对日常生活的重复信息产生“过拟合”,导致我们难以处理新情境。而梦境,可能正是自然注入的一种“超现实噪声”,以保持大脑的灵活性。)
最终,这些模型开始输出越来越自信的胡言乱语。
2024年发表的一篇论文中,舒马伊洛夫将这一过程命名为“模型崩塌(model collapse)”,即一个 AI 系统被自己构建的现实投影所“毒化”。
我向舒马伊洛夫提出一个猜想:人类现在是不是也处于一种“模型崩塌”的状态?是不是也在“毒害自己”?
他表示还需要更多数据来判断:“现在的确有更多信息交流发生在网上,但至于这些信息质量是否真的下降,我们需要精确地衡量。因为如果不借助科学方法,我认为这个假设很难成立。”
不过,他也承认,自己的研究在被传播的过程中,确实出现了信息失真。“每个人都有自己的解读,没错,也确实有人误解了我的研究。”
舒马伊洛夫的论文在学术圈里算是“病毒式传播”了——当然,以一篇关于 AI 训练数据污染的学术论文来说,传播范围已经相当不错。它也引发了一些小规模争议。
一些研究者指出,他的实验过于简化:毕竟,现实中人类文本不可能彻底消失,而且大型AI 公司也已经通过过滤 AI 内容、提高高质量数据的权重来预防这一问题。
另一支研究团队后来进行了一项类似实验,但在每一轮训练中都加入了部分原始人类文本数据。结果很明显:这种“轻微注入”足以防止模型崩塌。
所以,对大多数LLM 而言,“模型崩塌”也许更多是一种理论风险,而非现实威胁。但其中的讽刺意味却难以忽视:
那些最警惕垃圾数据污染自己模型的科技公司(如 Google、Meta 和 X),却对它们喂给人类用户的“垃圾”内容毫不在意。
所以,也许我们今天感受到的“集体愚蠢”,其实只是“训练数据的问题”。
20世纪的主流媒介——书籍、电影、电视、报纸,迫使我们投入注意力与想象力。它们让世界看起来更大、更复杂,也激发了我们在抽象推理方面的能力,而这正是智商测试所评估的核心能力。
而今天的媒介则恰恰相反。它们没有拓展我们的世界观,反而将其收缩到以我们为中心的“私人宇宙”之中,并让我们被各种声音围绕,这些声音不断告诉我们:“一切其实都比你想得更简单。”
不过,再想深也没什么用。说到底,现在这个时代,担心这些问题也显得有些过时。整个社会似乎都在主动贬低“智力”的价值。
“我和朋友最近还在开玩笑,说现在‘聪明’已经不性感了,”德沃拉克说,“人们现在更关心的,是你在 Twitch 上有多少订阅者。”
如果说弗林效应(Flynn Effect)在某种程度上反映了社会对抽象、分析、持续专注等思维习惯的激励与奖赏,那么这些奖赏如今正在逐渐消失。
人工智能正在侵蚀高薪的知识型岗位,它已经开始取代初级程序员,医生、律师、银行家等高端职业恐怕也岌岌可危。
学术界的终身教职正在减少,高校纷纷“临聘化”,研究经费不断紧缩。
反精英主义情绪(anti-elitism)使“书呆子气”和专业知识变成了一种政治负担——这对民主党那些模仿奥巴马风格的“教授型候选人”来说,可不是好消息。
再说得现实点:如果你十年前把几百美元投进狗狗币(Dogecoin)而不是标普500指数(S&P 500),现在可能早就退休了。
也许,21世纪正逼着我们去适应另一种“测试”。
尽管我刚才说了那么多,但其实有一个互联网压缩物,可能完美诠释了当下的时代精神:“中智迷因(midwit meme)”。
这是一个三格钟形曲线(bell curve)漫画:
• 最左边是个傻瓜,用一种浅薄却自信的方式说出某个结论;
• 最右边是个宁静的“银河脑”和尚,说出了一种看似相似、但更高级的简单版本;
• 而处在中间的人,则焦虑又吃力地试图用过度解释的方式来驳斥那个最初的说法。
问题是:谁还愿意当那个中间的人呢?
"
作者:杏鑫娱乐
新闻资讯 News
- 科技狂飙下,“我”的定义与边界...11-28
- 疯狂的中介搅热冷门留学市场:10...11-28
- “禁酒令”之下,县城五星级酒店...11-28
- 格伦费尔塔火灾后:社会如何“遗...11-28

