(原标题:AI"教父"放狠话,大语言模型走不通)
LeCun的顿悟发生在1980年代。 当时他在巴黎高等电工电子工程师学院读书,读到一本书,讲语言学家乔姆斯基和心理学家皮亚杰关于先天和后天的争论。 乔姆斯基认为人类天生就有语言能力,皮亚杰则说虽然有些结构是天生的,但大部分靠学习。 "说这话可能得罪人……但我当时读着就觉得,乔姆斯基说的肯定不对,因为我们什么都是学来的。智能说到底就是学习这回事。" 那个年代,AI研究,或者说神经网络研究,基本是个死领域,被学术圈视为禁区,因为早期技术让人失望透顶。 但LeCun找到了其他研究神经网络的学者,在Geoffrey Hinton这些人身上找到了知音。 后来他以博士后身份加入了Hinton在多伦多大学的团队。 两人和Yoshua Bengio一起,为深度学习和现代AI打了地基。 2018年,三人因此拿到了计算机科学界最高荣誉图灵奖。 服务员端上第二道菜,用法语热情介绍。记者一脸茫然地点头。 "听懂了吗?" LeCun问,然后帮忙翻译:这是鹅肝,这是康泰奶酪舒芙蕾,奶酪陈了18个月。 入乡随俗,记者咬了口鹅肝。 贝尔实验室的好时光
LeCun搞出过一些重要的早期AI技术。 1980年代末到1990年代,他在新泽西的AT&T贝尔实验室当研究员,开发了卷积神经网络,这种架构后来被广泛用在图像识别上。 他把它做成一个系统,被银行拿来读支票。 这个研究的想法在多伦多时就有了,但能真正落地,靠的是贝尔实验室看似花不完的钱和最前沿的技术。 LeCun记得刚加入时,老板Larry Jackel跟他说的话:"他说,知道吗,在贝尔实验室,你不会因为省钱出名。" 主菜上来了,裹着香草面包屑的鳕鱼配炸刺山柑。 LeCun兴致很高,讲起AI研究早年的故事,记者听得入神。 贝尔实验室的好日子没能一直持续。 公司重组,实验室资金大幅缩水,被拆分到不同子公司。 LeCun回到学术界,在纽约大学启动了研究神经网络的新项目,课后常去格林威治村的爵士俱乐部。 到2013年,深度学习明显要成了,图像识别应用效果惊人。 谷歌刚启动Google Brain,一年后收购了英国AI实验室DeepMind。 也是那时候,扎克伯格打来了电话。 Facebook的白板时代
扎克伯格想在Facebook搞个AI部门,为了挖LeCun,把他请到加州家里吃饭。 私人厨师准备了"鸡肉 + 挺不错的白葡萄酒",LeCun回忆道。 LeCun答应加入,但提了三个条件: 不用辞掉纽约大学的工作;不用搬去加州;新实验室的研究成果必须公开。 扎克伯格全答应了。 LeCun就这样加入Facebook,在这家全球最大的科技公司之一建立了专注基础研究的新AI实验室,叫Facebook人工智能研究院(Fair)。 Facebook当时就是"一块有无限授权的白板",LeCun说。"钱肯定不是问题。" 服务员端来甜点,苹果薄饼。"太棒了," LeCun说。 ChatGPT带来的震荡 话题转向更动荡的时期。 2022年初,ChatGPT出现之前,各大AI实验室手里都有类似技术,但基本当实验品看。 结果一个相对不知名的小实验室 OpenAI,悄悄把这技术做成好用的聊天机器人推出来,引爆了今天的AI热潮。 ChatGPT让Meta乱了阵脚。 公司高层决定全力开发Llama,一个大语言模型。 扎克伯格重组了架构,成立生成式AI部门,要加速把研究变成产品,LeCun坚持模型要开放。 Llama 2以开放权重发布,所有人都能免费下载调整。 LeCun说这是个 "分水岭" 时刻,"改变了整个行业"。 这个模型成了强大开放LLM的标杆,走的路线跟谷歌和OpenAI那种权力高度集中的做法完全相反。 Meta一度被看研究里的好人。 去年,Meta在AI上猛踩油门。 扎克伯格给生成式AI部门施加更大压力,要求加速开发和部署,结果导致沟通出了问题。 "我们有很多新想法,真正酷的东西,他们应该去做。但他们就盯着那些已经被验证过的东西,这么搞,只会越落越远。" 年轻的新上司 后面几代Llama表现平平。 2025年4月发布的 Llama 4 砸了,公司被指控操纵测试数据让它看起来更厉害。 LeCun承认 "结果确实被美化了一点",团队在不同测试里用了不同模型来刷分。 "Mark 真的很生气,对参与的所有人都失去了信心。基本上把整个生成式AI组织晾在一边了。很多人已经走了,还没走的估计也会走。" 去年6月,Meta 砸150亿美元投资数据标注公司Scale AI,还聘了它28岁的CEO兼联合创始人Alexandr Wang。 Wang接手了公司在AI上的新赌注和研究部门TBD实验室,负责开发新的前沿AI模型。 Meta 因为试图用1亿美元签约费从竞争对手那里挖顶尖研究员上了新闻。 "这主意好不好,以后就知道了 " LeCun面无表情地说。 LeCun说Wang "年轻","没什么经验"。 "他学得快,知道自己哪里不懂……但没做过研究,不知道研究怎么搞,怎么开展。也不知道什么东西对研究人员有吸引力,什么会让他们反感。" Wang还成了LeCun的上司。 记者问他对这种层级变化怎么看。 他一开始轻描淡写,说习惯跟年轻人共事。" Facebook工程师平均年龄27岁。我是他们年龄的两倍。" 但那些27岁的人不会指挥他干活,记者指出。 "Alex也不会指挥我干什么,"他说。 "你不能指挥研究人员该做什么。更不能指挥像我这样的研究人员该做什么。" LeCun对自己为什么最终决定离开待了十多年的Meta说得很直白。 留下来在政治上变得困难了。 虽然扎克伯格喜欢LeCun的世界模型研究,但公司为超级智能项目新招的那帮人 "完全被 LLM 洗脑了"。 这明显让LeCun感到格格不入。 "我敢肯定Meta有很多人,也许包括Alex,希望我别到处说 LLM 在超级智能这条路上基本是死胡同” “但我不会因为某个人觉得我错了就改口。我没错。作为科学家的诚信不允许我这么做。" 下一站 另一个促使他离开的原因是。 他在世界模型和AMI上的工作被证明能用在Meta不感兴趣的领域,比如喷气发动机和重工业。 而LeCun不愁找不到愿意押注下一代AI技术的投资人。 在下个阶段,LeCun认为建立"新实验室",也就是做基础研究的创业公司,是新的沃土。 他提到OpenAI前首席技术官 Mira Murati的Thinking Machines("希望投资人知道自己在干什么")和OpenAI联合创始人兼首席科学家Ilya Sutskever的Safe Superintelligence("那边的投资人我知道肯定搞不清状况")都是好例子。 他的新架构用视频让AI模型理解物理世界的规律,这样它们就能更好地预测接下来会发生什么。 这个模型还依赖"情绪",也就是过去的经验和评估,来指导预测。 "比如我掐你一下,你会疼。但你对我的印象会因为我掐了你而改变。下次我把手伸向你时,你会躲开。这就是你的预测,它引发的情绪是恐惧,或者说想避免疼痛," 他解释。 LeCun说,12个月内就能看到这个技术的"婴儿版",几年内会有更大规模的版本。 这还不算真正的超级智能,但是通往那里的路。 "也许还有我们没看到的障碍,但至少有希望。" 三个半小时后,餐厅里只剩他们两个客人。 记者问他想留下什么遗产。 增加世界上的智能总量,他想都没想就回答。 "智能真的是我们应该拥有更多的东西。" 有了更多智能,人类的痛苦会减少,决策会更理性,对世界和宇宙的理解会更深。 "我们吃的亏,都是因为蠢。"(FT) #LLM #大语言模型 #Meta #Facebook #AI
