AI"教父"放狠话，大语言模型走不通_股票频道

（原标题：AI"教父"放狠话，大语言模型走不通）

导语：ChatGPT让Meta乱了阵脚。
金融时报ft访谈了杨立昆（Yann LeCun）： 2025年初的巴黎大皇宫，马克龙正在主办一场国际AI峰会。会场外不远处的米其林星级餐厅Pavyllon里。 Yann LeCun坐在两棵塑料圣诞树之间，戴着标志性的黑色雷朋眼镜，看起来精神不错。这位被称为现代AI"教父"之一的科学家，刚刚结束了在巴黎一周的密集行程。过去这些天里，他不是在策划什么"世界统治"，用他自己的话说，是在推进"全球辅助"，或者叫"智能放大"。毕竟，"统治"这个词放在AI语境下，听起来确实有点吓人。 一条新闻打乱的节奏

上次公开露面时，LeCun还是Meta的首席AI科学家，正在展示他对超级智能机器的最新构想。现在，他准备离开这家工作了十多年的公司，为一家新创公司融资，要把那个构想真正做出来。英国《金融时报》抢先报道了他的离职消息。 "这基本上逼着我们把时间表往前赶了，" LeCun说。消息出来后，马克龙给他发了WhatsApp。虽然LeCun不愿透露总统说了什么，但能看出来，对方挺高兴这家新的"全球性"公司会跟法国保持紧密关系。 LeCun不会去当新公司的CEO，而是做执行主席。这个安排能让他像在Meta时那样，保持做研究的自由度。 "我是个科学家，算是有点远见的那种。我能让人们对有意思的事情产生兴趣，也挺会判断哪种技术靠谱。但让我当CEO真不行，"他说，"我这人太没条理，年纪也大了。" 服务员端来香槟。记者点了无酒精的白中白，这位葡萄酒爱好者也好奇地想尝尝。两人碰杯。聊天中，记者提到自己怀孕了，开玩笑说也在培养自己的超级智能。 "那确实是最高效的方式，" LeCun笑着回应。 大语言模型这条路走不通

说到培养智能，LeCun确实有发言权。几十年来，他一直在琢磨怎么让机器产生智能。他也一直毫不客气地表达对大语言模型（LLM）的看法：这玩意儿到不了超人类智能那一步，尽管硅谷现在对此痴迷得不行。他的逻辑很清楚：LLM有用，但本质上被语言框死了。要达到人类水平的智能，得理解物理世界怎么运转。他的解决方案是一种叫V-JEPA的架构，也就是所谓的"世界模型"。世界模型通过学习视频和空间数据来理解物理世界，不只是语言。它们还能规划、推理，有持久记忆，他把这种智能叫做"高级机器智能"（AMI）。 1960年出生在巴黎郊区的LeCun，从小就对人类智能怎么来的这个问题着迷。八九岁时看的《2001太空漫游》，把他送上了今天这条路。说到这里，他做了个脑袋炸开的手势。 LeCun父亲是航空工程师，"有点发明家气质"，让他从小爱上了造东西和修修补补。 LeCun造模型飞机，吹木管乐器，竖笛和克鲁姆管这种"奇怪的文艺复兴乐器"。他还在一个文艺复兴舞曲乐队里演奏过。两人都选了四道菜的"香榭丽舍"午餐套餐。 LeCun的前菜是软煮蛋、金枪鱼鞑靼配烟熏白斑狗鱼子和油煎面包块，记者的是根茎蔬菜清汤和辣根馄饨配查特酒汁。 LeCun讲起自己的故事。有个老师觉得他数学太差，不适合学数学，所以他去学了工程。服务员过来询问，LeCun点了杯勃艮第的Chassagne-Montrachet。 "美国人管这个叫霞多丽，" 他打趣道。所有东西都是学出来的。

LeCun的顿悟发生在1980年代。当时他在巴黎高等电工电子工程师学院读书，读到一本书，讲语言学家乔姆斯基和心理学家皮亚杰关于先天和后天的争论。乔姆斯基认为人类天生就有语言能力，皮亚杰则说虽然有些结构是天生的，但大部分靠学习。 "说这话可能得罪人……但我当时读着就觉得，乔姆斯基说的肯定不对，因为我们什么都是学来的。智能说到底就是学习这回事。" 那个年代，AI研究，或者说神经网络研究，基本是个死领域，被学术圈视为禁区，因为早期技术让人失望透顶。但LeCun找到了其他研究神经网络的学者，在Geoffrey Hinton这些人身上找到了知音。后来他以博士后身份加入了Hinton在多伦多大学的团队。两人和Yoshua Bengio一起，为深度学习和现代AI打了地基。 2018年，三人因此拿到了计算机科学界最高荣誉图灵奖。服务员端上第二道菜，用法语热情介绍。记者一脸茫然地点头。 "听懂了吗？" LeCun问，然后帮忙翻译：这是鹅肝，这是康泰奶酪舒芙蕾，奶酪陈了18个月。入乡随俗，记者咬了口鹅肝。 贝尔实验室的好时光

LeCun搞出过一些重要的早期AI技术。 1980年代末到1990年代，他在新泽西的AT&T贝尔实验室当研究员，开发了卷积神经网络，这种架构后来被广泛用在图像识别上。他把它做成一个系统，被银行拿来读支票。这个研究的想法在多伦多时就有了，但能真正落地，靠的是贝尔实验室看似花不完的钱和最前沿的技术。 LeCun记得刚加入时，老板Larry Jackel跟他说的话："他说，知道吗，在贝尔实验室，你不会因为省钱出名。" 主菜上来了，裹着香草面包屑的鳕鱼配炸刺山柑。 LeCun兴致很高，讲起AI研究早年的故事，记者听得入神。贝尔实验室的好日子没能一直持续。公司重组，实验室资金大幅缩水，被拆分到不同子公司。 LeCun回到学术界，在纽约大学启动了研究神经网络的新项目，课后常去格林威治村的爵士俱乐部。到2013年，深度学习明显要成了，图像识别应用效果惊人。谷歌刚启动Google Brain，一年后收购了英国AI实验室DeepMind。也是那时候，扎克伯格打来了电话。 Facebook的白板时代

扎克伯格想在Facebook搞个AI部门，为了挖LeCun，把他请到加州家里吃饭。私人厨师准备了"鸡肉 + 挺不错的白葡萄酒"，LeCun回忆道。 LeCun答应加入，但提了三个条件：不用辞掉纽约大学的工作；不用搬去加州；新实验室的研究成果必须公开。扎克伯格全答应了。 LeCun就这样加入Facebook，在这家全球最大的科技公司之一建立了专注基础研究的新AI实验室，叫Facebook人工智能研究院（Fair）。 Facebook当时就是"一块有无限授权的白板"，LeCun说。"钱肯定不是问题。" 服务员端来甜点，苹果薄饼。"太棒了，" LeCun说。 ChatGPT带来的震荡话题转向更动荡的时期。 2022年初，ChatGPT出现之前，各大AI实验室手里都有类似技术，但基本当实验品看。结果一个相对不知名的小实验室 OpenAI，悄悄把这技术做成好用的聊天机器人推出来，引爆了今天的AI热潮。 ChatGPT让Meta乱了阵脚。公司高层决定全力开发Llama，一个大语言模型。扎克伯格重组了架构，成立生成式AI部门，要加速把研究变成产品，LeCun坚持模型要开放。 Llama 2以开放权重发布，所有人都能免费下载调整。 LeCun说这是个 "分水岭" 时刻，"改变了整个行业"。这个模型成了强大开放LLM的标杆，走的路线跟谷歌和OpenAI那种权力高度集中的做法完全相反。 Meta一度被看研究里的好人。去年，Meta在AI上猛踩油门。扎克伯格给生成式AI部门施加更大压力，要求加速开发和部署，结果导致沟通出了问题。 "我们有很多新想法，真正酷的东西，他们应该去做。但他们就盯着那些已经被验证过的东西，这么搞，只会越落越远。" 年轻的新上司 后面几代Llama表现平平。 2025年4月发布的 Llama 4 砸了，公司被指控操纵测试数据让它看起来更厉害。 LeCun承认 "结果确实被美化了一点"，团队在不同测试里用了不同模型来刷分。 "Mark 真的很生气，对参与的所有人都失去了信心。基本上把整个生成式AI组织晾在一边了。很多人已经走了，还没走的估计也会走。" 去年6月，Meta 砸150亿美元投资数据标注公司Scale AI，还聘了它28岁的CEO兼联合创始人Alexandr Wang。 Wang接手了公司在AI上的新赌注和研究部门TBD实验室，负责开发新的前沿AI模型。 Meta 因为试图用1亿美元签约费从竞争对手那里挖顶尖研究员上了新闻。 "这主意好不好，以后就知道了 " LeCun面无表情地说。 LeCun说Wang "年轻"，"没什么经验"。 "他学得快，知道自己哪里不懂……但没做过研究，不知道研究怎么搞，怎么开展。也不知道什么东西对研究人员有吸引力，什么会让他们反感。" Wang还成了LeCun的上司。记者问他对这种层级变化怎么看。他一开始轻描淡写，说习惯跟年轻人共事。" Facebook工程师平均年龄27岁。我是他们年龄的两倍。" 但那些27岁的人不会指挥他干活，记者指出。 "Alex也不会指挥我干什么，"他说。 "你不能指挥研究人员该做什么。更不能指挥像我这样的研究人员该做什么。" LeCun对自己为什么最终决定离开待了十多年的Meta说得很直白。留下来在政治上变得困难了。虽然扎克伯格喜欢LeCun的世界模型研究，但公司为超级智能项目新招的那帮人 "完全被 LLM 洗脑了"。这明显让LeCun感到格格不入。 "我敢肯定Meta有很多人，也许包括Alex，希望我别到处说 LLM 在超级智能这条路上基本是死胡同” “但我不会因为某个人觉得我错了就改口。我没错。作为科学家的诚信不允许我这么做。" 下一站另一个促使他离开的原因是。他在世界模型和AMI上的工作被证明能用在Meta不感兴趣的领域，比如喷气发动机和重工业。而LeCun不愁找不到愿意押注下一代AI技术的投资人。在下个阶段，LeCun认为建立"新实验室"，也就是做基础研究的创业公司，是新的沃土。他提到OpenAI前首席技术官 Mira Murati的Thinking Machines（"希望投资人知道自己在干什么"）和OpenAI联合创始人兼首席科学家Ilya Sutskever的Safe Superintelligence（"那边的投资人我知道肯定搞不清状况"）都是好例子。他的新架构用视频让AI模型理解物理世界的规律，这样它们就能更好地预测接下来会发生什么。这个模型还依赖"情绪"，也就是过去的经验和评估，来指导预测。 "比如我掐你一下，你会疼。但你对我的印象会因为我掐了你而改变。下次我把手伸向你时，你会躲开。这就是你的预测，它引发的情绪是恐惧，或者说想避免疼痛，" 他解释。 LeCun说，12个月内就能看到这个技术的"婴儿版"，几年内会有更大规模的版本。这还不算真正的超级智能，但是通往那里的路。 "也许还有我们没看到的障碍，但至少有希望。" 三个半小时后，餐厅里只剩他们两个客人。记者问他想留下什么遗产。增加世界上的智能总量，他想都没想就回答。 "智能真的是我们应该拥有更多的东西。" 有了更多智能，人类的痛苦会减少，决策会更理性，对世界和宇宙的理解会更深。 "我们吃的亏，都是因为蠢。"（FT） #LLM #大语言模型 #Meta #Facebook #AI

证券之星微信

扫描二维码

关注

证券之星微信