互联网传媒行业周报-周观点：昆仑万维发布通用Agent新框架，TTT大模型新架构诞生_股票频道

（以下内容从上海证券《互联网传媒行业周报-周观点：昆仑万维发布通用Agent新框架，TTT大模型新架构诞生》研报附件原文摘录）
主要观点
昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校机构，联合提出了迄今为止第一个既能玩多种商业游戏又能操作各种软件应用的AI框架——Cradle。在这个全新的通用计算机控制框架加持下，AI Agent无需训练便能像人一样直接控制键盘鼠标，不依赖任何内部API，实现任意开闭源软件交互。随着大模型的发展，越来越多的智能体（AI Agents）研究关注计算机控制，包括浏览网页、操作智能手机、玩游戏等。要构建能完成计算机上一切任务的通用智能体，必须使用最通用和最标准的输入输出与计算机进行交互。因此通用计算机控制使用统一的输入和输出，从而让智能体的通用性变为可能。大量关于AI智能体的研究都依赖于计算机内部API的信息获取，无法让AI真正「像人类一样」通过眼、脑、手的配合与计算机进行互动，其环境、行为、动作都相对固定，难以实现跨软件、跨平台的通用智能。我们认为Cradle极大程度地扩展了智能体可以交互的范围，并且证明了将一切软件转化为测试智能体不同能力的testbed的可能性，通用计算机控制的设定统一了输入输出的接口，促进了统一粒度数据的搜集，为未来Agent在各个环境中交互并且自我提升打下了坚实的基础。
斯坦福、UCSD、UC伯克利和Meta的研究人员提出了一种全新架构，用机器学习模型取代RNN的隐藏状态。这个模型通过对输入token进行梯度下降来压缩上下文，这种方法被称为「测试时间训练层（Test-Time-Training layers，TTT）」。TTT层直接替代了注意力机制，解锁了具有表现力记忆的线性复杂度架构，使我们能够在上下文中训练包含数百万（未来可能是数十亿）个token的LLM。目前TTT只应用于语言建模，未来，它也可以用在长视频上，当我们对长视频进行建模时，就可以对帧进行密集采样，而不是采样1FPS了。我们认为TTT在使用过程中，也能够学习和适应，为长上下文提供更好的性能，而不会产生通常与Transformer相关的高昂计算成本。
在大语言模型百花齐放阶段，我们认为国内大厂持续投入大语言模型，有望打造出更适合中国的AI生产力工具。目前AIGC行情已有所分化，未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现，龙头及龙头板块需重点关注，持续推荐具备基本面优势的【游戏】板块。
投资建议
基于我们“大模型+小模型+应用及内容”的研究框架，我们认为从基本面受益的角度上看，需沿着目前成熟大模型模态输出的范围选择标的，重点关注AI+文本/虚拟人板块，其次关注AI+图片（大模型+小模型）；从价值重估的角度上看，需沿着掌握优质数据或内容（多模态数据）的范围选择标的，重点关注AI+内容/IP/版权板块。
AI行情分化趋势下，建议重点关注基本面优异的【游戏】及【出版】板块：
1、AI：建议关注【昆仑万维】；推荐【创业黑马】。
2、MR：推荐【风语筑】。
3、游戏新模式：建议关注【吉比特】；推荐【完美世界】、【三七互娱】。
4、影视新模式：建议关注【上海电影】、【中文在线】、【华策影视】、【掌阅科技】、【光线传媒】。
风险提示
政策边际优化的程度不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。

证券之星微信

扫描二维码

关注

证券之星微信