行业动态

北京智源研究院独家披露:2025 年 AI 领域十大突破性走向,世界模型引领多模态变革

发布时间:2025-01-09 文章来源:本站

   1 月 8 日,北京智源人工智能研究院权威发布 2025 人工智能十大技术趋势。据其预测,借助 Scaling Law(尺度定律)提升基础模型性能的训练模式,其 “性价比” 正不断下滑,与此同时,后训练与特定场景下的 Scaling law 正成为探索热点。构建原生多模态大模型,逐渐成为多模态大模型进化的关键方向,而世界模型有望成为多模态大模型发展的下一阶段。此外,基础模型在自主决策能力上的持续精进,也带来了潜在的失控风险,因此,提升模型能力与预防风险需双管齐下。在具身智能领域,其发展将延续从本体延伸至具身脑的脉络,近百家具身初创企业或面临洗牌,厂商数量将趋于集中。

趋势一:AI4S 驱动科学研究范式变革


   在大模型的引领下,AI4S(AI for Science)已成为推动科学研究范式变革的核心力量。2024 年,科研人员运用 AI 的比例迅猛增长,AI 对科学研究方法与流程的变革作用也开始显现。大模型赋能的 AI4S,能显著提升科学研究效率,促使科研从聚焦特定任务的优化,向更复杂、动态且交叉的问题拓展,展现出与以往截然不同的效果。展望 2025 年,多模态大模型将进一步融入科学研究,助力挖掘多维数据的复杂结构,辅助科研人员全面理解和分析科研问题,为生物医学、气象、材料发现、生命模拟、能源等基础与应用科学领域开辟全新研究方向。

趋势二:具身大小脑和本体的协同进化


   2025 年,具身智能将沿着从本体拓展到具身脑的路径继续发展。在行业格局方面,近百家具身初创企业可能面临洗牌,市场竞争加剧,厂商数量开始减少。在技术路线上,端到端模型会持续迭代,对小脑大模型的探索或取得突破。商业应用层面,工业场景中具身智能的应用将更为广泛,部分人形机器人有望实现量产。

趋势三:统一的多模态大模型实现更高效 AI


   人工智能旨在模拟人类思维的信息处理过程,而人类对信息的交互和处理呈现多模态、跨模态的特点。当前的语言大模型以及拼接式的多模态大模型,在模拟人类思维过程中存在固有局限。从训练伊始就打通多模态数据,实现端到端输入输出的原生多模态技术路线,为多模态发展带来新契机。因此,在训练阶段将视觉、音频、3D 等模态数据进行统一,构建原生多模态大模型,成为多模态大模型进化的重要方向。

趋势四:Scaling Law 扩展,模型泛化从预训练向后训练、推理迁移


   依靠 Scaling Law 来提升基础模型性能的训练模式,其 “性价比” 不断降低,而后训练与特定场景下的 Scaling law 正被广泛探索。强化学习作为发现后训练、推理阶段 Scaling Law 的关键技术,将得到更为广泛的应用和创新。

趋势五:世界模型加速发布,有望成为多模态大模型的下一阶段


   世界模型更注重 “因果” 推理,能赋予 AI 更高级别的认知能力,以及更符合逻辑的推理和决策能力。这不仅能推动 AI 在自动驾驶、机器人控制及智能制造等前沿领域的深度应用,还有望突破传统任务边界,探索人机交互的新模式。

趋势六:合成数据将成为大模型迭代与应用落地的重要催化剂


   高质量数据的获取,正成为大模型进一步发展的阻碍。合成数据已成为基础模型厂商扩充数据的首要选择。它不仅能降低人工治理和标注成本,减少对真实数据的依赖,避免数据隐私问题,还能提升数据的多样性,增强模型处理长文本和复杂问题的能力。此外,合成数据能缓解通用数据被大厂垄断、专有数据获取成本高等问题,有效推动大模型的应用落地。

趋势七:推理优化迭代加速,成为 AI Native(AI 原生)应用落地的必要条件


   大模型的硬件载体正从云端向手机、PC 等端侧硬件拓展。然而,在 AI 算力、内存等资源受限的设备上,大模型的落地应用会受到推理侧开销的限制,给部署资源、用户体验和经济成本带来巨大挑战。算法加速和硬件优化技术的持续迭代,将双轮驱动,助力 AI Native 应用的落地。

趋势八:重塑产品应用形态,Agentic AI 成为产品落地的重要模式


   2025 年,功能更强大、自主性更高的智能体将重塑产品应用形态,深入工作和生活场景,成为大模型产品落地的重要应用形式。自 2023 年起,从 Chatbot(聊天机器人)、Copilot(AI 助手)到 AI Agent(AI 智能体)、Agentic AI,行业对 AI 应用形态的认识不断深化。2023 年底,AI Agent 应用编排框架逐渐成熟,Agentic AI 概念应运而生。2025 年,更多智能化程度高、对业务流程理解深刻的多智能体系统将在应用端落地。

趋势九:AI 应用热度渐起,超级 App 花落谁家犹未可知


   近一年来,生成式模型在图像、视频处理能力上大幅提升,加上推理优化带来的成本降低,以及 Agent/RAG(检索增强生成)框架、应用编排工具等技术的持续发展,为 AI 超级应用的落地奠定了基础。尽管谁能最终打造出 AI 超级 APP 仍未可知,但从用户规模、交互频次、停留时长等维度来看,AI 应用热度持续上升,即将迎来爆发。

趋势十:模型能力提升与风险预防并重,AI 安全治理体系持续完善


   大模型作为复杂系统,其 Scaling 带来了涌现现象,但复杂系统特有的涌现结果难以预测,循环反馈等特性也给传统工程的安全防护机制带来挑战。基础模型在自主决策能力上的不断提升,带来了潜在的失控风险。如何引入新的技术监管手段,如何在人工监管中平衡行业发展与风险管控,是 AI 领域各方需要持续探讨的重要议题 。


   声明:本站所使用的图片文字等素材均来源于互联网共享平台,并不代表本站观点及立场,如有侵权或异议请及时联系我们删除。