大模型的优势也来自于真实世界反馈的密度与一致性 - 从强化学习角度理解蔡崇信港大演讲

2025年11月5日,阿里巴巴集团董事长蔡崇信在港大有一场演讲,他提出了中国在AI领域的四个优势:能源成本、数据中心基建、AI 人才红利,为解决算力受限进行的系统级优化我想从强化学习的角度,来理解演讲中的一些观点:核心观点:场景就是 AI 的强化学习反馈AI 的优势来自真实世界反馈的密度与一致性——场景越多,强化学习越强,壁垒越高一、为什么真实世界反馈重要不可伪造性:真实用户行为、系统日志、交易结果比人工模拟更可信时空一致性:随时间积累的连续数据比碎片化标注更能训练出稳健策略负样本价值:失败案例比成功样本更稀缺,也更有学习价值隐形知识数字化:通过海量的真实反馈,AI能通过“试错-奖励”机...

AI数据处理模式从批处理(历史数据分析)转向行为流(实时数据感知)一、关键差异批处理:完整体拍照→统一处理→获得历史洞察行为流:连续录像→实时处理→预测下一帧二、技术要素事件:行为数据原子(点击、传感数据)流引擎:持续处理心脏(如RisingWave)状态:上下文记忆智能代...

把每一次上路场景,都映射成最适合的车一、愿景 & 价值定位维度说明愿景让每位准备购车的用户在进入展厅前,就能看到 “购车后每一天” 的真实画像,并用这画像精准匹配最适合的车型。核心价值- 情感匹配 —— 用生活场景激发情感共鸣 - 成本透明 —— 把燃油、保险、维修等总拥...

2025 年的 AI 基础设施正在从「模型驱动时代」走向真正的「Token 经济时代」,未来会最终形成一个以 Token 生产与消费效率为核心的竞赛。一、模型研发:从单模态“巨兽”走向多模态“基础设施”2025 最大的变化,是基础模型不再只是“产品”,而开始成为整个产业的基...