AI Infra:xLLM,京东开源的国产算力LLM推理引擎

京东开源的国产AI加速器专属LLM推理引擎,专为昇腾/海光/飞腾等国产算力优化,服务与引擎解耦架构,支持Qwen/DeepSeek/MoE等主流模型,企业级高吞吐低延迟部署。一、核心机制全图流水线:调度→计算→通信并行,消除气泡动态图优化:变长输入自适应 + 多图缓存 + 智能内存池全局KV缓存:跨请求重用 + 分布式预取路由算法加速:投机解码 + MoE负载均衡 + 多核并行全局多级KV Cache管理有点意思二、架构xllm/ ├── core/ # 调度/运行时/算子/分布式引擎 ├── api_service/ # gRPC/REST服务 ├── server/ ...

前言:金融风控的本质是欺诈与信用的双面战场车贷风控是一场永不停歇的猫鼠游戏。欺诈者不断进化伪造技术,而信用不足的申请者可能隐藏真实的还款能力。传统规则引擎的僵化已难以应对动态风险。AI Agent的引入正是为了解决两个核心矛盾:如何在海量申请中实时捕捉欺诈信号,同时如何穿透...

一、核心评估维度维度说明可见性(Visibility)内容是否被 AI 引用或提及准确性(Accuracy)被引用的内容是否完整、正确影响力(Influence)是否改变了用户决策或行为流量转化(Traffic & Conversion)是否带来间接访问或转化品牌权威性(A...

构建机器智能的「认知中枢」当数据具备认知能力——为AI系统设计可学习、可遗忘、可联想的知识基础设施一、什么是认知数据基座在传统数据库之上,“认知数据基座”是一个面向AI系统的知识组织与操作平台。它不仅管理原始数据存储,还支持信息的语义建模、上下文感知、记忆检索与生命周期管理...

想象一群人在讨论晚餐吃什么——有人掉线,有人恶意干扰,还有人网络延迟。共识机制,就是让这群人高效达成一致的通信规则。一、为什么需要不同的共识机制?根本原因:现实世界的约束条件差异,如同"野外生存"与"室内会议"需要不同的组织策略。约束维度简单场景(室内会议)复杂场景(野外生...