2026年,英特尔在全球发布至强600系列处理器与锐炫Pro B70显卡,打造本地AI工作站“桌下大脑”。该平台支持32GB显存、CXL 2.0技术,实现高效数据吞吐和低延迟,满足企业智能体需求。火山引擎等合作伙伴助力构建开放生态,推动金融、医疗、创作等多领域智能化升级。
|
很长一段时间里,工作站(Workstation)的形象是固定且单一的:它是停泊在设计师、剪辑师桌下的"性能巨兽",任劳任怨地吞吐着4K时间线与复杂的渲染图纸。它拥有顶级的算力肌肉,但人,是它唯一的驾驶员。 但进入2026年,随着OpenClaw的爆发,这台机器正在经历一场物种进化:它开始长出"大脑"。 ![]() 在英特尔新一代AI工作站平台(至强600系列处理器+锐炫Pro B70显卡)发布会上,令人震撼的不仅有极限跑分,还有借由本地大模型与Agent框架的部署,原本高度依赖云端算力的复杂智能体,被完整装进了一台本地工作站。 只要接上电源,它就不再是单纯的渲染工具,而是化身为一支7×24小时待命的"赛博团队"。一场关于"桌下大脑"的算力重构,正由内而外地发生。 算力破壁:养一支"赛博团队",需要怎样的物理底座? 要让几十个"赛博同事"在桌底下流畅运转,传统的硬件逻辑已经失效。智能体对算力的渴求,不仅在于单纯的计算速度,更在于恐怖的数据吞吐量和长文本记忆力。英特尔给出的解法是"双芯协同"下的底层重构。 首先是被拉爆的显存。 智能体时代,模型需要阅读和记忆海量的上下文。在发布会现场的实测中,当模型处理128K上下文时,显存占用已达23.1G;跃升至256K满血上下文时,单次任务吃掉了25.6G显存。"智能体长上下文时代,买显卡就要买大显存"成为了不争的事实。 ![]() 为此,英特尔锐炫Pro B70显卡直接将显存提升至32GB,带宽狂飙50%达到600GB/s。这不仅是为了渲染高清贴图,更是为了让"赛博同事"拥有足够宽广的"工作记忆区"。 锐炫Pro B70采用第二代Xe架构(Xe2),32个Xe核心中集成了256个向量处理单元(XVE)和256个矩阵计算单元(XMX),针对AI推理的数据吞吐进行了深度优化。367 TOPs的INT8稠密算力,配合32个光线追踪单元和最新的视频编解码硬核,让这颗GPU在AIGC创作和智能体推理之间实现了完美的平衡。 其次是击穿"内存墙"的CPU革命。 面对高并发的智能体需求,至强600系列工作站处理器首次引入了CXL 2.0技术,这是工作站平台的历史性突破。通过支持MRDIMM内存,传输吞吐提高2倍,内存加载延迟暴降40%。这种物理层面的突围,为大模型的高速缓存(KV Cache)彻底铺平了道路。 ![]() 代号Granite Rapid的至强600采用Chiplet设计,最高86个P核的恐怖规格,配合128个PCIe 5.0通道和8通道内存架构,构建了前所未有的扩展能力。更重要的是,它继承了服务器级别的RAS特性——4大类别48项可靠性增强设计,让这台"桌下大脑"拥有了企业级的稳定性。 最后是软件生态的无缝协同。 英特尔为这套硬件底座配齐了完整的AI软件栈:从工业界最流行的vLLM serving框架,到容器化的全栈软件打包,再到持续更新的模型支持(覆盖7B到100B+的稠密模型、MoE LLM、多模态和AIGC模型),实现了"安装即可用"的极简体验。 XPU manager和GPU dashboard等监控工具,让管理员可以实时掌握"赛博团队"的工作状态。而OpenCL和oneAPI等开放编程框架的支持,则确保了从传统专业应用到新兴AI工作负载的平滑迁移。 场景越狱:当"赛博团队"接管现实业务 当这套硬件底座与企业真实业务相撞,这支"赛博团队"展现出了横跨多个专业的降维打击能力。 ![]() 在企业金融领域,它催生了高密度的"智能体农场"。 得益于至强698X处理器恐怖的86物理核心设计,一台单U工作站可以在本地直接部署86个"龙虾(本地智能体)"。在更极限的"企业智能体一体机"演示中(至强698X+4张锐炫Pro B70),机器后台同时运行着24个基于800亿参数Qwen3-Coder-Next模型的智能体。它们就像24个永不疲倦的金融分析师,每10秒迭代一次,并行监控24只个股的实时异动。 在视觉创作领域,它是颠覆内容SOP的"超级剪辑师"。 知名车评人韩路的110人内容团队,日常需要处理高达3PB的视频素材。借助于锐炫Pro B70极强的硬编解码能力,一段30分钟的重型4K视频渲染从2小时骤降至25分钟,每天为团队省下几十个工时。 更具颠覆性的是,工作站利用闲暇时间跑本地AI,对3PB素材逐帧进行OCR识别和理解。如今,编导只需输入"找一段新疆有雪山的大河",赛博同事就能瞬间完成精准检索。以往遥不可及的"院线级电影梦",在极低的AI试错成本下变得触手可及。 ![]() 现场演示中,单卡B70生成1024×1024高清图片仅需3.9秒,4K图片生成仅需30秒,5秒480P视频生成仅需92秒。这种实时创作能力,正在重新定义AIGC的工作流。 在智慧医疗场景,它是绝对安全的"虚拟医生助理"。 东华医为将一台8卡B70工作站直接推入科室,不仅让病历辅助生成的速度较B60提升了8倍,病历内涵质控效率提升67%,更关键的是——所有患者的敏感病历数据100%在医院内网闭环,彻底切断了隐私泄露的风险。 单台8卡配置满足科室级应用,2台即可支撑150-200个终端点位的院级部署,这种灵活的扩展性让医疗AI真正走进了临床一线。 在企业协作领域,它是永不掉线的"智能会议中枢"。 联想基于单卡锐炫Pro B70和40亿参数大模型构建的智能会议系统,可以同时支持20路会议室的实时翻译和会议总结。飞致云的MaxKB企业智能体平台测试显示,2卡配置可支撑14B模型并发20-30路,4卡配置运行32B模型同样保持20-30并发,8卡配置则能实现50+并发,15 TPS的解码速率让企业知识库的智能问答变得流畅自然。 逃离云端:为什么企业需要"桌下大脑"? 既然云端大模型如此强大,为什么企业还要在本地构建"赛博团队"?火山引擎AgentSphere的分享道破了天机。 当企业智能体的数量从几个激增到几百个时,高昂的Token账单成为了企业的不可承受之重。买一台工作站是"一次性固定资产投入",而在云端跑重载智能体则是无底洞般的"按量计费"。 ![]() 此外,由于个人智能体(Skills)经常需要执行脚本、操作本地文件,云端部署无法解决极低延迟和"沙箱安全"的问题。企业敏感数据的主权意识也在觉醒——本地部署意味着数据永远不出内网,符合日益严格的合规要求。 这正是AI工作站不可替代的战略位势:它是对办公环境最友好的"高算力容器"。 它不需要企业去改造专业的机房,不需要工业空调与供电,只需塞进办公桌下,插上普通电源,你就拥有了具备服务器级别稳定性(RAS特性)、支持百亿参数模型的AI基座。W890芯片组提供的Wi-Fi 7/6E、2.5GbE、USB 3.2等丰富接口,让这台机器能够无缝融入现有的办公网络。 生态破圈:开放架构如何对抗垂直整合? 在AI硬件领域,垂直整合的趋势愈发明显,但英特尔选择了另一条路:构建开放协同的产业生态。 硬件层面,8家系统厂商已发布至强600工作站整机,7家主板厂商推出W890主板和准系统,4家AIB合作伙伴提供B70/B65 GPU卡的多样化设计(涡轮/被动散热、双槽/单槽等)。 ![]() 软件层面,从火山引擎AgentSphere的企业智能体工作台,到联想的智能会议解决方案,从飞致云MaxKB的企业级智能体开发平台,到东华医为的医疗AI解决方案,再到亦心科技的AI闪绘美育工具,一个横跨多个行业的解决方案矩阵正在形成。 这种开放生态的优势在于:企业可以根据自身需求灵活选择硬件配置和软件方案,避免被单一厂商锁定。同时,英特尔持续的软件优化和模型支持,确保了这套平台能够跟上AI技术的快速迭代。 结语 2026年的这场算力变革,不再是冷冰冰的跑分竞赛。 英特尔至强600与锐炫Pro B70的双芯协同,本质上是为千行百业铸造了一把通往"混合AI时代"的普惠入场券。它既不是对传统工作站的简单升级,也不是对服务器的廉价替代,而是一个全新的品类——部门级AI算力枢纽。 当你第二天走进办公室,按下桌下那台机器的电源键时,你唤醒的不再只是一堆精密的硅脂与电路,而是一支准备就绪、无所不能的"赛博团队"。属于企业的效率革命,正从这方寸之间的"桌下大脑"悄然开始。 |
企业视频
IT百科
网友评论
聚超值•精选







