西雅图 – 作为全球领先的应用交付和AI安全解决方案提供商,F5(NASDAQ: FFIV)日前宣布进一步扩展与NVIDIA的深度合作。此次升级通过整合F5 BIG-IP Next for Kubernetes与NVIDIA BlueField-3 DPU,构建出智能化基础设施层。F5 AI安全解决方案在此架构中显著提升GPU利用率及Token吞吐量、降低时延,并支持大规模多租户AI平台的安全构建。这一合作旨在帮助企业与GPU即服务提供商从实验阶段迈向规模化创收,将基础设施效率作为关键衡量指标。

Token是AI推理过程中生成的基本单位。当前行业衡量标准正从单纯的GPU部署规模转向Token经济指标,包括Token吞吐量、首个Token时间、单Token成本及单GPU收入。F5 AI安全解决方案正是围绕这些核心指标进行优化设计。经The Tolly Group验证测试,基于NVIDIA BlueField-3 DPU加速的F5 BIG-IP Next for Kubernetes实现了最高40%的Token吞吐提升、首个Token时间加快61%,以及整体请求时延降低34%。F5 AI安全解决方案通过将网络处理、TLS加密、AI感知负载均衡及流量管理卸载至DPU,释放主机CPU资源,让GPU专注于AI推理计算。这一架构无需修改模型即可提升GPU利用率、减少排队延迟、增强Token产出能力,从而在固定基础设施规模下实现更低的单Token成本。
面向智能体驱动的AI工作流,F5 AI安全解决方案已深度集成NVIDIA NIM统计数据、Dynamo运行时信号及GPU遥测信息,实现推理前的状态感知流量调度。F5 BIG-IP Next for Kubernetes增强版支持推理感知路由、集成NVIDIA DOCA Platform Framework简化DPU部署、基于EVPN-VXLAN与动态VRF的网络级多租户隔离,以及在Kubernetes AI环境中内建安全与可观测性。
F5首席产品官Kunal Anand指出:“F5 AI安全解决方案助力AI工厂将Token产出转化为可量化的业务指标,提升GPU产出效率并更自信地扩展共享型AI平台。
NVIDIA网络业务高级副总裁Kevin Deierling表示:“NVIDIA加速计算基础设施与F5 AI安全解决方案相结合,能够显著提升AI工厂的Token经济效益。
通过深度融合NVIDIA基础设施遥测与DPU加速能力,F5 AI安全解决方案正演进为AI工厂经济学的战略级控制平面,实现治理Token消耗、优化流量路径并提升投资回报率。企业无需过度资源预留即可从现有GPU中释放更高经济价值,最终将AI工厂转化为高效、可变现的业务平台,为智能体时代做好充分准备。
|