当前位置：首页 > news >正文

据说算力高达1000 TOPS，华硕Ascent GX10深度评测——模型推理

news 2026/6/9 16:52:46

在AI大模型遍地开花的2025年，算力焦虑已经成为开发者的共同话题。动辄十几万的专业工作站让个人开发者望而却步，而云端GPU又面临着成本高昂、数据隐私等问题。

就在这个节点上，华硕推出了一款颇具野心的产品——Ascent GX10，官方宣称它支持200B模型推理和70B模型训练。一台桌面级设备真的能扛起这样的重任吗？带着这个疑问，我们决定来一场硬核评测。

评测机构：至顶AI实验室

测评时间：2025年11月12日

评测产品：华硕Ascent GX10

主要参数：基于NVIDIA Blackwell GB10、统一内显存：128G、操作系统：DGX OS。

评测主题：模型推理

值得一提的是，华硕Ascent GX10的桌面环境相当友好。系统预装了一份详尽的AI开发软件清单，从VS Code到Ollama，从Comfy UI到LLaMA Factory，常用的AI开发工具一应俱全。更贴心的是，每个软件都附带了详细的部署流程和预估部署时间，无论是语言模型推理、多模态模型处理，还是模型训练、数据科学任务，都有对应的软件适配方案。

评测方法：不服就比

为了真实验证GX10的推理能力，我们从AI实验室搬来了一台专业工作站作为对照组。这台工作站搭载Nvidia RTX 5000 Ada显卡（32GB显存）、128GB内存，市场售价约10万元。无论从价格还是体型来看，GX10似乎都处于劣势，但实战表现又会如何呢？

我们设计了两轮测试，选择了不同规模的模型来考验两台机器的推理性能。

Round 1：Qwen 3 32B模型测试

第一回合选用千问三的32B模型。在单并发场景下，GX10的输出速度约为9 tokens/秒，基本接近人类的正常阅读速度；而RTX 5000 Ada达到了22 tokens/秒，速度是GX10的两倍多。

接着我们用自研工具模拟了多人同时使用的并发场景。在4并发压力下，GX10的平均输出速度为7.5 tokens/秒，RTX 5000 Ada为9.9 tokens/秒。第一轮测试，GX10惜败。

Round 2：GPT-o-s 120B模型测试

第二回合我们加大难度，测试GPT-o-s 120B模型。这个模型需要约65GB显存，正好可以检验两台机器在大模型场景下的表现。

结果相当戏剧化。在GX10上，模型加载仅耗时8秒；而在RTX 5000 Ada上，由于显存只有32GB，模型不得不一半加载到GPU、另一半加载到内存，加载时间长达9分钟——相当于你看完这整个视频，模型还没启动起来。

更令人惊讶的是推理速度。GX10的输出速度达到了惊人的35 tokens/秒，而RTX 5000 Ada仅有13 tokens/秒。第二轮，GX10完胜——模型加载速度快了30倍以上，推理速度快了近3倍。

意外发现：反常识的性能表现

测试过程中我们发现了一个有趣的现象：通常情况下，同一台机器上模型越大输出越慢，但在GX10上，120B的GPT-oss竟然比32B的Qwen 3快了4倍。

我们推测这可能与GPT-oss的训练方式有关。该模型采用了将MoE权重量化为FP4格式后进行后训练的技术路线，而GB10显卡基于的Blackwell架构对FP4格式具有原生硬件加速能力。这种架构级的优化，让特定模型在GX10上获得了超预期的性能表现。

评测结论：小钢炮的逆袭

从这次对比评测可以看出，华硕Ascent GX10不仅能够流畅运行100B以上的大模型，在特定场景下的性能甚至可以媲美、甚至超越搭载高端专业显卡的大型工作站。对于需要在本地部署大模型的个人开发者和小团队来说，GX10提供了一个性价比颇高的选择。

AI硬件的竞争才刚刚开始，华硕Ascent GX10这样将专业级算力带入桌面级设备的尝试，或许正在改写个人AI开发的游戏规则。

http://www.cnnetsun.cn/news/66354.html

相关文章：

程序员必看！万字长文详解大模型“深度研究“新范式，小白也能入门AI智能体开发！

大模型安全威胁全解析，Agent架构设计避坑指南，小白必看

SMDJ45A单向 TVS瞬态抑制二极管：3000W浪涌保护管防雷击抗静电

Foundation 文本

Sui 主网升级至 V1.61.2

25、Kubernetes 应用部署与管理实践

31、容器化应用设计理念与实践

如何评估LobeChat的加载速度与响应延迟？性能基准测试

缓存与数据库一致性解决方案深度解析

消息队列真仙：我的道念支持最终一致性

Spring Boot项目推送Gitee全流程(进阶)

Java毕设项目：基于Springboot大学校园自习室教室座位预约网站设计与实现基于springboot高校自习室预约系统的设计与实现(源码+文档，讲解、调试运行，定制等)

JAVA打造同城羽馆预约，一键畅享运动

经验贴 | 科学制定招聘需求与预算：HR 必看的逻辑与实操要点

经验贴 | AI 面试评估系统怎么用？HR 高效识人实操指南

构建个性化AI助手：LobeChat会话管理功能深度使用技巧

基于昇腾NPU的YOLOV8-seg c++部署

26、深入探索脚本编程与系统安全基础

XSS漏洞有哪几种？DOM型XSS和反射型有什么区别？SQL注入原理又是什么？网安面试题常见问题一文详解

压力扫描阀：并行校准技术，解锁多点压力测量新高度

PyTorch框架下运行Qwen3-32B的内存优化策略

为什么说Qwen3-8B是学术研究的理想选择？实测报告出炉

java基础-PriorityQueue（优先队列）

Qwen3-14B模型量化压缩技术：降低GPU内存占用

18、日期和时间的格式化、解析及时间区域的使用

VisionPro CogIPOneImageTool1 工具超详细解释（含内部功能全解析）

VisionPro CogIDTool 工具超深度详解（技术细节 + 实战配置版）

让 BI 拥有‘领域大脑’：智能 BI 如何实现 AI 级精准数据查询

提示工程架构师的战略规划：提示系统生命周期管理

条形码识别与定位：基于FCOS框架的多类型条码检测与识别技术详解