当前位置: 首页 > news >正文

华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

1 )首先确定vllm-ascend依赖。

Installation — vllm-ascend

确定cann的版本8.3.rc2

确定vllm和vllm-ascend的对照关系

2) 查询物理机的驱动版本

假设不是cann8.3rc2,那就安装

网址在这里,需要自己注册登录一下:

https://www.hiascend.com/developer/download/community/result?from=firmware&product=1&model=30&cann=8.3.RC2

下载toolkit和 kernels, 我是910b,如果是310请选择对照的版本。

下载完了以后就安装这俩驱动

安装完了以后,再安装一下这几个包,推荐使用conda安装。

pip3 install attrs cython 'numpy>=1.19.2,<=1.24.0' decorator sympy cffi pyyaml pathlib2 psutil protobuf==3.20.0 scipy requests absl-py --user

到这个阶段,驱动安装完了。

3)开始安装torch和torch-npu

这是下载地址:

https://www.hiascend.com/document/detail/zh/Pytorch/720/configandinstg/instg/insg_0004.html

其中8.3rc1和rc2可以通用。

然后安装npu-插件

安装完了以后,测试安装效果

python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

然后安装vllm

安装完了vllm以后呢,torch会被重新装一下,版本可能和你的驱动不搭配。所以

这一步,需要按照第2步重新装一下torch和torch-npu

然后vllm-ascend版本和vllm版本要对照。

然后就结束了。大功告成。

(根据本人的经验,vllm0.11比0.12要快一些。)

4)vllm起量化模型。

vllm serve ./model_path --served-model-name qwen_quant --quantization ascend --max-model-len 90000 --port 8999

访问vllm接口:

为什么要截取90000,因为如果请求超过vllm的max_len 会报错,所以最好限制一下,不要超过vllm起服务时候的最大长度。

http://www.cnnetsun.cn/news/100728.html

相关文章:

  • 小白也能懂的模板错误解决指南
  • 零基础入门:5分钟学会使用Maven Helper管理依赖
  • 企业级项目中模板错误的实战解决方案
  • 24小时验证:用CMHHP快速构建医疗健康应用原型
  • “十五五”规划下银行人才战略转型,数字化破局银行人才管理四大关键症结
  • R语言下载入门:零基础到实战指南
  • 5分钟快速验证Minecraft插件架构
  • 出STM32智慧系统
  • 3步快速解决Windows安装配置错误
  • AI如何帮你理解traceroute命令?
  • 09 - 使用Django开发Web应用
  • 如何用AI快速解决Python依赖包安装错误
  • GUI Agent:AI如何自动化你的前端开发流程
  • 比传统traceroute快10倍:新一代网络诊断工具
  • 在线魔方解谜站:从零入门到精通的智能魔方学习平台
  • 自动化测试框架搭建:持续验证EmotiVoice输出质量
  • Arthas,阿里巴巴开款的Java诊断神器!
  • 创业者必看!深圳注册代办公司靠谱之选-权威盘点
  • 【异常检测】AdaptCLIP:适配CLIP用于通用视觉异常检测
  • 结合ASR构建完整对话系统:EmotiVoice的角色定位
  • EmotiVoice语音情感强度可视化分析工具介绍
  • 对长上下文能力有不同要求,怎么选择合适的模型?
  • 工程期刊投稿全攻略:高效发表指南
  • vue基于springboot的农业合作社果蔬批发农产品商城信息管理系统的设计与实现
  • vue基于springboot的社区医疗保健健康预警监控系统的设计与实现
  • EmotiVoice能否生成方言情感语音?粤语、川话实测
  • 什么是高带宽内存3(HBM3)?关于HBM3的架构、应用场景和性能表现
  • vue基于springboot的连锁超市销售商城 进销存员工与分析系统的设计与实现
  • AI率一夜飙红后,我用这套方法把论文拉回安全线(降AI率实测版)
  • vue基于springboot的基于建筑物识别的无人驾驶车辆路径规划系统