当前位置: 首页 > news >正文

ollama本地安装

  1. 检查本地是否有端口冲突
    Ollama默认端口为11434,执行:
    netstat -ano | findstr “11434”

  2. 下载及安装
    ollama 官网下载:https://ollama.com/download
    下载后,默认 Install 安装即可,无需修改任何内容。

  3. 安装完成后配置系统变量与path
    系统变量——新建——(ollama模型的存储路径)
    变量名:OLLAMA_MODELS
    变量值:D:\OllamaModels
    系统变量path——新建——(ollama.exe所在⽬录)
    通常在下面路径中查找"C:\Users*\AppData\Local\Programs\Ollama"

  4. 设置ollama开机非自启动
    删除:
    %APPDATA%\Microsoft\Windows\Start Menu\Programs\Startup
    下快捷方式。

注意:配置完成后,重启电脑即生效,未重启电脑即下载模型使用的话,默认会下载在路径" C:\Users\ * .ollama\models",如果先配置环境变量未重启,模型下载到默认路径了,再次重启电脑后环境变量生效,可以采取默认路径下models文件夹删除的方式,可以节省C盘空间,后续下载模型都在OLLAMA_MODELS配置的路径下。

  1. http://localhost:11434 查看ollama状态:
    Ollama is running

  2. 地址:https://ollama.com/library 查看ollama可下载模型

  3. 下载及使用

  4. ollama常用指令
    拉取模型:ollama pull <模型名>[:标签]
    查看本地模型:ollama list
    删除模型:ollama rm <模型名>[:标签]
    复制模型:ollama cp <源模型名> <新模型名>
    直接运行模型:ollama run <模型名>
    单次提问:ollama run <模型名> “你的问题”
    带参数运行:llama run <模型名> --temperature 0.7 --seed 42
    查看模型信息:ollama show <模型名>
    停止模型:ollama stop <模型名>

  5. 测试
    curl http://localhost:11434/api/generate -d ‘{
    “model”: “qwen2:0.5b”,
    “prompt”: “写一个简短的故事”,
    “stream”: true
    }’ -N

  6. ollama启动本地模型后,docker启动open webui可以直接使用
    ollama启动本地模型:
    开始——ollama启动——cmd中
    ollama list
    ollama ps
    ollama run qwen2:0.5b
    docker启动open webui:
    镜像源:
    docker pull ghcr.nju.edu.cn/open-webui/open-webui:main
    启动命令:
    docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.nju.edu.cn/open-webui/open-webui:main
    访问:
    http://localhost:3000/

http://www.cnnetsun.cn/news/108159.html

相关文章:

  • 深度学习模型扩展实践:从理论突破到工业部署的完整指南
  • 如何快速配置Git项目:跨平台开发的终极指南
  • Clay UI库如何实现微秒级响应的高性能交互系统?
  • OkHttp跨平台网络库:构建多端统一API的高性能连接管理方案
  • 商城App标签选择组件开发,如何React Native鸿蒙跨平台开发`react-native-tags`是一个流行的React Native库,用于实现标签选择功能
  • Dolphin智能文档解析:三步告别PDF转Markdown的烦恼
  • 17、邮件安全与Procmail使用指南
  • EmotiVoice语音合成情感冲突规避机制:避免怪异混合情绪
  • GP2040-CE开源固件:构建高性能定制化游戏控制器解决方案
  • GoScan:让网络扫描变得简单高效的终极指南
  • 开发者必看:EmotiVoice源码结构与二次开发入门指南
  • XCOM V2.6串口调试工具:嵌入式开发的得力助手
  • Obsidian Tasks 插件:重塑知识库任务管理的新范式
  • Android键盘状态监听实战指南:从基础到进阶
  • 解锁细胞分割新高度:Cellpose cyto3模型完整应用手册
  • 裁员潮下的测试人:真正聪明的人正在做这三件事
  • 百度网盘秒传黑科技:网页版极速转存全解析
  • 从零开始:Psi4量子化学计算的5大实战应用场景
  • SourceGit:现代化Git图形化客户端的革命性体验
  • ZeroBot-Plugin:开启智能对话机器人的云服务新篇章
  • ModEngine2 完整指南:如何为魂系游戏配置和调试模组系统
  • EmotiVoice语音合成耗时分析:影响响应速度的关键因素
  • AMD GPU在ComfyUI中无法识别的完整解决方案
  • 大厂Java面试故事:微服务、分布式缓存与AI场景全链路技术深挖
  • EmotiVoice支持RESTful API吗?集成方式详解
  • Mac效率革命:用Pearcleaner告别繁琐的Homebrew命令行操作
  • Windows安卓子系统终极指南:MagiskOnWSALocal完整安装教程
  • 从GitHub到生产环境:EmotiVoice项目落地全流程拆解
  • 终极解锁:如何用Edge插件快速获得Netflix 4K影院级画质体验
  • 突破移动端瓶颈:YOLOv10在iOS平台的极致优化实践