当前位置: 首页 > news >正文

rvm抠图笔记

import torch import cv2 import numpy as np from PIL import Image from torchvision import transforms from model import MattingNetwork # RVM 的模型定义文件 # 加载模型 model = MattingNetwork("resnet50") model.load_state_dict(torch.load(r"D:\project\seg\jacke121-rvm_128_json\model_a\rvm_resnet50.pth", map_location="cpu")) model = model.eval() # 输入图像 # img = cv2.imread("input.jpg")[:, :, ::-1] # BGR -> RGB # img = cv2.imread(r"D:\project_2025\live2d\LayerDiffuse_DiffusersCLI-main\imgs\inputs\mm01.jpg") # BGR -> RGB img = cv2.imread(r"D:\soft\801.jpeg") # BGR -> RGB img = cv2.imread(r"D:\soft\805.png") # BGR -> RGB h, w, _ = img.shape # 转 tensor img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img = img.astype(np.float32) / 255.0 # 归一化到 0-1 # 转 tensor: [H,W,3] -> [1,3,H,W] src = torch.from_numpy(img).permute(2, 0, 1).unsqueeze(0) src = src.cpu() # RVM 需要 recurrent states (init None) rec = [None] * 4 # 推理,RVM 输入为:src, downsample_ratio, *rec with torch.no_grad(): fgr, pha, *rec = model(src, downsample_ratio=0.25, *rec) # fgr: foreground,pha: alpha matte fgr = fgr[0].permute(1, 2, 0).cpu().numpy() pha = pha[0].permute(1, 2, 0).cpu().numpy() # 合成为 rgba rgba = np.concatenate([fgr, pha], axis=2) # [H,W,4] rgba = (rgba * 255).astype(np.uint8) Image.fromarray(rgba).save("output_rvm.png") print("Done: output_rvm.png")
http://www.cnnetsun.cn/news/17879.html

相关文章:

  • mask xcf 文件
  • 基于SSM的企业生产监控与管理系统毕业设计项目源码
  • 如何用Stream-rec实现全自动直播录制?新手必看终极指南
  • 【路径规划】基于RRT和RRT-connect算法实现机器人路径规划附matlab代码
  • 【智能优化算法】Noorulden Basil优化算法(NB Optimizer)的MATLAB实现
  • 群晖Audio Station歌词插件终极指南:让QQ音乐歌词完美显示
  • 南京大学学位论文LaTeX模板完整使用教程
  • MySQL 知识点复习- 6.MySQL语法顺序
  • CENTOS 7服务器chronyd同步本地时间服务器时间设置详解
  • 每周技术加速器:为什么下一代AI的竞争是“上下文操作系统“之争?
  • AR远程指导:工业行业的新型生产力引擎
  • 45、Samba与GNU GPL许可证:操作系统特定问题与开源许可详解
  • 行为面试问题及回答策略——软件测试专题
  • 29、深入探讨Samba与多协议网络的集成
  • 协议翻译大师:耐达讯自动化EtherCAT转Devicenet,电动缸的‘毫秒级指令执行专家’
  • 调试复杂、适配难?耐达讯自动化Ethercat转Devicenet让继电器通讯少走弯路
  • Sentinel系统保护规则深度解析
  • 全球创始人IP+AI万人峰会:赋能与精神滋养并重,引领2026增长新范式
  • 基于Web的客户关系管理系统的设计与实现开题报告(1)
  • 三菱FX PLC下载线驱动安装终极指南:快速解决通信连接问题
  • NetAssistant:终极网络调试解决方案的完整指南
  • 013的加密世界权威指南_第一部分
  • 完整指南:5大核心特性带你玩转Font Awesome 7
  • UtilEmpty空值检查工具类
  • 革命性跨平台EPUB阅读器:智能同步让阅读无处不在
  • 【完整源码+数据集+部署教程】动力电池等检测系统源码分享[一条龙教学YOLOV8标注好的数据集一键训练_70+全套改进创新点发刊_Web前端展示]
  • TDK/INVENSENSE/应美盛传感器ICM-42670-P的概述
  • 《公共管理学》2025网课答案
  • 无需复杂配置!在家也能远程操控 Kali 桌面,cpolar这招太实用了
  • 哪吒监控:打造企业级服务器监控体系的5大核心优势