位置: IT常识 - 正文

【图像分割】Meta分割一切(SAM)模型环境配置和使用教程(图像分割最新算法)

编辑:rootadmin
【图像分割】Meta分割一切(SAM)模型环境配置和使用教程

推荐整理分享【图像分割】Meta分割一切(SAM)模型环境配置和使用教程(图像分割最新算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像分割ncut,图像分割csdn,图像分割unet,图像分割实现,图像分割实现,图像分割otsu,图像分割otsu,图像分割miou,内容如对您有帮助,希望把文章链接给更多的朋友!

注意:python>=3.8, pytorch>=1.7,torchvision>=0.8

Feel free to ask any question. 遇到问题欢迎评论区讨论.

官方教程:

https://github.com/facebookresearch/segment-anything1 环境配置1.1 安装主要库:

(1)pip:

有可能出现错误,需要配置好Git。

pip install git+https://github.com/facebookresearch/segment-anything.git

(2)本地安装:

有可能出现错误,需要配置好Git。

git clone git@github.com:facebookresearch/segment-anything.gitcd segment-anything; pip install -e .

(3)手动下载+手动本地安装:

 zip文件:

链接:https://pan.baidu.com/s/1dQ--kTTJab5eloKm6nMYrg提取码:1234

解压后运行: 

cd segment-anything-mainpip install -e .1.2 安装依赖库:pip install opencv-python pycocotools matplotlib onnxruntime onnx

matplotlib 3.7.1和3.7.0可能报错

如果报错:pip install matplotlib==3.6.2

1.3 下载权重文件:

下载三个权重文件中的一个,我用的第一个。

default or vit_h: ViT-H SAM model.vit_l: ViT-L SAM model.vit_b: ViT-B SAM model.

 如果下载过慢:

链接:https://pan.baidu.com/s/11wZUcjYWNL6kxOH5MFGB-g 提取码:1234 2 使用教程2.1 根据在图片上选择的点扣出物体【图像分割】Meta分割一切(SAM)模型环境配置和使用教程(图像分割最新算法)

原始图像:

 导入依赖库和展示相关的函数:

import cv2import matplotlib.pyplot as pltimport numpy as npfrom segment_anything import sam_model_registry, SamPredictordef show_mask(mask, ax, random_color=False): if random_color: color = np.concatenate([np.random.random(3), np.array([0.6])], axis=0) else: color = np.array([30 / 255, 144 / 255, 255 / 255, 0.6]) h, w = mask.shape[-2:] mask_image = mask.reshape(h, w, 1) * color.reshape(1, 1, -1) ax.imshow(mask_image)def show_points(coords, labels, ax, marker_size=375): pos_points = coords[labels == 1] neg_points = coords[labels == 0] ax.scatter(pos_points[:, 0], pos_points[:, 1], color='green', marker='*', s=marker_size, edgecolor='white', linewidth=1.25) ax.scatter(neg_points[:, 0], neg_points[:, 1], color='red', marker='*', s=marker_size, edgecolor='white', linewidth=1.25)

确定使用的权重文件位置和是否使用cuda等:

sam_checkpoint = "F:\sam_vit_h_4b8939.pth"device = "cuda"model_type = "default"

模型实例化:

sam = sam_model_registry[model_type](checkpoint=sam_checkpoint)sam.to(device=device)predictor = SamPredictor(sam)

读取图像并选择抠图点:

image = cv2.imread(r"F:\Dataset\Tomato_Appearance\Tomato_Xishi\images\xs_1.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)predictor.set_image(image)input_point = np.array([[1600, 1000]])input_label = np.array([1])plt.figure(figsize=(10,10))plt.imshow(image)show_points(input_point, input_label, plt.gca())plt.axis('on')plt.show()

 扣取图像(会同时提供多个扣取结果):

masks, scores, logits = predictor.predict( point_coords=input_point, point_labels=input_label, multimask_output=True,)# 遍历读取每个扣出的结果for i, (mask, score) in enumerate(zip(masks, scores)): plt.figure(figsize=(10,10)) plt.imshow(image) show_mask(mask, plt.gca()) show_points(input_point, input_label, plt.gca()) plt.title(f"Mask {i+1}, Score: {score:.3f}", fontsize=18) plt.axis('off') plt.show()

     

 尝试扣取其他位置:

 

2.2 扣取图像中的所有物体

官方教程:

https://github.com/facebookresearch/segment-anything/blob/main/notebooks/automatic_mask_generator_example.ipynb

依赖库和函数导入:

from segment_anything import sam_model_registry, SamAutomaticMaskGenerator, SamPredictorimport cv2import matplotlib.pyplot as pltimport numpy as npdef show_anns(anns): if len(anns) == 0: return sorted_anns = sorted(anns, key=(lambda x: x['area']), reverse=True) ax = plt.gca() ax.set_autoscale_on(False) polygons = [] color = [] for ann in sorted_anns: m = ann['segmentation'] img = np.ones((m.shape[0], m.shape[1], 3)) color_mask = np.random.random((1, 3)).tolist()[0] for i in range(3): img[:,:,i] = color_mask[i] ax.imshow(np.dstack((img, m*0.35)))

读取图片:

image = cv2.imread(r"F:\Dataset\Tomato_Appearance\Tomato_Xishi\images\xs_1.jpg")image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

实例化模型:

sam_checkpoint = "F:\sam_vit_h_4b8939.pth"model_type = "default"device = "cuda"sam = sam_model_registry[model_type](checkpoint=sam_checkpoint)sam.to(device=device)

 分割并展示(速度有点慢):

mask_generator = SamAutomaticMaskGenerator(sam)masks = mask_generator.generate(image)plt.figure(figsize=(20,20))plt.imshow(image)show_anns(masks)plt.axis('off')plt.show()

2.3 根据文字扣取物体

配置另外一个库:

https://github.com/IDEA-Research/Grounded-Segment-Anything

后续更新细节

本文链接地址:https://www.jiuchutong.com/zhishi/288855.html 转载请保留说明!

上一篇:【Java基础】一个Java文件可以有多个类(外部类、内部类)(java基础教程)

下一篇:被翡翠湾环绕的芬尼特岛,太浩湖,加利福尼亚 (© Rachid Dahnoun/Tandem Stills + Motion)(翡翠湾攻略)

  • 小米预装office是不是永久的(小米预装office是什么意思)

    小米预装office是不是永久的(小米预装office是什么意思)

  • 微信语音怎么保存(微信语音怎么保存成音频文件)

    微信语音怎么保存(微信语音怎么保存成音频文件)

  • 美图秀秀拼图视频没有声音(美图秀秀拼图视频怎么没有原声音)

    美图秀秀拼图视频没有声音(美图秀秀拼图视频怎么没有原声音)

  • iqooneo3充电速度(iqooneo3充电慢)

    iqooneo3充电速度(iqooneo3充电慢)

  • 剪映如何读出字幕(剪映中如何读出文字)

    剪映如何读出字幕(剪映中如何读出文字)

  • 拉黑聊天记录还在吗(拉黑聊天记录还会见吗)

    拉黑聊天记录还在吗(拉黑聊天记录还会见吗)

  • 苹果11分屏功能在哪里设置(苹果11分屏功能怎么用视频)

    苹果11分屏功能在哪里设置(苹果11分屏功能怎么用视频)

  • k歌被对方拉黑了自己怎么解除(k歌被对方拉黑访问他主页他看的到吗?)

    k歌被对方拉黑了自己怎么解除(k歌被对方拉黑访问他主页他看的到吗?)

  • 表格怎么按拼音排序(表格怎么按拼音顺序排列)

    表格怎么按拼音排序(表格怎么按拼音顺序排列)

  • 华为手机怎样退出屏幕朗读(华为手机怎样退出纯净模式)

    华为手机怎样退出屏幕朗读(华为手机怎样退出纯净模式)

  • 美版max是单卡还是双卡(美版max有什么坏处)

    美版max是单卡还是双卡(美版max有什么坏处)

  • 手机录音权限在哪里设置(开启录音权限)

    手机录音权限在哪里设置(开启录音权限)

  • tft屏幕和ips屏幕区别(tft屏幕和ips屏幕哪个好)

    tft屏幕和ips屏幕区别(tft屏幕和ips屏幕哪个好)

  • ipad黑屏充电无反应(ipad黑屏充电无反应后壳有点发热)

    ipad黑屏充电无反应(ipad黑屏充电无反应后壳有点发热)

  • 手机qq分身怎么弄(qq分身怎么用)

    手机qq分身怎么弄(qq分身怎么用)

  • 京东必购码怎么赠送(京东必购码怎么取消绑定)

    京东必购码怎么赠送(京东必购码怎么取消绑定)

  • 喜马拉雅听书怎么听不了了(喜马拉雅听书怎么取消自动续费)

    喜马拉雅听书怎么听不了了(喜马拉雅听书怎么取消自动续费)

  • 蓝牙耳机power off中文意思(蓝牙耳机power off怎么开机)

    蓝牙耳机power off中文意思(蓝牙耳机power off怎么开机)

  • 西文文字在哪里设置(西文使用中文字体是什么意思)

    西文文字在哪里设置(西文使用中文字体是什么意思)

  • 电脑怎么注销qq号(电脑怎么注销QQ)

    电脑怎么注销qq号(电脑怎么注销QQ)

  • 苹果x人脸动画在哪(苹果x人脸动画怎么关闭)

    苹果x人脸动画在哪(苹果x人脸动画怎么关闭)

  • 第一弹现在怎么搜资源(第一弹彻底不能用了吗)

    第一弹现在怎么搜资源(第一弹彻底不能用了吗)

  • 索尼xperia1怎么设置息屏时间

    索尼xperia1怎么设置息屏时间

  • 手机视频怎样通过蓝牙在电视上播放

    手机视频怎样通过蓝牙在电视上播放

  • 查找朋友位置不可用(查找朋友位置不可用 通知怎么设置)

    查找朋友位置不可用(查找朋友位置不可用 通知怎么设置)

  • win11怎么设置开机启动项? win11开机启动项添加删除的方法(Win11怎么设置开机跳过密码)

    win11怎么设置开机启动项? win11开机启动项添加删除的方法(Win11怎么设置开机跳过密码)

  • Echarts 饼图基本用法(echarts饼图参数配置)

    Echarts 饼图基本用法(echarts饼图参数配置)

  • 时间格式的转换---全(时间格式转换成小时数)

    时间格式的转换---全(时间格式转换成小时数)

  • 企业如何做增量
  • 税务清算需要什么条件
  • 机械租赁适用税率
  • 企业所得税应纳税所得额怎么算
  • 什么经营范围可以开茶叶发票
  • 企业对外付汇怎么入账
  • 公益募捐什么意思
  • 材料采购合同需要注意什么
  • 咨询服务费的印花税率
  • 流动资产短期借款
  • 以前年度损益调整会计分录
  • 以前借款没做账现在收回来怎么做账务处理?
  • 受委托加工物资双方账务处理怎么做
  • 收入做多增值税怎么算
  • 印花税应税凭证填是还是否
  • 出口货物免抵退申报明细录入怎么填
  • 计提工资大于实发工资
  • 金融机构在境外
  • 补缴房产税需要什么资料
  • 局域网文件共享不稳定
  • 电脑硬件检修
  • 事业单位年终事迹材料
  • PHP:mb_encoding_aliases()的用法_mbstring函数
  • 销售货物货款未收到会计分录
  • vue 高德地图 窗体
  • 500万元固定资产管理办法
  • 明细账是什么样子
  • 往来款怎么查
  • 代理业务收入包括哪些
  • 收到税务局退回的企业所得税分录
  • nvm for window
  • 蓝色向日葵
  • framework在哪里打开
  • SSD目标检测算法
  • yolov5 libtorch
  • speedtest教程
  • 使用筷子就餐会不会传染乙肝病毒
  • 已经结账的账目怎么冲红
  • 合同没有约定发票税点谁承担怎么办
  • 计入固定资产成本的税费有哪些
  • react高阶组件
  • 织梦自适应代码怎么做
  • 残保金滞纳金可以税前扣除吗
  • 当期进项加计额怎么填
  • 存货跌价准备的特点
  • 企业现金流量表怎么分析
  • 产品广告费属于什么会计科目类别
  • 什么是保函保证金
  • 以前年度的费用发票怎么入账
  • 防暑降温费计入工资还是福利费
  • 机动车经销企业开具机动车发票
  • 预计负债转回对所得税费用的影响
  • 出口转内销会计分录举例
  • 收到代持股权的账务处理
  • 流动资金周转次数计算公式
  • 银行代扣水电费发票到哪里打
  • 建筑劳务公司的账务处理流程
  • 预提费用在新会计准则下该如何列支?
  • 无形资产摊销年限最新规定
  • 用工资冲借款报税可以吗
  • 物业管理企业应设置代管基金和代收款项账户
  • 侧边栏应用
  • u盘安装linux系统遇到的问题
  • linux命令date
  • kpg是什么文件
  • win7系统图形设置选项
  • 放大镜windows快捷键
  • u深度如何装win7系统
  • win10专业版怎么改用户名
  • win10电脑补丁 kb5000802
  • 创建nodejs 基于express项目
  • 基于android的app
  • linux u+s
  • CloudEditText
  • 河北省国家税务局电子税务局
  • 陕西国税电子税务局app
  • 学费减免政策
  • 广西税务移动办税平台app
  • 代收工会经费标准规定
  • 契税维修基金交给谁
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设