爆款云主机2核4G限时秒杀,88元/年起!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心

      OpenCV从入门到精通实战(五)——dnn加载深度学习模型

      首页 知识中心 软件开发 文章详情页

      OpenCV从入门到精通实战(五)——dnn加载深度学习模型

      2024-11-27 03:26:40 阅读次数:23

      代码,图像处理,路径

      从指定路径读取图像文件、利用OpenCV进行图像处理,以及使用Caffe框架进行深度学习预测的过程。
      下面是程序的主要步骤和对应的实现代码总结:

      1. 导入必要的工具包和模型

      程序开始先导入需要的库os、numpy、cv2,同时导入utils_paths模块,后者用于处理图像路径。接着,读取Caffe模型和配置文件,这些文件提供了使用预训练深度学习模型进行图像分类的基础。

      import utils_paths
      import numpy as np
      import cv2
      
      net = cv2.dnn.readNetFromCaffe("bvlc_googlenet.prototxt", "bvlc_googlenet.caffemodel")

      2. 读取图像文件

      使用utils_paths.list_images函数遍历指定目录,获取所有图像文件的路径。

      imagePaths = sorted(list(utils_paths.list_images("images/")))

      3. 图像预处理

      选择路径列表中的第一个图像进行读取,调整其大小以符合模型输入需求,并通过cv2.dnn.blobFromImage创建适合Caffe模型的输入blob。

      image = cv2.imread(imagePaths[0])
      resized = cv2.resize(image, (224, 224))
      blob = cv2.dnn.blobFromImage(resized, 1, (224, 224), (104, 117, 123))

      4. 模型预测和结果展示

      设定模型输入,执行前向传播获取预测结果,找出概率最高的类别,并在图像上显示预测标签和概率。

      net.setInput(blob)
      preds = net.forward()
      idx = np.argsort(preds[0])[::-1][0]
      text = "Label: {}, {:.2f}%".format(classes[idx], preds[0][idx] * 100)
      cv2.putText(image, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)
      cv2.imshow("Image", image)
      cv2.waitKey(0)

      5. 批量图像处理

      对多个图像执行上述步骤,生成多图像的输入blob,并对每个图像执行预测,展示结果。

      images = []
      for p in imagePaths[1:]:
          image = cv2.imread(p)
          image = cv2.resize(image, (224, 224))
          images.append(image)
      
      blob = cv2.dnn.blobFromImages(images, 1, (224, 224), (104, 117, 123))
      net.setInput(blob)
      preds = net.forward()
      
      for (i, p) in enumerate(imagePaths[1:]):
          image = cv2.imread(p)
          idx = np.argsort(preds[i])[::-1][0]
          text = "Label: {}, {:.2f}%".format(classes[idx], preds[i][idx] * 100)
          cv2.putText(image, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)
          cv2.imshow("Image", image)
          cv2.waitKey(0)

      完整代码

      utils_paths.py

      import os
      
      
      image_types = (".jpg", ".jpeg", ".png", ".bmp", ".tif", ".tiff")
      
      
      def list_images(basePath, contains=None):
          # return the set of files that are valid
          return list_files(basePath, validExts=image_types, contains=contains)
      
      
      def list_files(basePath, validExts=None, contains=None):
          # loop over the directory structure
          for (rootDir, dirNames, filenames) in os.walk(basePath):
              # loop over the filenames in the current directory
              for filename in filenames:
                  # if the contains string is not none and the filename does not contain
                  # the supplied string, then ignore the file
                  if contains is not None and filename.find(contains) == -1:
                      continue
      
                  # determine the file extension of the current file
                  ext = filename[filename.rfind("."):].lower()
      
                  # check to see if the file is an image and should be processed
                  if validExts is None or ext.endswith(validExts):
                      # construct the path to the image and yield it
                      imagePath = os.path.join(rootDir, filename)
                      yield imagePath

      blob_from_images.py

      # 导入工具包
      import utils_paths
      import numpy as np
      import cv2
      
      # 标签文件处理
      rows = open("synset_words.txt").read().strip().split("\n")
      classes = [r[r.find(" ") + 1:].split(",")[0] for r in rows]
      
      # Caffe所需配置文件
      net = cv2.dnn.readNetFromCaffe("bvlc_googlenet.prototxt",
      	"bvlc_googlenet.caffemodel")
      
      # 图像路径
      imagePaths = sorted(list(utils_paths.list_images("images/")))
      
      # 图像数据预处理
      image = cv2.imread(imagePaths[0])
      resized = cv2.resize(image, (224, 224))
      # image scalefactor size mean swapRB 
      blob = cv2.dnn.blobFromImage(resized, 1, (224, 224), (104, 117, 123))
      print("First Blob: {}".format(blob.shape))
      
      # 得到预测结果
      net.setInput(blob)
      preds = net.forward()
      
      # 排序,取分类可能性最大的
      idx = np.argsort(preds[0])[::-1][0]
      text = "Label: {}, {:.2f}%".format(classes[idx],
      	preds[0][idx] * 100)
      cv2.putText(image, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
      	0.7, (0, 0, 255), 2)
      
      # 显示
      cv2.imshow("Image", image)
      cv2.waitKey(0)
      
      # Batch数据制作
      images = []
      
      # 方法一样,数据是一个batch
      for p in imagePaths[1:]:
      	image = cv2.imread(p)
      	image = cv2.resize(image, (224, 224))
      	images.append(image)
      
      # blobFromImages函数,注意有s
      blob = cv2.dnn.blobFromImages(images, 1, (224, 224), (104, 117, 123))
      print("Second Blob: {}".format(blob.shape))
      
      # 获取预测结果
      net.setInput(blob)
      preds = net.forward()
      for (i, p) in enumerate(imagePaths[1:]):
      	image = cv2.imread(p)
      	idx = np.argsort(preds[i])[::-1][0]
      	text = "Label: {}, {:.2f}%".format(classes[idx],
      		preds[i][idx] * 100)
      	cv2.putText(image, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
      		0.7, (0, 0, 255), 2)
      	cv2.imshow("Image", image)
      	cv2.waitKey(0)

      OpenCV从入门到精通实战(五)——dnn加载深度学习模型

      OpenCV从入门到精通实战(五)——dnn加载深度学习模型

       

      OpenCV从入门到精通实战(五)——dnn加载深度学习模型

       

      OpenCV从入门到精通实战(五)——dnn加载深度学习模型

      以下是后续代码的改进:

      6. 异常处理和验证

      在处理文件读取和图像处理时,加入异常处理可以避免在文件不存在或损坏时程序崩溃。

      try:
          image = cv2.imread(imagePath)
          if image is None:
              raise ValueError("无法读取图像: {}".format(imagePath))
          resized = cv2.resize(image, (224, 224))
      except Exception as e:
          print("处理图像时发生错误: ", e)

      7. 性能优化

      对于图像处理和预测,尤其是批量操作时,可以通过并行处理技术来加速这些操作。例如,使用Python的concurrent.futures模块进行并行读取和预处理图像。

      from concurrent.futures import ThreadPoolExecutor
      
      def process_image(path):
          image = cv2.imread(path)
          image = cv2.resize(image, (224, 224))
          return image
      
      with ThreadPoolExecutor() as executor:
          images = list(executor.map(process_image, imagePaths))

      8. 动态输入和命令行工具

      将脚本转换为可接受命令行参数的形式,使其更灵活,能够通过命令行直接指定图片路径、模型文件等。

      import argparse
      
      parser = argparse.ArgumentParser(description='图像分类预测')
      parser.add_argument('--image_dir', type=str, required=True, help='图像目录路径')
      parser.add_argument('--model', type=str, required=True, help='模型文件路径')
      args = parser.parse_args()
      
      imagePaths = sorted(list(utils_paths.list_images(args.image_dir)))
      net = cv2.dnn.readNetFromCaffe("bvlc_googlenet.prototxt", args.model)

      9. GUI界面

      为了使程序更友好,可以开发一个基于图形用户界面的应用,允许用户通过图形界面选择图像和观看结果,而不是仅限于命令行。

      import tkinter as tk
      from tkinter import filedialog
      
      def load_image():
          path = filedialog.askopenfilename()
          return cv2.imread(path), path
      
      root = tk.Tk()
      load_button = tk.Button(root, text='加载图像', command=load_image)
      load_button.pack()
      root.mainloop()
      版权声明:本文内容来自第三方投稿或授权转载,原文地址:https://blog.51cto.com/u_13859040/10761261,作者:qq5b42bed9cc7e9,版权归原作者所有。本网站转在其作品的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如因作品内容、版权等问题需要同本网站联系,请发邮件至ctyunbbs@chinatelecom.cn沟通。

      上一篇:ffmpeg音视频开发从入门到精通——ffmpeg实现音频抽取

      下一篇:OpenCV基本图像处理操作(八)——光流估计

      相关文章

      2025-05-19 09:05:01

      【手把手带你刷好题】—— 62.数字三角形(递推、简单DP)

      【手把手带你刷好题】—— 62.数字三角形(递推、简单DP)

      2025-05-19 09:05:01
      func , 三角形 , 数字 , 路径
      2025-05-19 09:04:30

      【Canvas技法】辐射式多道光影的实现

      【Canvas技法】辐射式多道光影的实现

      2025-05-19 09:04:30
      代码 , 函数 , 实现
      2025-05-19 09:04:14

      复杂度的OJ练习

      复杂度的OJ练习

      2025-05-19 09:04:14
      代码 , 复杂度 , 思路 , 数组 , 算法
      2025-05-14 10:33:25

      30天拿下Rust之高级类型

      Rust作为一门系统编程语言,以其独特的内存管理方式和强大的类型系统著称。其中,高级类型的应用,为Rust的开发者提供了丰富的编程工具和手段,使得开发者可以更加灵活和高效地进行编程。

      2025-05-14 10:33:25
      Rust , type , 代码 , 函数 , 类型 , 返回
      2025-05-14 10:33:25

      webpack5基础--13_生产模式介绍

      生产模式是开发完成代码后,我们需要得到代码将来部署上线。

      2025-05-14 10:33:25
      npm , 代码 , 优化 , 指令 , 模式 , 运行
      2025-05-14 10:33:16

      30天拿下Rust之模式与模式匹配

      Rust语言以其强大的类型系统和所有权模型而著称,而模式与模式匹配则是Rust中一种非常强大且灵活的工具,它允许我们在编译时根据数据的结构进行条件分支处理。

      2025-05-14 10:33:16
      match , 代码 , 匹配 , 模式 , 模式匹配 , 绑定
      2025-05-14 10:07:38

      30天拿下Python之函数

      在Python中,函数是一段可以重复使用的代码块,它可以提高代码的可重用性和可维护性,是编程中非常重要的概念。

      2025-05-14 10:07:38
      lambda , 代码 , 传递 , 关键字 , 函数 , 参数 , 定义
      2025-05-14 10:07:38

      30天拿下Rust之枚举

      Rust中的枚举是一种用户定义的类型,它允许你为一组相关的值赋予友好的名称。在Rust中,枚举是强大的工具,它们不仅仅用于表示几个固定的值,还可以包含函数和方法,使得枚举成员可以有自己的行为。

      2025-05-14 10:07:38
      match , None , Rust , 代码 , 枚举 , 类型
      2025-05-14 10:03:13

      AJAX-事件循环(超详细过程)

      JS有一个基于事件循环的并发模型,事件循环负责执行代码、收集和处理事件以及执行队列中的子任务。

      2025-05-14 10:03:13
      代码 , 任务 , 出栈 , 异步 , 执行 , 调用 , 队列
      2025-05-14 10:03:05

      30天拿下Python之模块和包

      Python的模块(Module)和包(Package)是Python的两个主要概念,它们都是用来组织和封装代码的机制。

      2025-05-14 10:03:05
      Python , 代码 , 函数 , 导入 , 文件 , 模块
      查看更多
      推荐标签

      作者介绍

      天翼云小翼
      天翼云用户

      文章

      33561

      阅读量

      5237727

      查看更多

      最新文章

      【Canvas技法】辐射式多道光影的实现

      2025-05-19 09:04:30

      复杂度的OJ练习

      2025-05-19 09:04:14

      30天拿下Rust之高级类型

      2025-05-14 10:33:25

      webpack5基础--13_生产模式介绍

      2025-05-14 10:33:25

      30天拿下Rust之模式与模式匹配

      2025-05-14 10:33:16

      30天拿下Python之函数

      2025-05-14 10:07:38

      查看更多

      热门文章

      Java获取项目根路径及classes路径

      2023-02-20 10:34:59

      C/C++ 获取进程完整目录

      2023-06-19 07:02:24

      Spring 测试运行的时候提示 Unable to find a @SpringBootConfiguration 错误

      2023-06-28 09:05:02

      CE修改器入门:查找共享代码

      2023-07-20 06:03:18

      写HTML页面浏览器控制台报错:“codemirror.min.css 未载入,因为它的 MIME 类型 “text/html“ 不是 “text/css“。“

      2023-07-18 09:52:01

      路径Path模块

      2023-07-19 07:27:17

      查看更多

      热门标签

      java Java python 编程开发 代码 开发语言 算法 线程 Python html 数组 C++ 元素 javascript c++
      查看更多

      相关产品

      弹性云主机

      随时自助获取、弹性伸缩的云服务器资源

      天翼云电脑(公众版)

      便捷、安全、高效的云电脑服务

      对象存储

      高品质、低成本的云上存储服务

      云硬盘

      为云上计算资源提供持久性块存储

      查看更多

      随机文章

      Java实现输出双色球摇号问题

      一个python 程序执行顺序

      最简单的人工智能代码

      编程工具的选择对开发者效率的影响:一项数据驱动的探讨

      创建型模式-抽象工厂模式

      Spring第一弹—-全面阐述Spring及轻重量级容器的划分

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号