OpenCV :图像基本操作

共 21508字,需浏览 44分钟

 ·

2023-10-23 21:26

点击上方小白学视觉”,选择加"星标"或“置顶

          
          
重磅干货,第一时间送达

转自:AI技术前线


大家好,今天分享这篇文章主要介绍了OpenCV基本操作中的图像基础操作,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考。

01

加载图像


  • imread 功能是加载图像文件成为一个 Mat 对象,其中第一个参数表示图像文件名称,第二个参数表示加载的图像是什么类型,支持常见的三个参数值

  • IMREAD_UNCHANDED(<0) 表示加载原图,不做任何改变

  • IMREAD_GRAYSCALE(0) 表示吧原图作为灰度图像加载进来

  • IMREAD_COLOR(>0) 表示把原图作为 RGB 图像加载进来


注意:OpenCV 支持 JPG、PNG、TIFF 等常见格式图像文件加载(默认读取的格式是 BGR)
               
               
# 导入 OpenCV 库import cv2 as cv# 加载图像img = cv.imread("./1.jpg")# 打印图像类型print(type(img))print(img)

输出:


可以发现这是个 numpy 数据类型的,而且是三个维度的,比如 [H,W,C]

图像显示

               
               
# 导入 OpenCV 库import cv2 as cv
# 加载图像img = cv.imread("./1.jpg")
# 图像的显示,也可以创建多个窗口cv.imshow("image",img)
# 等待时间,毫秒级,0 表示任意键终止cv.waitKey(0)cv.destroyAllWindows()

输出:(按下任意键关闭该窗口)

数据读取-图像

               
               
# 导入 OpenCV 库import cv2 as cv
# 灰色显示img = cv.imread("./1.jpg",cv.IMREAD_GRAYSCALE)
# 打印信息print(img)

输出:


这里打印的结果就不像上面那样有三个维度了,因为是灰色的,也就是没有彩色的,所以这里表示的只有 H 和 W。

当然,这里的代码只是打印信息而已,还不能显示到窗口,显示到窗口还需要增加几句代码,如下:

               
               
# 导入 OpenCV 库import cv2 as cv
img = cv.imread("./1.jpg",cv.IMREAD_GRAYSCALE)cv.imshow("image",img)cv.waitKey(0)cv.destroyAllWindows()

输出:(可以发现,图片是以灰色显示了的)

截取部分图像数据

# 导入 OpenCV 库import cv2 as cv# 加载图像img = cv.imread("./1.jpg",)# 截取部分图像cat = img[0:200, 0:200]# 显示截取的图像cv.imshow("cat",cat)cv.waitKey(0)cv.destroyAllWindows()
输出:

颜色通道提取

通过 cv2 的 split() 方法可以进行颜色的通道提取

               
               
# 导入 OpenCV 库import cv2 as cv
img = cv.imread("./1.jpg",)b,g,r = cv.split(img)
print(b)

输出:


只保留 R

上面说过 OpenCV 默认读取的格式是 BGR

               
               
# 导入 OpenCV 库import cv2 as cv
img = cv.imread("./1.jpg",)cur_img = img.copy()
# 注意参数的变化cur_img[:,:,0] = 0cur_img[:,:,1] = 0cv.imshow('R',cur_img)cv.waitKey(0)cv.destroyAllWindows()

R 是 Red 的缩写,这里显示的是红色

只保留 G

               
               
# 导入 OpenCV 库import cv2 as cv

img = cv.imread("./1.jpg",)cur_img = img.copy()# 注意参数的变化cur_img[:,:,0] = 0cur_img[:,:,2] = 0cv.imshow('G',cur_img)cv.waitKey(0)cv.destroyAllWindows()

G 是 Green 的缩写,这里显示的是绿色

只保留 B
               
               
# 导入 OpenCV 库import cv2 as cv
img = cv.imread("./1.jpg",)cur_img = img.copy()# 注意参数的变化cur_img[:,:,1] = 0cur_img[:,:,2] = 0cv.imshow('B',cur_img)cv.waitKey(0)cv.destroyAllWindows()

B 是 Blue 的缩写,这里显示的是蓝色

边界填充 
               
               
# 导入 OpenCV 库import cv2 as cv# 导入 maplotlibimport matplotlib.pyplot as plt
img = cv.imread("./1.jpg",)# 定义图片显示大小top_size,buttom_size,left_size,right_size = (50,50,50,50)# 复制法,也就是复制最边缘像素replicate = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_REPLICATE)
# 反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcbajabcdefghjhgfedcbreflect = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_REFLECT)# 反射法,也就是以最边缘像素为轴、对称、gfedcbjabcdefghigfedcbareflect01 = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_REFLECT_101)# 外包装法 cdeifghjabcdefghjabcdefgwrap = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_WRAP)# 常量法,常数值填充constant = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_CONSTANT)# 设置图像位置plt.subplot(231)# 设置图像显示plt.imshow(img,'gray')# 设置标题plt.title('ORIGINAL')
plt.subplot(232)plt.imshow(replicate,'gray')plt.title("REPLICATE")
plt.subplot(233)plt.imshow(reflect,'gray')plt.title("REFLECT")
plt.subplot(234)plt.imshow(reflect01,'gray')plt.title("REPLICATE01")
plt.subplot(235)plt.imshow(wrap,'gray')plt.title("WRAP")
plt.subplot(236)plt.imshow(constant,'gray')plt.title("CONSTANT")# 图像显示plt.show()


第一幅图是原始的图片,其它的都是进行过处理的

  • BORDER_REPLICATE :复制法,也就是复制最边缘像素

  • BORDER_REFLECT :反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcbajabcdefghjhgfedcb(这里我也不是很明白,会的朋友请在评论区解释下,感谢)

  • BORDER_REFLECT_101 :反射法,也就是以最边缘像素为轴、对称、gfedcbjabcdefghigfedcba

  • BORDER_WRAP :外包装法 cdeifghjabcdefghjabcdefg

  • BORDER_CONSTANT :常量法,常数值填充

数值计算

               
               
import cv2 as cv
img = cv.imread("./1.jpg")
img2 = img + 10img[:5,:,0]
print(img)print("--------------------------")print(img2)

我们来看下这段代码的输出结果:(由于输出结果有点长,这里只截取部分结果)

这是 img 的输出,注意观察它的值


这是 img2 的输出,可以发现,img2 中的每个值都加了 10 ,如果值超出 255 ,

则得到结果如:253 + 10 = 263,263 - 255 = 7,那么计算结果就为 7

图像融合

需要融合的两张图像如下:


               
               
import cv2 as cv
img = cv.imread("./1.jpg")img_cat = cv.imread("./2.jpg")
result = img + img_catprint(result)

输出:


说明 img 和 img_cat 的值是不相同的,所以需要转换一下。

               
               
import cv2 as cv
img = cv.imread("./1.jpg")img_cat = cv.imread("./2.jpg")
print(img.shape)print(img_cat.shape)

可以发现,两张图像的 H 和 W 值确实是不相等的,所以无法进行数值相加

正确计算数值

               
               
import cv2 as cv
img = cv.imread("./1.jpg")img_cat = cv.imread("./2.jpg")print(img.shape)# 设置与 img 一样的数值img_cat = cv.resize(img_cat,(721,300))print(img_cat.shape)

现在两张的数值是相等的了,可以进行图像融合了,这里其实就是使用了 resize() 方法将其扩大了

完整代码:

               
               
import cv2 as cvimport matplotlib.pyplot as plt
img = cv.imread("./1.jpg")img_cat = cv.imread("./2.jpg")# 设置与 img 一样的数值img_cat = cv.resize(img_cat,(721,300))# 设置宽度值res = cv.addWeighted(img,0.4,img_cat,0.6,0)
# 图像显示plt.imshow(res)plt.show()

输出:(prefect)


02

图像保存


图像的保存非常简单,只需要使用 imwrite() 方法即可将图像保存起来:

               
               
# 导入 OpenCV 库import cv2 as cv# 读取图像img = cv.imread("./1.jpg",cv.IMREAD_GRAYSCALE)# 图像保存# 第一个参数是图像要保存的路径,第二个图像是要保存的图像cv.imwrite("./demo.jpg",img)

执行上面的代码就会在当前路径下生成一整 demo.jpg 的图像


03

数据读取-视频


cv2.VideoCapture 可以捕获摄像头,用数字来控制不同的设备,例如 0,1,如果是视频文件,直接指定好路径即可
举例:

(1)读取视频

               
               
video = cv2.VideoCapture("demo.mp4")

(2)检查视频是否打开正确

               
               
# 检查是否打开正确if video.isOpened(): # 我们都知道视频和游戏其实都是由图像组成的,通过访问图像的帧数连贯形成的,这里也是一样 # video.read() 一帧一帧地读取 # open 得到的是一个布尔值,就是 True 或者 False # frame 得到当前这一帧的图像 open, frame = video.read()else: open = False

(3)遍历每一帧图像

               
               
while open: ret, frame = video.read() # 如果读到的帧数不为空,那么就继续读取,如果为空,就退出 if frame is None: break if ret == True: # 转换为灰度图 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) cv2.imshow("video",gray) # 这里使用 waitKey 可以控制视频的播放速度,数值越小,播放速度越快 # 这里等于 27 也即是说按下 ESC 键即可退出该窗口 if cv2.waitKey(10) & 0xFF == 27: breakvideo.release()cv2.destroyAllWindows()
完整代码如下:

               
               
import cv2
video = cv2.VideoCapture("./demo.mp4")
# 检查是否打开正确if video.isOpened(): # 我们都知道视频和游戏其实都是由图像组成的,通过访问图像的帧数连贯形成的,这里也是一样 # video.read() 一帧一帧地读取 # open 得到的是一个布尔值,就是 True 或者 False # frame 得到当前这一帧的图像 open, frame = video.read()else:    open = False
while open: ret, frame = video.read() # 如果读到的帧数不为空,那么就继续读取,如果为空,就退出 if frame is None: break if ret == True: # 转换为灰度图 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) cv2.imshow("video",gray) # 这里使用 waitKey 可以控制视频的播放速度,数值越小,播放速度越快 # 这里等于 27 也即是说按下 ESC 键即可退出该窗口 if cv2.waitKey(10) & 0xFF == 27: breakvideo.release()cv2.destroyAllWindows()


当然,上面的程序是将原视频设置为灰色的,想要显示的是原视频,只需要修改上述代码中的两个部分就行了

  • 注释掉设置灰色的部分

  • 将原视频显示在窗口上




原文链接:https://blog.csdn.net/Woo_home/article/details/106005676

作者:Woo_home
文章来源:CSDN博客


本文仅做学术分享,如有侵权,请联系删文。

              
              
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 819
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报