使用Python+OpenCV进行图像处理之入门教程-轻识

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

简介

人脸识别和目标检测这样的术语听起来觉得很酷，但是当涉及到从头开始实现它们时，每个初学者都会觉得困难，这些技术实际上并没有那么难实现，一旦你掌握了其基本原理，那么实现它们就相当简单了。

图像处理有很多种应用，包括用于解析文档和生成相应文本的光学字符识别(OCR)、图像增强与重建、物体识别、人体运动识别、手势识别、人脸识别等。

在学习的过程中，你会遇到过奇形怪状的各种图像滤波器，那有没有去思考如何实现它吗，在本文中，我们将通过实现一个简单的滤波器来开始我们的图像处理之旅！

什么是OpenCV

OpenCV是一个开源库，包含了许多计算机视觉算法。它在计算机视觉和图像处理中起着重要作用，用于实时操作，其效率足以满足工业上的要求。OpenCV可以与其他库一起使用，比如Numpy，这使得Python能够处理OpenCV数组结构。

实现我们的第一个滤波器

检测逻辑

计算机不能像人类一样识别物体，为了能让计算机达到这个目的，我们可以使用各种技术来让计算机理解图像，我们会将颜色作为检测物体的主要依据。

我们使用HSV颜色空间作为检测特征。

什么是HSV

HSV是Hue, Saturation 和Value(色调、饱和度和值)。

色调：根据光谱，物体的颜色可分为红、蓝、绿、黄四种颜色。
饱和度：它定义了颜色的强度。
值：定义颜色的亮度。

OpenCV中有150多种颜色空间转换方法，其中一种是彩色图像到HSV图像的转换。

我们来看看代码

我们需要导入我们要使用的库-OpenCV(cv2)和Numpy。

import cv2
import numpy as np

Numpy是一个python库，用于处理数组，它比传统的python列表快50倍，这对我们来说非常重要，因为我们要处理很多图像。Numpy给了我们在线性代数、傅立叶变换、矩阵等领域工作的函数。

import cv2
import numpy as np
def nothing():
  pass
cap=cv2.VideoCapture(0)
while(1):
  _, img = cap.read()
  k=cv2.waitkey(1)&0xFF
  if k==27:
    break
cap.release()
cv2.destroyAllWindows()

我们创建了一个回调函数，它什么也不做，让我们看看为什么。

我们使用一个窗口来控制HSV，因为我们不知道要检测的对象的HSV，因此我们用它来调整HSV的上下限。

因为当我们使用创建trackbar的方法时，我们需要传递一个必要的回调函数，在我们的例子中，这个回调函数什么也不做(但是它的使用会根据父函数的需要而改变)；然后我们使用了一个方法cv2.videocapture(0)，它是一个内置函数，用来从默认摄像机捕捉视频(0表示选择默认摄像机)；最后，我们删除了所有的窗口，并在一个点击事件(这里我们设置为ESC键)后释放捕获。

我们可以用下面的函数命名一个窗口。

cv2.namedWindow()

让我们继续敲代码…

import cv2
import numpy as np
def nothing(x):
    pass
  
cap=cv2.VideoCapture(0)
cv2.namedWindow('tracking')
cv2.createTrackbar('LH','tracking',0,255,nothing)
cv2.createTrackbar('LS','tracking',0,255,nothing)
cv2.createTrackbar('LV','tracking',0,255,nothing)
cv2.createTrackbar('UH','tracking',255,255,nothing)
cv2.createTrackbar('US','tracking',255,255,nothing)
cv2.createTrackbar('UV','tracking',255,255,nothing)

因此，在设置检测条件后，我们需要将原始数据(即彩色图像)转换为HSV图像。为了将基本彩色图像转换为HSV图像，我们使用

 = cv2.cvtColor(,cv2.COLOR_BGR2HSV)

然后利用Numpy数组方法设置trackbar中数据的上下界。

 = np.array()

使用这个，我们会得到上面设置的所有轨迹条值。接下来我们主要做两件事：

1.创建掩码

掩码是一种二进制图像，它指示要在其中执行操作的像素。

2.我们将使用位和逻辑来屏蔽原始图像。我们使用名为“bitwise_and”的cv2方法，它执行逻辑与运算。

 = cv2.inRange(hav, l_b, u_b)

res = cv2.bitwise_and(, , mask = )

import cv2
import numpy as np
def nothing(x):
    pass
cap=cv2.VideoCapture(0)

cv2.namedWindow('tracking')
cv2.createTrackbar('LH','tracking',0,255,nothing)
cv2.createTrackbar('LS','tracking',0,255,nothing)
cv2.createTrackbar('LV','tracking',0,255,nothing)
cv2.createTrackbar('UH','tracking',255,255,nothing)
cv2.createTrackbar('US','tracking',255,255,nothing)
cv2.createTrackbar('UV','tracking',255,255,nothing)

while (1):
    _, img=cap.read()
    hav=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
    l_h=cv2.getTrackbarPos('LH','tracking')
    l_s=cv2.getTrackbarPos('LS', 'tracking')
    l_v=cv2.getTrackbarPos('LV', 'tracking')
    u_h=cv2.getTrackbarPos('UH', 'tracking')
    u_s=cv2.getTrackbarPos('US', 'tracking')
    u_v=cv2.getTrackbarPos('UV', 'tracking')
    l_b=np.array([l_h,l_s,l_v])
    u_b=np.array([u_h,u_s,u_v])
    mask=cv2.inRange(hav, l_b, u_b)
    res = cv2.bitwise_and(img, img, mask=mask)
    cv2.imshow('image', img)
    cv2.imshow('mask', mask)
    cv2.imshow('res', res)
    k=cv2.waitKey(1)&0xFF
    if k==27:
        break
cap.release()
cv2.destroyAllWindows()

这些帧使用名为“imshow”的方法显示。

cv2.imshow(, )

结果

结果只检测到粉红色的物体，这是因为我们只想选择粉红色的物体！实际上，我们已经使用轨迹条为特定的粉红色设置了HSV值，这就是输出只有特定粉红色的原因。您可以选择要检测的任何特定颜色值。

结论

本文我们实现了一个滤波器，可以检测我们指定特定颜色的物体。我们所做的只是图像处理和目标检测的一个非常基本的介绍性任务。近年来，计算机视觉领域有了很大的发展，其中大部分都包含了机器学习和深度学习技术。在许多项目中，对象检测是首先执行的基本任务，因为它为我们提供了有关环境的信息，我们可以根据使用情况进行过滤。

参考引用

Implementing colour and shape-based object detection and tracking with OpenCV(https://hub.packtpub.com/implementing-color-and-shape-based-object-detection-and-tracking-with-opencv-and-cuda-tutorial/).

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目31讲

在「小白学视觉」公众号后台回复：Python视觉实战项目31讲，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

下载4：leetcode算法开源书

在「小白学视觉」公众号后台回复：leetcode，即可下载。每题都 runtime beats 100% 的开源好书，你值得拥有！

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~