基于Python的颜色识别器

小白学视觉

共 2445字,需浏览 5分钟

 ·

2020-10-02 10:07

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

在这篇文章中,我们将展示如何使用Python构建颜色识别器。此过程也称为“颜色检测”。我们将创建一个基本应用程序,该应用程序将帮助我们检测图像中的颜色。该程序还将返回颜色的RGB值。构建颜色识别器是Computer Vision中最基础的项目。

如果大家以前从未听说过Computer Vision,那么这是了解它的最佳时间。大多数机器学习和人工智能领域都与计算机视觉紧密相关。随着我们的发展和探索,看到外部世界对我们的发展具有重大影响。对于机器来说,情况也是如此,他们使用图像看到外界,并且这些图像被转换为计算机可以理解的数据值。

目录

入门

定义图片

颜色识别

应用

结果

入门

我们将为此项目使用三个主要模块。它们是NumPy,Pandas和OpenCv。OpenCv是一个高度优化的库,专注于实时应用程序。

OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库。OpenCV的构建旨在为计算机视觉应用程序提供通用的基础结构,并加速在商业产品中使用机器感知。

资料来源:https : //opencv.org

如前所述,我们将在此项目中使用三个模块。要使用这些模块,我们必须安装必要的库。使用pip安装库非常简单。Pip是程序包管理工具。我们将使用命令行界面进行安装。这是一次安装所有3个库的行:

pip install numpy pandas opencv-python

安装完成后,我们必须将它们导入到我们的程序中。在大家喜欢的代码编辑器中打开一个新文件。以下是有关如何导入已安装库的代码:

import numpy as np
import pandas as pd
import cv2

OpenCv导入为cv2。对于其他库,我们将它们“ as”导入,以便在程序中更轻松地调用它们。

完善!现在,我们可以进行下一步,在此步骤中,我们将定义要用于测试颜色识别器应用程序的图像。

定义图片

您可以选择任何想要的图像。我将图像保存在与程序相同的文件夹中,这使查找和导入更加容易。

img = cv2.imread("color_image.jpg")

为了给您一些想法,这是我将用于此项目的图像:

大家准备好进行一些编程了吗?让我们继续下一步。

颜色识别

我问大家一个好问题。小伙伴们知道机器就相当于一张白纸吗?我们认为是因为他们学到了教给他们的东西。

教授色彩

首先,我们必须教给他们什么是颜色。为此,我们需要包含颜色名称和一些与这些颜色匹配的值的数据。由于大多数颜色都可以使用红色,绿色和蓝色定义。这就是为什么我们将RGB格式用作数据点的原因。我找到了一个准备就绪的csv文件,其中包含大约1000个颜色名称和RGB值。下面是相关链接:

https://github.com/codebrainz/color-names/blob/master/output/colors.csv

我们将在程序中使用此csv文件。该文件的屏幕截图可让您有所了解:

colors.csv

让我们使用read_csv方法将colors.csv文件导入到我们的程序中。由于我们下载的csv文件没有列名,因此我将在程序中定义它们。此过程称为数据处理。

index=["color", "color_name", "hex", "R", "G", "B"]csv = pd.read_csv('colors.csv', names=index, header=None)


全局变量

在以下步骤中,我们将定义两个函数。为了使应用程序顺利运行,我们需要一些全局变量。大家将了解全局变量在使用函数时是如何帮助大家的。

clicked = False
r = g = b = xpos = ypos = 0

颜色识别功能

当我们双击图像的某个区域时,将调用此函数。它将返回颜色名称和该颜色的RGB值。这就是神奇的地方!

def recognize_color(R,G,B):    minimum = 10000    for i in range(len(csv)):        d = abs(R- int(csv.loc[i,"R"])) + abs(G- int(csv.loc[i,"G"]))+ abs(B- int(csv.loc[i,"B"]))        if(d<=minimum):            minimum = d            cname = csv.loc[i,"color_name"]    return cname

鼠标点击功能

此函数用于定义我们的双击过程。在创建应用程序部分时,我们将需要它。

def mouse_click(event, x, y, flags, param):    if event == cv2.EVENT_LBUTTONDBLCLK:        global b,g,r,xpos,ypos, clicked        clicked = True        xpos = x        ypos = y        b,g,r = img[y,x]        b = int(b)        g = int(g)        r = int(r)

希望大家继续和我在一起!看起来可能有些复杂,但是当我们开始在编辑器中编写它们时,大局就会显现出来。我们尽量使事情变得简单易懂。


应用

很高兴大家能完成此步骤。在这一步中,我们将使用OpenCV方法将图像作为新窗口打开。在该窗口中,我们将使用我们先前定义的功能。该应用程序非常简单,当我们双击图像上的某个区域时,它将返回颜色名称和颜色值。

应用窗口

首先,让我向大家展示如何使用OpenCV将图像文件作为新窗口打开。

cv2.namedWindow('Color Recognition App')

其次,让我们调用我们创建的鼠标单击功能。这为我们的应用程序提供了更多功能。

cv2.setMouseCallback('Color Recognition App',mouse_click)

应用程序

这是while循环,用于启动我们的应用程序窗口。

while(1):cv2.imshow("Color Recognition App",img)    if (clicked):           #cv2.rectangle(image, startpoint, endpoint, color, thickness)-1 fills entire rectangle         cv2.rectangle(img,(20,20), (750,60), (b,g,r), -1)#Creating text string to display( Color name and RGB values )        text = recognize_color(r,g,b) + ' R='+ str(r) +  ' G='+ str(g) +  ' B='+ str(b)                #cv2.putText(img,text,start,font(0-7),fontScale,color,thickness,lineType )        cv2.putText(img, text,(50,50),2,0.8,(255,255,255),2,cv2.LINE_AA)#For very light colours we will display text in black colour        if(r+g+b>=600):            cv2.putText(img, text,(50,50),2,0.8,(0,0,0),2,cv2.LINE_AA)                    clicked=False

关闭申请

如果您使用过OpenCV项目,则可能熟悉此步骤。我们必须定义如何结束和关闭应用程序窗口。否则,它将因为我们使用while(1)启动应用程序永远运行。添加以下行是您未来项目的一个好习惯。

#Break the loop when user hits 'esc' key        if cv2.waitKey(20) & 0xFF ==27:        breakcv2.destroyAllWindows()

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 36
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报