彩色图像高斯反向投影

共 4897字,需浏览 10分钟

 ·

2021-09-14 15:23

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

彩色图像高斯反向投影

一:介绍


图像反向投影的最终目的是获取ROI然后实现对ROI区域的标注、识别、测量等图像处理与分析,是计算机视觉与人工智能的常见方法之一。图像反向投影通常是彩色图像投影效果会比灰度图像效果要好,原因在于彩色图像带有更多对象细节信息,在反向投影的时候更加容易判断、而转为灰度图像会导致这些细节信息丢失、从而导致分割失败。最常见的是基于图像直方图特征的反向投影。我们这里介绍一种跟直方图反向投影不一样的彩色图像反向投影方法,通过基于高斯的概率分布公式(PDF)估算,反向投影得到对象区域,该方法也可以看做最简单的图像分割方法。缺点是对象颜色光照改变和尺度改变不具备不变性特征。所以需要在光照度稳定情况下成像采集图像数据。在这种情况下使用的高斯概率密度公式为:

  1. 输入模型M,对M的每个像素点(R,G,B)计算I=R+G+B r=R/I, g=G/I, b=B/I

  2. 根据得到权重比例值,计算得到对应的均值 与标准方差

  3. 对输入图像的每个像素点计算根据高斯公式计算P(r)与P(g)的乘积

  4. 归一化之后输出结果,即为最终基于高斯PDF的反向投影图像


二:算法步骤与代码实现


  1. 首先加载模型图像与测试图像

  2. 根据模型图像计算得到每个通道对应的均值与标准方差参数

  3. 根据参数方差计算每个像素点的PDF值

  4. 归一化概率分布图像-即为反向投影图像,显示

  5. 根据Mask得到最终颜色模型对象分割


完整的基于OpenCV的C++代码如下:


  1. #include<opencv2/opencv.hpp>

  2. #include<iostream>

  3. #include<math.h>

  4. usingnamespace cv;

  5. usingnamespace std;

  6. int main(int argc, char** argv) {

  7.    // 加载模型图像与测试图像

  8.    Mat src = imread("D:/gloomyfish/gc_test.png");

  9.    Mat model = imread("D:/gloomyfish/gm.png");

  10.    if(src.empty() || model.empty()) {

  11.        printf("could not load image...\n");

  12.        return-1;

  13.    }

  14.    imshow("input image", src);

  15.    // 对每个通道 计算高斯PDF的参数

  16.    // 有一个通道不计算,是因为它可以通过1-r-g得到

  17.    // 无需再计算

  18.    Mat R = Mat::zeros(model.size(), CV_32FC1);

  19.    Mat G = Mat::zeros(model.size(), CV_32FC1);

  20.    int r = 0, g = 0, b = 0;

  21.    float sum = 0;

  22.    for(int row = 0; row < model.rows; row++) {

  23.        uchar* current = model.ptr<uchar>(row);

  24.        for(int col = 0; col < model.cols; col++) {

  25.            b = *current++;

  26.            g = *current++;

  27.            r = *current++;

  28.            sum = b + g + r;

  29.            R.at<float>(row, col) = r / sum;

  30.            G.at<float>(row, col) = g / sum;

  31.        }

  32.    }

  33.    // 计算均值与标准方差

  34.    Mat mean, stddev;

  35.    double mr, devr;

  36.    double mg, devg;

  37.    meanStdDev(R, mean, stddev);

  38.    mr = mean.at<double>(0, 0);

  39.    devr = mean.at<double>(0, 0);

  40.    meanStdDev(G, mean, stddev);

  41.    mg = mean.at<double>(0, 0);

  42.    devg = mean.at<double>(0, 0);

  43.    int width = src.cols;

  44.    int height = src.rows;

  45.    // 反向投影

  46.    float pr = 0, pg = 0;

  47.    Mat result = Mat::zeros(src.size(), CV_32FC1);

  48.    for(int row = 0; row < height; row++) {

  49.        uchar* currentRow = src.ptr<uchar>(row);

  50.        for(int col = 0; col < width; col++) {

  51.            b = *currentRow++;

  52.            g = *currentRow++;

  53.            r = *currentRow++;

  54.            sum = b + g + r;

  55.            float red = r / sum;

  56.            float green = g / sum;

  57.            pr = (1/ (devr*sqrt(2* CV_PI)))*exp(-(pow((red - mr), 2)) / (2* pow(devr, 2)));

  58.            pg = (1/ (devg*sqrt(2* CV_PI)))*exp(-(pow((green - mg),2)) / (2* pow(devg, 2)));

  59.            sum = pr*pg;

  60.            result.at<float>(row, col) = sum;

  61.        }

  62.    }

  63.    // 归一化显示高斯反向投影

  64.    Mat img(src.size(), CV_8UC1);

  65.    normalize(result, result, 0, 255, NORM_MINMAX);

  66.    result.convertTo(img, CV_8U);

  67.    Mat segmentation;

  68.    src.copyTo(segmentation, img);

  69.    // 显示

  70.    imshow("backprojection demo", img);

  71.    imshow("segmentation demo", segmentation);

  72.    waitKey(0);

  73.    return0;

  74. }

三:测试图像与效果演示


蓝色矩形框为模型,整个图像为测试图像

反向投影结果

分割提取结果

四:总结


大家看了这个例子总是有点怪怪的,总会想起点什么,如果你能想起点什么的话就是GMM,高斯混合模型,高斯混合模型正是在此基础上进一步演化而来。

好消息,小白学视觉团队的知识星球开通啦,为了感谢大家的支持与厚爱,团队决定将价值149元的知识星球现时免费加入。各位小伙伴们要抓住机会哦!


下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 14
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报