详解图像增强、图像复原领域技术

智能算法

共 3394字,需浏览 7分钟

 ·

2021-08-21 00:17

| 背景


底层计算机视觉技术,如图像增强、图像复原等,一直以来都是一个重要且热门的研究方向。传统的方法多基于稀疏编码、小波变换等技术,近年来,深度学习的兴起为该领域带来了新的发展机遇,同时大幅度提升了方法性能。然而,与工业界源源不断的增强、复原需求相比,现有方法在稳定性、视觉效果、处理速度等方面仍有比较大的提升空间。因此,学术界多数研究组均设有底层视觉相关研究方向,每年均有大量的顶会论文发表。该领域未来的研究及工程落地将继续活跃,借助硬件设备日益增长的计算能力,持续提升方法的稳定性、视觉效果等。



基于深度学习的底层视觉技术无论在理论上还是实践上都有重要意义。首先,理论上,底层视觉对应了所有的图像到图像的处理问题,相比高层视觉任务如图像分类等,底层视觉任务需要求解的解空间更大。其次,在实践上,底层视觉技术已经被应用到日常生活及工业生产的方方面面。以图像超分辨率为例,随着目前手机、电视等显示屏分辨率的提升,高质量视频、图像可以极大提升用户体验。然而,很多存量的经典影视剧受限于拍摄时的技术限制,分辨率相对较低。因此,使用图像超分辨率技术将经典影视剧超分到较高分辨率对各电视台、网络媒体及手机、电视厂商来说都有重大需求。底层视觉技术已经应用到生活生产的方方面面,包括但不限于遥感、医疗图像处理、摄像设备、手机、电视、压缩传输等,有着极大的应用价值。



以基于深度学习的底层视觉技术为例,深入讲解算法知识及方法综述,并基于此讲解研究计划的撰写方法。项目涉及的底层视觉处理前沿技术可以解决生活、工业生产、军工等领域常遇到的低质图像复原或增强问题,同时本项目讲解的研究计划撰写技巧可以直接帮助到同学们进行硕士和博士申请。




1、课程导师



  导师介绍:梁博士

先后于CVPR、ICCV、ECCV、AAAI等国际顶级会议,以及TPAMI、TIP等国际顶级期刊上发表论文13篇

常年担任CVPR、ICCV、ECCV、TIP等国际顶级会议及期刊的审稿人,每年审稿十余篇

曾获CVPR杰出审稿人奖项

拥有丰富的与国内外知名导师合作的经验,对学术前沿及导师招生逻辑有较深的理解

研究领域:基于深度学习的底层计算机视觉任务,包括但不限于图像增强、图像复原等




2、科研课题



课题一:基于自适应实例归一化的先验图像复原技术探究(Image Restoration with deep priors based on Adaptive Instance Normalization)

期待结果:

1、充分理解图像复原研究领域的相关工作发展脉络,能够对现有方法的优缺点进行总结

2、调研学习多种图像归一化策略,思考其在图像复原方向的应用场景

3、在课程期间,思考图像复原任务中可以应用的先验信息,同时思考如何使用自适应实例归一化策略通过相应先验信息对复原网络进行正则化约束

4、撰写相应的研究计划


课题二:基于对比学习的深度无监督图像超分技术探究(Deep Unsupervised Image Super-Resolution based on Contrastive Learning)

期待结果:

1、调研总结基于深度学习的图像超分相关论文并进行总结

2、理解真实图像超分与仿真图像超分之间的联系与区别,并思考真实图像超分面临的技术难点

3、调研对比学习等深度无监督学习任务,思考其与真实图像超分工作的联系络进行正则化约束

4、撰写相应的研究计划


课题三:人类视觉感知特性引导的图像相似度评价指标研究(Image Similarity Metrics Guided by Human Perceptions)

期待结果:

1、通过观察课堂提供的样例,了解目前图像复原、增强方法结果的问题

2、通过对比图像视觉效果与现有评价指标,了解当前指标存在的问题

3、调研图像质量评价、相似度评价等相关文章,设计基于深度学习的更符合人类视觉特性的图像相似度评价指标

4、撰写相应的研究计划


课题四:基于模型蒸馏的高效图像复原及增强方法研究(Efficient Image Restoration and Enhancement based on Model Distillation)

期待结果:

1、充分调研当前图像复原、增强等底层视觉方法的运行速度及复杂度,并进行总结

2、在课堂上学习工业界真实的图像增强、复原任务需求,理解当前方法的速度短板,明确高效方法研究的重要性

3、调研思考模型蒸馏技术相关进展

4、撰写相应的研究计划


课题五:基于深度自注意力模型的图像翻译技术探究(Image-to-Image Translation based on Deep Self-Attention Model)

期待结果:

1、调研并总结图像翻译以及深度自注意力模型的相关进展,并分析现有图像翻译工作的问题

2、分析图像翻译任务对全局信息以及远距离相关性的依赖性,了解深度自注意力模型在建模图像远距离相关性方面的优势

3、撰写相应的研究计划


我们也鼓励同学们发散思维,propose自己感兴趣的其他科研课题


本期《研究计划训练营》仅限30人
如果对课题感兴趣,请联系
添加小姐姐微信咨询详情
👇👇👇



3、项目亮点



一、课程内容严格打磨,市面最专业最深入

市面上没有比我们的内容更专业深入的科研类计算机视觉项目,大部分科研项目只会讲解一些机器学习、神经网络的入门知识和算法,并不会涉及到深度学习中更深入的内容和应用。


二、项目提供的科研课题火热前沿,有非常大的延伸可能性

本项目提供的5个科研课题,都是目前计算机视觉领域最前沿最火热的,学生完成研究计划后,可以将其投入后续的科研工作中,并完成1篇有创新性的高水平学术论文。


三、授人以渔的真科研项目

内容涵盖:如何propose一个科研idea、如何找论文、如何读论文、领域知识点的讲解、研究方法的学习、撰写1篇符合学术标准的研究计划的方法和技巧、学术答辩的技巧等。参照实验室教授带研究生的模式,全程按照真正做一个科研项目的流程,让学生边学习边实操,真正做到融会贯通,掌握方法论,举一反三。


四、无需编程基础

本项目目标是产出1篇符合学术标准的研究计划,不需要学生有编程基础。





4、你将获得



  1. 1篇2000词以上,符合学术标准的中文或英文研究计划

  2. 课程证明及导师撰写的学术评价

  3. 了解基本的深度学习、计算机视觉领域研究思路和研究方法

  4. 掌握基于深度学习的底层视觉多个子任务的基本知识

  5. 认识底层计算机视觉领域的现状和前沿成果

  6. 对研究计划逻辑的把握及对科研的兴趣

  7. 在生活细节中分析和发现计算机视觉相关Idea的能力

  8. 模拟答辩,学会如何正确展示自己的研究成果,自如应对面试or套磁




5、适合人群



本项目适合计算机大类、数学、电子信息工程等相关专业方向,或对于深度学习、计算机视觉有浓厚兴趣,希望获得理论提高与实践认知的大三及以上学生。

无需具备编程基础,希望报名的同学对于神经网络和深度学习的基本概念有一些了解,如卷积、池化、归一化、激活函数、梯度反向传播等概念。以便提高后续学习效率。没有相关基础的同学,我们会提供课前预习材料给到大家。




6、未来的帮助



对升学的帮助

本课程涉及的深度学习基础知识以及其在底层计算机视觉领域的应用,是计算机算法尤其是计算机视觉算法、机器学习领域的必备知识/进阶能力,能为有意读计算机视觉、机器学习、人工智能等方向研究生的同学打下扎实基础/提升保研夏令营面试/考研复试/硕士博士申请的成功率。国内外多所大学(斯坦福大学、香中文大学、清华大学等)的知名研究组都十分看重学生的这些专业背景与实践。


对就业的帮助

本课程所涉及到的深度学习算法、图像增强复原等底层视觉相关技术,是就业时的必备能力/是提升就业竞争力的利器。就业方向包括:

  • 互联网大厂(腾讯,阿里巴巴,百度,字节跳动等)计算机视觉算法工程师

  • 硬件厂商(华为、小米、海康威视等)底层视觉研究团队算法工程师

  • AI或计算机视觉独角兽(商汤科技、旷视科技等)算法工程师

  • 国企、政府事业单位如电视台等相关研究团队工程师


●●●

本期《研究计划训练营》仅限30人

有意向参加可添加微信

咨询详情

👇👇👇


浏览 8
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报