英特尔开源计算机视觉标注工具CVAT
CVAT 旨在为用户提供一套方便的工具来注释数字图像和视频。CVAT 支持与对象检测、图像分类和图像分割有关的监督机器学习任务。它使用户能够用四种类型的形状注释图像:框、多边形(一般和分割任务)、折线(可用于注释道路上的标记)和点(例如,用于注释面部标志或姿势估计) .
此外,CVAT 提供了有助于典型注释任务的功能,例如许多自动化工具(包括使用TensorFlow* 对象检测 API复制和传播对象、插值和自动注释的能力)、视觉设置、快捷方式、过滤器等.
CVAT 很容易通过基于浏览器的界面访问;通过Docker *进行简单部署后,无需进一步安装。CVAT 支持团队之间的协作以及个人的工作。用户可以创建公共任务并在其他用户之间分配工作。CVAT 也非常灵活,支持多种不同的标注场景,多种可选工具,以及嵌入到Onepanel等平台的能力*。CVAT 是为专业注释和算法团队开发的,并得到他们的支持,我们试图提供这些团队认为最有价值的功能。
像许多早期的开源项目一样,CVAT 也有一些已知的限制。其客户端仅在 Google Chrome* 中进行过测试,在其他浏览器中可能表现不佳。尽管 CVAT 支持一些自动测试,但所有检查都必须手动完成,这会减慢开发过程。CVAT 的文档目前有些有限,这可能会妨碍参与该工具的开发。最后,由于 Chrome 沙盒的限制,CVAT 在某些用例中可能会出现性能问题。尽管有这些缺点,但 CVAT 应该仍然是图像注释工作流程的有用工具。此外,我们希望通过未来的发展来解决其中的一些缺点。
评论