Skip to content
記事一覧へ

在标注工作中关于规则制定的重要性 ~以具体案例和关键点来介绍~

 

image (2)-2

为了提高标注质量,维护标注规则非常重要。注释是人工智能开发中使用标签为文本、音频和图像等数据添加“含义”的过程。通过标注,AI可以识别每条数据的含义,并将其用作学习数据。特别是,当大量注释者进行注释工作时,通过准备清晰且易于理解的规则,可以避免每个注释者的工作内容发生变化。在这篇文章中,我们将解释注释规则的必要性、具体示例以及创建规则时的注意事项。



标注中规则整备的必要性


image (3)


那么,在标注工作中为什么需要规则整备呢?

标注可以进行机械化的操作,但在某些情况下,比如难以识别良品和次品之间的界限等复杂任务,往往需要人工操作。另一方面,由于人工智能的性能依赖于数据,为了开发性能良好的人工智能,需要大量的数据。因此,在进行人工智能开发时,需要进行多人标注工作。

当有多个工作者(标注员)进行工作时,如果不进行规则整备,将很难获得高质量的标注结果。如果没有标注规则,每个标注员在进行标注时可能会使用不同的名称或判断标准,无法实现统一的工作。为了让标注员以一定的质量进行标注工作,需要制定标注规则。




标注规则的具体案例


image (4)


那么,在标注规则中需要定义哪些内容呢?这取决于所涉及的数据和正在开发的人工智能。因此,在这里以用于自动驾驶人工智能开发的摄像头图像数据为例,介绍标注规则的设定方法。



・对象检测

 

image (35)



实现自动驾驶需要检测和识别车辆周围存在的各种物体。在道路上,存在着各种物体,如汽车、行人、信号和标志,我们需要通过标记标注的方式让AI能够识别它们。具体而言,我们会使用边界线将行人和信号等进行区分,并为每个物体赋予相应的名称。

示例标注规则:对于"公交车/卡车/轿车/...",我们通过边界线进行区分,并给予"汽车"的标签。

 

・区域分类

image (6)


显然,车辆只能行驶在车道上。因此,我们需要让AI能够识别不仅是物体,还包括车道、人行道等区域。通过标注标注的方式,我们为图像中的区域赋予含义。

示例标注规则:通过把区分行人区域的护栏、路沿等标记为"人行道"。

 


・画像分类

image (7)


还需要对拍摄的图像本身进行分类。例如,根据图像是在白天还是夜晚拍摄的,可能需要切换AI学习的条件。

示例标注规则:
通过图像的亮度、灯光状态等来区分"白天"和"夜晚"。

在标注标注中,我们对图像数据进行不同的标记,以便从各个方面赋予其意义。为了能够在不依赖标注者的情况下共同进行这种意义赋予,我们将标注标注规范化为一套规则。
通过准确执行标注标注规则,可以提高AI的准确性。为了使AI能够识别任何形式的信号灯,我们需要进行符合标注标注规则的适当标注标注。



创建标注规则的要点


image (8)

 

在整理标注规则时,我们应该注意哪些方面呢?以下是一些建议:

 

明确地制定规则

注解者根据个体差异可能存在标注执行方式不同的情况,因此必须避免这种情况发生。例如,在对"信号"进行标注时,可能会出现"信号"和"信号机"等不同的表述。此外,还需要考虑到各种变体,比如"是否区分行人信号"、"箭头信号的处理方式"等等。

为了确保标注工作能以共同的准则进行,需要明确地制定规则,预先考虑可能出现的各种模式。

 

制定清晰易懂的规则手册

为了提高标注质量,应该以对注解者易于理解的形式制定规则。例如,对于图像数据的标注,可以在规则手册中加入实际样本图像,以帮助注解者更好地进行判断。在这种情况下,如果要将箭头信号和普通信号视为相同,可以展示两者的照片,以涵盖各种情况。规则的准确性和易懂性都能提高标注质量。


基于实施结果进行改进

一旦制定了标注规则并开始标注工作,还应持续改进规则。在实际进行标注时,可能会出现一些未预料到的分类标准或异常模式。而且,通常在开始标注时,判断标准很难明确,因此最好在查看数据并根据情况改进规则时进行标注。

因此,关键是在进行一定量的标注后,对内容进行审查,检查是否存在注解者难以理解的规则或未涵盖规则的条件等。根据审查结果重新定义标注规则,从而实现高质量的标注。


总结



本文介绍了标注规则的制定及其必要性、具体示例和制定规则的要点。尽管标注工作在AI开发中频繁发生,但许多人可能并不了解其必要性和重要性。在进行AI开发时,需要同时考虑如何执行标注工作。标注规则的制定是一个重要的任务,但如果在AI开发方面没有经验,可能很难自行实施。因此,除了将标注工作外包给外部机构外,还可以考虑将标注规则的制定委托给外部机构。

 

 

blog_autor-cn 2