行业资讯
数据标注有哪些类型?
发布人:小倍
2022年10月20日
人工智能深度学习的数据标注已经发展成为一个全新的行业,机器学习对于数据的需求不仅仅数量在上升,质量和精确度也在不断的增加。
数据标注有哪些类型?我们通过这篇文章给大家做个介绍。
基础的数据标注类型有计算机视觉、语音工程、自然语言处理。
1、计算机视觉类:
拉框标注:用2D框、3D框、多边形框等标注出图像或视频数据中的指定目标对象。
语义分割:标记图像中存在的内容及位置,根据属性进行像素级分割,支持单属性、多级属性。
3D点云标注:将点云数据图像中的多类指定对象使用3D框进行标注。
关键点标注:对人脸关键点、人体骨骼关键点、人脸五官等进行关键点标注。
线标注:支持贝塞尔曲线和普通线段标注,支持对车道线进行贝塞尔曲线标注,使用线段将图像目标的边缘、轮廓用线段标注。
2D/3D融合标注:对2D平面图与3D点云图映射的数据组进行标注,支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能。
2、自然语言处理类:
OCR转写:将图像中的文字进行识别,并以文本的形式转写。
文本信息抽取:把文本里包含的信息进行分类和打标签等结构化处理。
NLU语句泛化:基于特定文本数据进行多角度泛化,以不同的描述方式重组语句。
词性标注:基于特定文本数据进行词性理解标注,如动词、名词、形容词等。
情感判断:针对指定文本数据,判断该文本的情感类别并给出相应的标签,如积极、消极等。
意图判断:常使用分类的方法将句子分为相应的意图种类,进而判断语义意图。
3、语音工程类:
ASR语音转写:提取语音数据特征,转写为对应的文本或命令。
语音情绪判定:从语音数据中识别说话人的情绪状态。
声纹识别标注:对音频数据中的说话人进行辨认或确认。
语音切割:根据需求,将语音实现分段切割。
以上就是给大家介绍的关于常见的数据标注类型的内容,除了这些大类外,每个大类下面又细分很多小类,简单来说,数据标注是构建训练灵活、高表现的机器学习算法的关键步骤。在大数据时代,数据标注变的尤为重要,因为它能教会机器如何向人类一样理解和处理问题。
上一篇
下一篇
相关文章
图像标注的常见应用场景
随着致力于人工智能的公司能够获得的图像数据的不断增多,依赖于图像标注的项目的需求也飞速增长。对于在机器学习领域开展业务的企业来说,创建全面、有效的图像标注过程变得越来越重要。图像标注现在的应用场景很多,下面我们将重点介绍各大行业中比较热门的使用场景。
2022年10月28日
你了解语音标注吗?
随着人工智能的逐步发展,语音标注的应用场景已经普及到了我们生活的方方面面。作为人们信息获取以及沟通等需求最为方便快捷的路径就是智能语音。
2022年10月25日
数据标注将迎来新的拐点
数据、算力、算法是推动人工智能技术进步的“三驾马车”,其中数据是人工智能行业的发展基石,数据标注对人工智能很重要,“没有好的数据,人工智能没有未来”早已是行业共识。
2022年10月12日