行业资讯
数据标注是劳动密集型产业吗?
发布人:小倍
2022年05月13日
面对数据标注的巨大需求,整个行业的技术水平如何?在回答这个问题之前,首先给大家罗列一组数据。
ImageNet 是一个计算机视觉系统识别项目名称,是由美国斯坦福的计算机科学家李飞飞教授领衔的团队模拟人类的识别系统建立的,它是目前世界上图像识别最大的数据库——1,500 万张标注图片的数据集,这是来自 167 个国家的 48,940 名工作者,花费了 2 年时间,清理、分类、标记了近十亿张通过互联网搜集到的图片才得到的。
由于数据庞大又开源,ImageNet 很快成为成为研究图像识别的首选。但尽管如此, ImageNet 也有自己的弱点:标注框太大、标注方式少和不时出现的错误,使它难以被用来训练实际应用的算法模型。
从以上可以看出,即使是业内最强大的图像识别库,数据标注都是通过人工完成的。因此,其它宣传数据标注自动化的,可信度较低。
业内人士透露,数据标注是一个简单又困难的事情。简单之处在于,确定了筛选规则以后,操作人员只需依规操作即可,没有执行上的难度,而困难之处在于,数据标注本质上是要获得更准确,更精细化的数据结果,高质量的数据是业内急需的
但数据标注本身是一项枯燥的工作,工作人员需要对大量数据不断进行重复劳动,数据的一致性很难保证。而这些数据标注的工作,本身是为了提升机器学习的能力,因此这部分工作只能由人来完成,人与机器之间的鸿沟,正是机器要跨越的。
(部分内容摘自网络,如有侵权,请联系删除。)
上一篇
下一篇
相关文章
数据标注能否实现自动化?
为了降成本,提效率,无论数据标注公司还是客户,都在想办法提升数据标注的效率。现如今最有效的方式是通过智能模型辅助标注预处理加速工具来实现提效,并已在数据标注平台实际应用,但这里提到的加速工具还是区别与完全自动化的数据标注。
2022年05月27日
数据标注平台的重要性
面对数据标注的巨大需求,整个行业的技术水平如何?在回答这个问题之前,首先给大家罗列一组数据说起数据标注,或许很多人并不陌生。对于这个人工智能的上游行业来说,在不断的发展之下,短时间内早已不是当初的模样。如今,在技术的推动之下,数据标注平台已经替代传统人工成为了数据标注的主力。那么数据标注平台的优势有哪些呢?。
2022年05月24日
精准的自动驾驶标注数据是自动驾驶技术核心的关键
“自动驾驶”这一概念自20世纪初被提出以来,就一直是人们梦寐以求的出行技术。
2022年05月13日