陈霞从未体验过自动驾驶,但她正在做的工作却与自动驾驶技术的AI算法息息相关。
“把汽车框起来,把障碍物标成白色的点……”随着鼠标的快速滑动,屏幕上的点云图不断翻转,一个个针尖大的数据点被标注在图中不同物体上,陈霞要做的就是对照摄像头拍摄的图片,赋予这些数据点以准确的含义。
“所以,数据标注就是对着图片画框、标颜色、划重点。”起初,陈霞也这么想,直到有一次出现标注误差,“把车轮的阴影框进去了,让模型以为阴影也是车。”她突然意识到,手中的鼠标,连着AI的“眼睛”和“大脑”,标注的每一笔,都在教机器如何认识世界。

换言之,有多少智能,背后就有多少人工。陈霞所担任的数据标注师,正是人工智能的前端。常见的智能音箱、语音助手、网络客服、人脸识别等产品的背后,都有数据标注师的身影,创造了更多就业岗位。
作为贵阳高新区本土孵化成长企业,世纪恒通科技股份有限公司抢抓市场机遇,着力发展数据标注产业,目前已汇聚2500名数据标注师,预计到年底将增至3000人。
这个数字表面看似简单,实则蕴含着不简单的业务承载力与估值潜力。“3000人的专业团队具备日处理150万条中等复杂度标注数据的能力,年处理总量可达3至4亿条。”该公司副总经理李建州介绍,当AI能力越强,对数据规模、质量的要求就越高,相应地对标注员知识背景、逻辑思考能力要求也就越来越高。

“我们正在构造‘标注师+标注平台+标注作业基地’的产业发展模式,通过AI大模型等手段对数据标注场景进行赋能,推动数据标注从劳动密集型产业向知识型、专业型和高端型升级。”李建州说。
而在贵州鼎联数据有限公司,3000人还不算多。“‘喂养’一个AI模型需要成千上万甚至上亿个数据样本,这都要经过数据标注师的双手,最终流向算法研发方,服务AI产品。”该公司项目总监李元旭表示,“基于此,我们搭建了全流程一体化的灵活用工平台,从业者在接受平台线上培训测试后即可上岗。目前,该平台已汇聚了约10万用户。”
鼎联数据于2023年在贵阳高新区成立,是一家专注于互联网数据信息技术服务的大数据企业,致力于为智慧出行、智慧教育、新零售等多个领域提供通用性、支撑性的AI数据标注及审核服务。目前,该公司数据标注的内容已经从图片拓展到语音、文本,语音数据除了有普通话,还包括各地方言。
“我们利用数据标注技术,通过对大量数据的处理和校准,能让打车软件、外卖软件的路径规划更加精准高效。”李元旭透露,鼎联数据已经与京东、滴滴等知名互联网企业及新能源车企展开合作。

站在风口之上,企业的发展折射出贵阳数据标注产业的蓬勃。
今年7月,省大数据管理局正式将贵阳大数据科创城数据产业园、贵阳大数据安全示范区、铜仁万山大数据产业园统一命名为“贵州数智产业园”,明确将该园区作为贵州数据标注产业的核心载体,形成“物理空间集聚、专业服务支撑、产业链协同发展”的创新生态。
今年8月,2025数博会举办期间,中国信息通信研究院联合贵阳市大数据发展管理局等多家单位发布《数据标注产业发展研究报告(2025)》,系统梳理其在技术创新、行业赋能、生态培育、标准应用、人才培养和安全保障等六大核心要素方面的实践与进展,提出“在信息化、数字化、智能化不断深化的今天,数据标注产业已成为推动人工智能发展的重要环节”。

“以前,我跟别人说我的职业是数据标注师,对方的脸上写满了问号。如今,已经有越来越多的人了解到这个行业。”行业需求的旺盛让陈霞感到欣喜,但她还是产生了强烈的职业危机感,“我将了解更多人工智能行业的前沿趋势,掌握语义分割、文本标注等更多技能,争取从标注师成长为培训师,为有志从事这个行业的人提供培训、指导服务。”
贵州日报天眼新闻记者杨唯
编辑罗昌
二审何欣
三审胡丽华
编辑:科技 来源:当代先锋网