我和数据标注的那些事儿

“最近在知乎上面看到很多有关“数据标注怎么样”、“有发展前景吗”、“值得学吗”诸如此类的问题,我想用几句话概述可能会比较抽象,下面用亲身经历告诉大家我眼中的数据标注。”

    接触数据标注行业已有一年半,最初是从数据标注员开始做起的。

    那么数据标注员是做什么的?

    2017年毕业的我,没有什么经验、没有什么技术、没有什么人脉,做过服务员、去过工地、做过销售,由于工作不顺以及种种压力与困难来袭,我准备放弃想要干一番事业的心,想着回家继承财产的时候(当然家里也没矿,哈哈哈),我的一个朋友联系了我,介绍了一家大数据公司。

    2018年3月,我抱着试一试的心态,参加了面试。最初对于大数据没什么概念,仅仅知道些皮毛,后面经过了解与学习,发觉内心想找的就是这样一份工作。这是一家初创企业,公司刚装修完成,我上班的第一天参与了一些清洁工作,也帮忙办理相关证明。在第三天的时候,开始正式工作,即数据标注。开始的标注任务不难但也不乏枯燥,是标注箱子,这对于本身具有艺术功底的我来说简直是如鱼得水,加之工作态度比较积极认真,很快适应了这种工作内容。本以为自己作为公司的第一个员工会赢在起跑线上,当上同批标注员的小组长(质检员),但最终由于不可抗因素而事与愿违。尽管如此,这并没有影响我对工作的态度,反而成了一种动力,我变的更积极、热情。

    很多朋友都问我,工资不高,干活又辛苦,为什么还要继续呢?我从未正面回答这个问题,但内心仍然坚信不移,因为只有你相信,才会成功。

    转眼间已过去3个月,期间虽然不是表现最好的那个,但可以称得上最有激情的。6月份,正值炎夏与毕业季,不得不感慨一下,这毕业季就如同离职季。我并肩作战的同事们,同时也是我的学妹们,她们之中大部分选择了离职。唯独留下了表现最好的小组长(也是我学妹),这一次的人员变动也导致了我调到了另外一个项目-汽车破损鉴定(车险行业的AI应用领域)。这段经历真是不同寻常,因为那时是公司人员最多的时候也是人员最不稳定的时候,大概每个人都有自己不同的理想和职业规划,我见证了许多人的进进出出,而我能做的就是让更多的人知道数据标注行业、了解我们的企业。

    到了七月,我再次回到之前的项目团队,虽说很久没有接触了,但我状态进入的很快。初创型公司,没有那么多规则,也没有只做一人份工作之谈。每个人都在为一个共同目标而努力奋斗。截止2018年7月中旬,这份工作充实了我的内心,真是一段时间饱和且快乐的时光啊。

    我所在的企业—觉醒向量。这是一个默默无闻、专注于解决行业痛点的企业。同时也是一个年轻朝气、积极向上的大家庭。

后续会不断更新,更多惊喜请关注我、关注觉醒向量!

版权归觉醒向量所有,未经允许不得转载,如若转载请联系管理员:[email protected]

原文地址:https://blog.51cto.com/14054798/2441019

时间: 2024-10-09 19:43:23

我和数据标注的那些事儿的相关文章

关于数据标注行业有些你不知道的事儿

一位在觉醒向量做数据标注的员工说:正如别人评论的那样,我们的工作的确很像数字世界的建筑工人,但是我们在扮演着很重要的角色,因为没有我们,AI这栋摩天大楼就无法建成. 大数据作为一个术语而言,其历史可能并不久远,但形成数据的许多基础早已经奠定.我们来简要回顾一下引领我们进入数据时代的历史.大约公元前18000年人类用计数棒进行储存和分析数据.伊尚戈人的骨头于1960年在现在的乌干达发现,这被认为是史前数据存储的最早证据之一.旧石器时代部落的人类会在木棍或骨头上刻上记号,以此来记录交易活动,他们会利

浅析数据存储的“那些事儿”

写在前面 对于运维来说,数据读取.安全与存储,也是至关重要的一点,数据存储的技术点也是相当的多,面比较广,今天,民工哥来给各位小伙伴聊一聊有关于数据存储的"那些事儿" 存储的概念介绍 数据存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息.数据以某种格式记录在计算机内部或外部存储介质上.数据存储要命名,这种命名要反映信息特征的组成含义.数据流反映了系统中流动的数据,表现出动态数据的特征:数据存储反映系统中静止的数据,表现出静态数据的特征,解释来源于百度百科.民工哥用

视频数据标注工具与平台(数据标注公司)

最近在做相关项目,评估了多个数据标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 视频数据标注平台(标注外包公司) 数据标注公司的工作比较多样,但视频标注对工具要求稍高一些,能在线上做的平台不是特别多,主要还是语音.图片标注.目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,比如京东众智.百度众包,数据保密做得好.有的平台是专门做代理的,你的数据需求交给他,他转手就分包给下一层.下面介绍几个平台,也综合了其他博主的一些意见,如下: 京东众智 标注质量比较高,项目交付准时,数据

NLP文本标注工具与平台(数据标注公司)

最近在做NLP相关项目,包括句法分析.情感分析等,有大量数据需要标注.我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 文本标注平台(标注外包公司) 数据标注公司的工作比较多样,文本数据标注是最基础的,另外语音.图片.视频标注也都可以做.目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,比如京东众智.百度众包,数据保密做得好.有的平台是专门做代理的,你的数据需求交给他,他转手就分包给下一层.下面介绍几个平台,也综合了其他博主的一些意见,如下: 京东众智 标注质

数据标注-人工智能高速路上的基石

数据标注-人工智能高速路上的基石   中国科学技术大学博士袁岚峰在不久前的文章中把中国科技在世界的地位大致分为五类. 我们本文中只引用第四类. "如今世界科技的第四个格局:双头格局,一般是中美两国远远高于其他国家.典型的例子有两个,互联网和人工智能.这两个都是普遍被认为对于未来非常重要,最有想象空间的,值得我们仔细分析".前四个格局有兴趣的朋友可以自行搜索全文,这里因为篇幅原因不做更多引用. 在这里我们可以从一个科技工作者口中了解到一个这样的事实:互联网与人工智能在当今世界科技格局中,

数据标注行业知多少

据相关资料显示,在中国,有10万的全职数据标注员,100万的兼职数据标注员. 看到这个数据,不禁想问数据标注到底是一个怎样的行业? 其实早在1998年第一家标注公司成立的时候,该行业就已经出现,只是那时人工智能尚未兴起,数据应用相对较少,直到2011年以后针对人工智能的数据标注才逐渐出现. 人工智能行业离不开数据标注行业.为什么这么说呢? 因为对于人工智能企业来说,优质的数据是不可或缺的.换而言之,数据的真正价值不在于数据本身,而在于数据背后所反映出的真实性与科学性.能够对数据进行分析.开发和利

如何运营一家数据标注公司 (市场结构篇)

如何运营一家数据标注公司 (市场结构篇) 随着AI浪潮的斩头露角,数据标注行业也犹如雨后春笋般蓬勃的发展起来. 本文就目前国内数据标注行业存在的几个阶段性结构特征进行展开,让更多想了解数据标注的AI公司.AI实验室.准备加入数据标注的朋友们,快速熟悉目前数据标注行业的现状和运营数据标注公司应该注意的若干问题. 数据标注市场目前有下面几种结构: 一.众包结构 顾名思义,就是把需要完成的任务分发给大众志愿者(也就是市场上说的兼职).这其中就出现了众包公司.众包公司联系到需求数据标注的客户,和客户建立

如何运营一家数据标注公司 (基础架构篇)

数据标注行业,一个因为人工智能崛起而新兴的行业. 大多数AI实验室.初创型AI公司在发展初期如果雇佣大量的人力进行数据标注,就不得不面临下面两种处境:首先对公司的管理方面就是巨大的挑战,在研发产品的同时还得把大量精力放在如何管理大量标注人员身上.其次大量全职的标注人员的薪酬对于初创型公司和研究实验室也是一个不小的挑战. 为了更好的协调AI公司.AI实验室与群体标注人员的供需关系,本文中所指的标注公司就是在这样的大背景下,应需而生. 那么问题来了,如何运营一家标注公司呢?本文先从最基础的标注公司架

如何运营一家数据标注公司 (资源特点篇)

在"基础架构篇"中我们提到的资源,也就是数据标注公司要面对的甲方:AI公司.AI企业.AI研究所.那么问题来了,人工智能公司.人工智能企业.人工智能研究所多种多样,作为一个数据标注公司应该如何定义自己的服务方向呢? 首先我们要能够准确的了解资源公司的特点,这样才能更好的为其提供符合自身特点的服务.目前市场上的AI公司.AI企业.AI研究所大致分为以下几种,对于与数据标注公司的合作来说他们各有各的优势和劣势,这里对以下突出的几类进行分析: 1. 初创型这里指的初创型公司一般指未进行过阶段