文档章节

如何运营一家数据标注公司(效率提升篇)

o
 osc_wws45aot
发布于 2019/08/20 10:49
字数 1565
阅读 20
收藏 0

精选30+云产品,助力企业轻松上云!>>>

在上一章中我们提到了报价时需要参考的若干因素。这一章,我们着重强调和了解一下在标注团队运营时有哪些因素会直接影响到项目总体效率......

下面我们就针对在运营中最影响总体效率的几个方面展开来说:

    1. 原始数据的分发和已完成数据的汇总 这里把分发数据和汇总数据放在一起来说,因为在影响效率的原因方面两个步骤是一致的,主要有以下三点:

  • 工时消耗 不论是分发还是汇总,都会涉及到需要专人进行处理。同时,数据的传输也会花费大量的时间。这些因素在实际运营当中会消耗大量的工时,碰到数据量较大时,分发和汇总图片的时间甚至可以达到标注总时长的30%以上。
  • 硬盘消耗 随着数据量的不断积累,对于每个标注人员计算机硬盘的消耗量也会逐渐增大,对于分发数据人员的计算机要求更高。
  • 错误频发 人工进行分发和汇总数据时,多多少少都会出现类似图片重复发放,切分图片多切、少切等问题。这种问题一旦发生,就会浪费大量的时间进行数据的校对,从而影响整体进度。

    2. 完成数据后的统计工作 目前市场上所有的数据标注公司都是以件(矩形框、多边形、点等)为单位进行报价,这就导致必须在完成标注数据以后对于完成的总量进行一个统计。同时,为了记录员工绩效的高低,也需要对员工每日完成的数据量进行一个分类统计。在这里影响效率的原因主要有下面两点:

  • 工时消耗 不论是统计完成数量,还是统计人员绩效,都必须付出大量的时间。同时,越细化的统计内容,花费的时间越多。
  • 错误频发 人工统计完成数量时,也经常会出现譬如遗漏、虚增等等错误情况,完全杜绝错误发生是非常困难的。

    3.工作协同性 目前市场上能部署到以单台电脑为单位的标注软件都没有协同性可言。首先要做到协同性需要管理模块,需要一个整合前端标注和后端统计功能的平台,只有实现平台层面的操作,才能解决协同性问题。影响效率的原因主要有以下两点:

  • 工时消耗 大多数数据需求公司都需要数据标注的一个时效性,因为时间对于公司来说就是竞争力,产品小样或者产品落地时间越短,行业的竞争力也就越强。这就导致数据标注公司需要在标注完成的同时,完成质检。如果没有协同能力,大概率出现的情况就是标注人员先行标注,待数据部分或者全部完成,质检人员再进行质检。这样的做法,对于公司运营来说本来就是不得已而为之,因为标注人员和质检人员要做到同工同酬本来就不合理,为了使质检人员在标注员标注期间有事可做,又需要有专人进行协调。在这种架构里,体量越大,耗费的人力越多,效率越低。
  • 完善规则 大多数数据标注公司应该都遇到过这样的窘境:甲方公司提供的数据标注规则只是针对小批量数据集的,当真正的开展大批量的数据标注工作时,在实际标注中会发现各种各样奇奇怪怪的问题。而我们为了不影响项目的流畅进度,大概率会选择暂缓标注问题图片,或者以天为单位总结问题,统一和甲方交涉沟通。不论如何选择,都会遇到非常多的问题,比如大规模标注时出现规则文档中未涉及的问题,记录和汇总会浪费大量时间。同时,如果对标注规则中未提及的问题在标注时标注人员自我理解消化,很有可能并不符合甲方预期,最后会导致大面积返工的情况出现。

         以上就是在数据标注公司运营中最长出现的3类问题。这3类问题如果处理不好,得到的就会是非常低效的工作模式。打个比方,都是同样的标注员,一个标注员在低效的运营模式下工作,也许他一天可以完成4000个矩形标注框,但是因为规则或者整理方面出现了问题,他有一半多的框都是作废了。这不仅对标注员个人的身心是个打击,对于标注公司来说既定计划完成不了,换来的就是无休止的加班。长期加班人困体乏,对于标注公司来说,是不可能持续运营下去的。

         换一种方式,如果一个标注公司有高效的运营方式。制定计划周密又合理,不仅可以轻松的完成一系列的服务,在大大降低管理成本的同时,标注公司在行业中就会更有竞争力。如果大家想知道如何解决上述低效的问题,请大家持续关注觉醒向量BLOG或者觉醒向量官网丨www.awkvector.com,我们会在下一章更新时给大家详细介绍更高效管理数据标注团队和数据标注公司的方法。

©著作权归作者所有:来自觉醒向量数据标注的原创作品,如需转载,请注明出处,否则将追究法律责任。

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
解决3个问题,让管理数据标注团队总体效率提升50%

在“如何运营一家数据标注公司(效率提升篇)”中,我们提到的3个问题,针对它们用什么方式可以很好的解决呢?   在本篇中我们把这个话题展开来说,详细的进行介绍。 说到解决“原始数据的分...

osc_22to9se2
2019/08/27
4
0
【良心推荐】高性价比的数据标注平台

在做推荐之前,先做个简单的自我介绍吧。 本人是一家小公司的产品,公司之前一直是做金融业务的,从去年开始决定做人工智能+金融的智慧金融解决方案,而我就是主要负责这一部分的产品。 既然...

wx5e5f4cdfdf7de
05/15
0
0
【良心推荐】高性价比的数据标注平台

在做推荐之前,先做个简单的自我介绍吧。 本人是一家小公司的产品,公司之前一直是做金融业务的,从去年开始决定做人工智能+金融的智慧金融解决方案,而我就是主要负责这一部分的产品。 既然...

osc_l9a67e5j
05/16
12
0
普通创业者的下一个风口,数据标注

“下一次的工业革命,谁掌握了人工智能的核心技术,谁就能够左右革命的发展方向,革命的未来。” 今天我们来和大家谈谈数据标注,首先我们先谈谈人工智能。 随着深度学习和神经网络的挖掘,越...

osc_9gm4ypss
2019/09/27
1
0
在人工智能浪尖的数据标注公司如何乘势而起(二)

在上一章中我们着重分析了“准确判断数据标注需求公司的需求方向”、“精准定位数据标注需求公司的拓展范围”这两点,在此章中我们着重总结一下“如何维系与数据标注需求公司之间的渠道关系”...

osc_taqquicm
2019/08/07
2
0

没有更多内容

加载失败,请刷新页面

加载更多

Hacker News 简讯 2020-07-10

更新时间: 2020-07-10 01:15 US Supreme Court deems half of Oklahoma a Native American Reservation - (reuters.com) 美国最高法院认为俄克拉荷马州的一半是印第安人保留地 得分:131 | 评...

FalconChen
今天
26
0
OSChina 周五乱弹 —— 求求你吃了我吧,不要再玩弄食物的感情了

Osc乱弹歌单(2020)请戳(这里) 【今日歌曲】 @巴拉迪维 :张喆的单曲《陷阱 》 这首歌已经在网易找不到原唱了,不知道被哪家买了版权。#今日歌曲推荐# 《陷阱 》- 张喆 手机党少年们想听歌...

小小编辑
今天
26
1
清华陈文光教授:AI 超算基准测试的最新探索和实践。

道翰天琼认知智能平台为您揭秘新一代人工智能。 无规矩不成方圆。放在超级计算机的研发领域,没有一个大家普遍接受的算力评测指标,便难以推动超算迅猛发展。 而现在伴随着人工智能的发展,大...

jackli2020
今天
7
0
@RequestMapping, consumes 提交简单有意思的测试

getParm @GetMapping("getParm")public Result getParm(String id){ System.out.println(); return ResultFactory.success(id);} 等同于 == bodyParm @PostMapping("bodyParm......

莫库什勒
今天
25
0
63. Unique Paths II

题目: 63. Unique Paths II A robot is located at the top-left corner of a m x n grid (marked 'Start' in the diagram below). The robot can only move either down or right at any p......

JiaMing
今天
55
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部