日前,AI数据标注服务商“倍赛BasicFinder”已收购“丁火智能”100%股权。
Tractica预测,2024年人工智能市场规模将增长至111亿美元。但AI要真正发挥作用,优质的数据必不可少,AI公司大约有1/3的钱需要花在数据上,所以,前端的数据采集、加工环节单拎出来成为了新的机会点。36氪曾报道,“倍赛BasicFinder”与“丁火智能”同为AI数据标注赛道上的选手。
BasicFinder注册成立于2015年,将打字员改造成数据标记员,通过自营模式保证服务质量。现如今,BasicFinder已拥有20家下辖数据工厂近3000名数据操作员,服务了数百家企业客户。而丁火智能采用众包模式进行数据采集及标注,旗下“荟萃APP”目前已积累数十万活跃众包用户,日均可处理百万图像及上千小时语音数据。
数据标记是个重人力的劳动密集型行业,这类公司的关键点就在于——人员效率、交付质量。
“当数据任务量大时,比如标记百万级图片,可能需要200人一个月。此时人员的配合管理很是关键,所以,过去一年,BasicFinder主要在优化系统。”倍赛BasicFinder创始人兼CEO杜霖如是说,从前端采集,系统预处理,辅助标记,到监控数据集,产出模型等,BasicFinder自研发的系统不仅要通过工具提高人工标记的效率,而且更适配于企业对AI数据的全生命周期管理需求。
杜霖还透露,凭借这套系统,BasicFinder在某银行招标时,PK掉了其他竞争对手。
“而本次收购,主要是双方模式互补。工厂模式质量相对更可控,但成本偏高,众包模式则可以实现更低成本及多样性、大样本的数据采集与标注服务。以及,丁火智能研发的众包策略模型及质量监控引擎,可达到多人拟合准确率超过98%。”
之后,倍赛BasicFinder将保留并独立运营荟萃APP品牌。客户可以在荟萃的管理后台自由发布任务,如数据采集、标注或调查问卷,实时监控任务执行情况及动态调整价格方案。荟萃也支持API调用的方式将数据服务接入客户现有的AI系统,实现数据与模型的人机协同迭代。
推荐阅读:
《人工智能大火,BasicFinder要做数据采集、加工的“送水人”》
《从数据标注切入的「丁火智能」,未来想做的是线上人力平台》