有多少人工,就有多智能。
这句话说出了人工智能模型训练的重要一步。除了算法的打磨,还要海量有效数据用于训练,这需要大量人力制作结构化的标记数据。这类工作通常是重复、简单,比如在几万张图中把人脸标记出来,比如今日头条雇了一堆武汉大学毕业生为其文章打标签。
Amazon在2005年上线了Amazon Mechanical Turk(MTurk)。MTurk是个微任务众包平台,公司或者组织可以将大型任务碎片化,然后通过众包平台发布,采用现金或礼品等作为回报,招募非特定的大众参与完成任务。如上所及,微任务指需要人力参与但极其简单的任务。目前MTurk上创建的任务可以包括点击链接,进入网页和标注图像,完成一个调查。
人工智能模型的训练非常适合的众包模式,类似的工作性质还会出现在定量研究和市场调查中,需要收集海量样本的数据。因而类似平台受到研究员和AI从业者欢迎。目前在国外比较知名的众包平台除了MTurk,还有CrowdFlower,后者共融资5800多万美元。世界银行的报告显示,这两家平台组成的微任务行业,在2013年的规模达到1.2亿美元。
MTurk和Crowdflower解决了AI从业者的巨大痛点,不过这类平台也存在一些问题。就像滴滴一样,随着网络效应的增加,撮合平台开始抽取较为高昂的手续费。基于区块链的Token分配机制则可将平台和供求双方等Token持有者的利益统一在一起。
Mturk平台会向任务分派者(requester)抽取任务报酬20%的费用;如果你只找记录良好的工人(Worker),会被多收5%;如果你的任务需要10次以上的点击,还要多给20%。使用Crowdflower则需要数千美元的支付接入费和包年手续费。
如果上述手续费省掉,是不是有一种“卖家多赚钱,买家少花钱,没有中间商赚差价”的感觉?本文要介绍的Gems(点击此处获取白皮书),尝试用去中心化的区块链机制来实现去中介,平台不收取任何手续费。
Gems是一个基于以太坊驱动的去中心化微任务众包协议,团队在这基础上建立了一个众包平台Gems,平台从消除中介费、改变验证机制、提升支付效率等方式优化微任务众包模式。通俗来说,Gems协议由奖励机制、信任评分、支付系统三部分组成。
由于建立在去中心化的公链上,平台上流通的实际上是Gems Token,分派任务者需要向工人支付Token,后者在任务完成和验证后直接转到以太坊钱包。目前,大部分的微任务众包平台为了确保结果质量,请求者通常请5-15名工作人员执行相同的任务以形成共识。Gems则加入了验证者的角色,验证他人的工作同样可获得奖励,但不高于工人工资本身。
工人的个人准确性、效率等完成任务的历史,会形成Gems信任评分一并同步到以太坊钱包。分数象征着你对可靠程度与在平台上的专业性,高分工人有资格验证其他工人的工作、获得更高的工资,不可靠的工人可能会被系统移除。
虽然Gems本身不收费,但是使用以太坊网络本身是收费。因而,为了方便小额支付和奖励,Gems采用的是类似闪电网络的链外支付模式,建立了一个专用的免手续支付通道。通道中的交易将在后续再打包同步到链上。
Gems平台是第一个使用上述协议的平台,可以理解为去中心化的MTurk。Gems平台不收取中介费,内部流通Gems Token,并提供了专用于AI 训练的Gems模块。未来,Gems团队将会构建一个可重用的组件并将其开源,开发者或者任务发起方可以用其定制友好的交互界面,适配不同的场景。
Gems团队的两位创始人是Kieran O'Reilly和Rory O'Reilly,在2014年从哈佛退学创办gifts.com,曾被评为Forbes”30 under 30”,创业期间获得了Peter Thiel提供的Thiel Fellowship。
在初期Gems平台主要专注于人工智能(AI)训练相关任务。目前Gems已经开放了Alpha版本的平台试用,8天超过150万试用订单,正式产品仍在研发当中。
----------------------------------------------------
我是36氪区块链记者卢晓明,区块链项目寻求报道或交流请加微信lohiuming,烦请备注姓名、单位、职务和事由。