36氪获悉,智能内容风控SaaS平台博特智能近日宣布,已于2020年1月底完成天使轮融资,金额近千万元,投资方为东湖天使基金。此轮融资将用于人工智能平台的市场启动。
过去几年,互联网内容产业的爆发也同时伴随着乱象,违法、不良信息在不同平台涌现。与此同时,针对网络信息的政策监管力度也在不断加大,平台的责任逐渐被明确,风控已经成为内容平台的生死大事。
根据不完全统计,2019年全年有超过一千家互联网产品服务因内容安全受到监管处罚,其中包括小红书、视觉中国、Soul、钉钉社区、互动作业等等,事件爆发的互联网产品不限于社区电商、图片版权、企业服务、网络文学、直播音视频、影视、出海、教育、网络文学等类别,严重者被下架整改数月,对业务造成了极大影响。
目前市面上主流的内容风控模式主要有两种,一是企业自研、自运营系统;二是第三方内容审核机构。自建内容审核系统多适用于有长期、大量需求的大型互联网公司,一般所需团队庞大,运营和研发成本高昂。来自百度的数据显示,建设一个约30人规模的机器审核开发团队,一年投入需要上千万。对于自身规模以及业务需求量较小的企业来说,这个量级的成本显然难以负担,也因此,第三方内容审核机构应运而生。
博特智能是典型的技术类第三方内容审核服务商,公司AI谛听智能平台定位于提供智能内容审核SaaS一站式服务和PaaS能力服务平台,为企业提供一站式内容审核解决方案,核心产品有智能内容审核、人工内容审核以及智能线上巡查三大板块。
智能内容审核是博特的主要产品,基于人工智能技术,可对文本、图片、视频、音频中的涉黄、涉政、暴恐、广告、违禁等内容进行精准识别和处理。博特智能创始人戴亦斌认为,内容审核使用最多的是文本审核,具体场景会有:昵称/签名、评论/留言、文章/发帖、直播弹幕、社交消息、商品描述等。
在文本识别方面,博特有较深的技术积累,依托于中科院信工所沉淀20年的信息过滤与内容计算技术,博特现拥有万级敏感词库数据,多种语义分析模型,支持复杂变种文本识别,可对色情、谩骂、垃圾、涉政等多种类型文本进行检测,在不同场景下,准确率最高可达99%。
人工内容审核是作为一站式解决方案的补充措施,戴亦斌表示,内容审核目前可以做到90%的的工作由机器完成,但剩余10%还需要人工进行操作,这也是许多大型互联网公司自建人工团队的原因,因为即使10%的量也非常的多。博特智能目前已经成立一个数百人规模的专业内容审核团队,可提供7*24小时的人工审核服务,为企业量身定制内容审核策略、审核规则及审核标准。
线上巡查方案主要面向动态的广告和实时更新的UGC内容,系统可以24小时对页面进行抓取,进行抽样或者全量审核,向企业发出漏审风险预警,避免遗漏。
广发证券的一份报告将目前国内的第三方内容审核服务商分为三类:一是技术导向的云服务企业,包括阿里云、腾讯云、百度云、网易云等,内容安全审核是它们安全产品线中下的一个分支业务,一般以提供API接口的方式,承接机器审核业务。二是具有内容基因的国有传媒企业,以人民网为代表,面向中小企业提供开放云审核平台,并且依托媒体内容基因输出行业标准。三是新兴的互联网创业公司,大多从安全技术角度切入,例如数美科技、同盾科技、云净网络等。
与以上提到的竞品相比,戴亦斌认为,博特的特色在于深厚的技术积累和一站式解决方案。对于云厂商来说,内容审核只是其业务板块下的一小条线,从资源投入的角度来说,不如专业服务商专业,在准确率上不够好。数美、易盾目前则以提供机器审核为主,不提供人工审核服务,难以满足客户全面一站式的服务需求。
政策把握也是内容审核系统的重要竞争力。戴亦斌称,博特与国家监管部门一直保持密切联系,关注国家政策法规变动,与人民网有紧密合作,可以为企业处理政策理解或者疑难内容。
戴亦斌称,博特的目标客群为内容生产者和平台,细分来看的话像互联网行业客户,包括网络视频、直播,音频文学、媒体、游戏、交友、甚至旅游出行、电商;以及传统行业客户例如金融、地产等都有。目前的客户量级在几十家,标杆案例包括陌陌、抖音、斗鱼、墨迹天气、央视等。对于大型客户博特可提供私有化部署方案,一般云服务客单价在几万到几十万不等。常规的收费标准有包年服务和按流量、人员、API进行梯度收费。
博特智能现核心团队约20人,创始人戴亦斌为连续创业者,有十余年企业级SaaS产品设计开发以及市场营销经验。团队技术合伙人及首席科学家为中科院资深研究员和博导,在高速数据流捕获与处理、网络信息识别与过滤、数据挖掘与信息检索等方面积累了大量的研究成果和特色技术。大部分研发人员来自中科院资深研究人员、顶尖IT企业的资深工程师和业务高管,拥有十年以上信息内容安全领域的研发及工程经验,积累了海量的文本、图片和音视频数据。公司拥有多项人工智能相关专利。
戴亦斌向36氪透露,预计今年年内博特智能还将获得一轮融资,融资将用于SaaS平台的研发,提高处理能力;加大基础算法研究投入,建立联合实验室,在面向内容理解的自然语言处理、深度学习等方面持续研发新产品。
封面图源:pixabay