近年来以图搜图已经逐步得到应用,百度识图、微信扫一扫、淘宝拍立淘、京东拍照购等已经教育了用户和市场,但因为技术门槛高,周期长,基本都还是大公司的专属。国内AI创业公司码隆科技,则希望把这种“以图搜图”的能力开放给各种B端用户。
这种以图搜图的能力是通过码隆科技推出的ProductAI产品实现的。这款面向B端的产品是一个自助式的人工智能视觉应用平台,一是可以根据客户提供的图片及视频数据,快速自助建立自己的“以图搜图”引擎,二是提供图像处理的接口,帮助企业实现图像标记、分类、聚类、定位、以图搜图等功能。客户在几乎不懂技术的情况下,基本只需要简单的关联图像视频数据库、勾选需要的功能,即可实现该功能。目前,将于10月24日开放申请试用。
这个听起来比较简单的原理,实现起来并不容易,需要深度学习和计算机视觉技术做支撑。一般来说,识别的精确度主要取决于训练的数据量、算法模型设计、计算力,其中前两者更为关键。码隆科技从2014年7月成立,已经获得了亿级的训练素材。团队30人中的大部分都是研发团队,主要来自微软、Google、腾讯、百度等公司,擅长视觉计算,机器学习,团队此前推出了一款叫做 StyleAI的应用,实现了时尚、服装、柔性材料等领域的识别。
联合创始人黄鼎隆博士告诉36氪,目前团队在以图搜图方面的准确率已经优于人工识别,比真人贴标员的识别率高8%左右。
ProductAI的目标用户主要集中在纺织面料行业、时尚行业、电商和零售、视频、药物、版权、市场营销、艺术创作等领域。目前的客户包括微软在线、优料宝、中国纺织信息中心、POP、瑞丽、暴风影音、视觉中国、MSN、金山云等。
产品会依据API调用次数进行收费。针对不同的用户、不同的需求,会制定阶梯性的收费模式。低于一定调用次数基本免费,超过这个基数线调用次数越多越便宜,每次调用收费基本从0.01元—0.1元不等。码隆表示根据目前的运营数据,客户在增加了以图搜图的功能后,活跃度或者交易有提升,收益会远超实际的调用费用。而诸如面料这种很难用语言描述的产品,通过图片搜索是强需求。
除了以图搜图的功能,码隆也在提供基于视觉的其他服务,公司也在进行AR+AI方面的尝试。近期公司推出了AR+AI的营销工具,在手机摄像头识别到相应的物体后,会自动变身成机器人与系统的机器人对战,或者会变身成形象代言人与用户对话,在用户完成相关任务后,赠送优惠券,提升产品销量。目前已经与加多宝、蒙牛达成了合作。此外,公司也基于Google Glass、微软HoloLens和机器人开发了相关产品Demo,进行技术布局。
码隆科技成立于2014年,CEO黄鼎隆曾就职于Google、微软、腾讯和TripAdvisor,曾成功推出微软必应词典、微软必应出口通、腾讯微博消息流广告、TripAdvisor到到旅行App等产品。CTO Matt Scott(码特)有十年开发经验,曾任微软亚洲研究院高级研发主管, 拥有40多个中美专利、13篇国际顶级论文。公司在2015年1月入选微软创投加速器,2015年3月宣布完成1200万天使轮融资(估值1亿),今年获得了中国大数据峰会大数据大赛全国冠军、微软2016云中黑客松全国冠军、亚马逊AWS技术峰会2016黑客马拉松比赛一等奖,近期也将公布新一轮融资。
随着“以图搜图”市场被教育,技术逐渐成熟,这个领域也出现了几家提供技术及方案的公司,包括北大数字视频编解码国家工程实验室背景的博云视觉,擅长诸如如杂志、海报等平面物体识别;VizSeek按图索宝主要聚焦工业零部件领域, Wonderland 主要基于AR硬件产品。