与PC端的搜索行为不同,移动搜索与生活场景的结合更加紧密,这要求场景输入的一切信息,包括文字、声音、位置、关系、图像等都可以成为你的检索关键词。在文字搜索、位置搜索甚至语音搜索都已经有较成熟产品占位的前提下,视觉搜索或许可以成为创业公司的下一个切入点。
图答应是一家基于微信的视觉搜索服务提供商,为微信公共号提供图片识别和搜索服务。图答应自身运营着一个演示账号(可搜索微信公共号“hiscene”),用户可以通过拍照或上传本地图片,获取与图片内容相关的反馈。当你逛实体书店时想要了解某本书的详细信息,可以把图书封面直接拍下发给图答应或其合作账号,系统会将评论页面和网购入口集中返回,而无需分别在豆瓣和当当进行多次操作。
图答应目前可支持对图书、海报、CD等类目的搜索。据介绍,该服务可以接入包括电商、媒体在内的各类公共数据库(例如书评来自豆瓣,购买链接来自亚马逊),合作伙伴可以导入私有数据并且未来将对个人数据库开放。
根据图答应团队的公开资料,其所拥有的图像识别算法最少只需60%的幅面(无需拍下整张图片)和20k数据即可识别出对象,在技术上有一定优势。我简单测试过,图答应对电影海报、图书的识别率较高,十次测试均成功返回结果。而对CD的测试则不尽如人意,十次中有两次无响应,反复实验下排除网络原因,推测可能与CD样本库不完善有关。图片360度任意旋转不会明显降低准确率,但将图片作镜像翻转后则不能识别。
排除如光照、镜头成像质量、拍照姿势等外在因素,对搜索“精确度”(也可以叫查准率)这一指标影响最大的是使用者的结果预期。“使用偏娱乐的应用时(如猜明星脸之类),用户对精度的要求一般会比工具型应用低。再如以图搜衣服,用户只要找到差不多的衣服就可以,并不一定要求严格的同款。而对增强现实应用,这个识别精度要求一般高得多,当用户用手机对准奔驰车时,不能容忍在屏幕上显示一个宝马”,图答应CEO兼技术负责人廖春元(Chris)向我们举例道。
Chris先后在清华和马里兰大学计算机科学系就读并获博士学位,曾供职富士施乐Palo Alto研究院从事图像识别、增强现实、人机交互等领域的研究,在业内有着较深厚的技术积累。
当谈到对盈利模式的设想,Chris表示对C端用户除某些游戏产品外应该会一直免费。而对B端用户,会基于图像识别与搜索的广告、营销、增值业务等形成类似Adsense的生态。事实上,图答应团队此前已经为电信、媒体行业的多家客户提供互动营销支持。
我一直比较好奇,在微信5.0推出图像搜索的背景下,为什么图答应仍选择以微信App的形式推出产品。对此Chris认为,基于图像识别的技术特性,该领域不存在一种可以涵盖万事万物的算法,最好选择是在一个领域里不断扩充数据库和优化算法进行深耕,即使在同一个垂直领域内也可能有多个公司共同生存的容量。另一方面,图答应定位于企业互动营销工具,自身不主动提供内容,而由有营销需求的企业去自定义需要识别的图片和关联的多媒体数据。也就是说,图答应可能更多充当着B端解决方案提供商的角色,这与微信搜图2C的定位不太一样。
在Chris看来,虽然目前视觉搜索市场远未成熟,但却是很好的进入时机。“我们认为图像或者说图像所依附的摄像头,是移动互联网时代的重要搜索入口。关于这一点,百度、腾讯等公司已经帮我们做了论证。但由于图像识别技术本身的特性,给像我们这样的创业者留下了很多机会。”
需要指出一点,传统的“以图搜图”与视觉搜索并不等价,后者需要对图片的内容以及用户输入图片的目的做出一定判断,比如我上传一张“美女与野兽”的图片,系统需要知道我关心的到底是“美女”还是“野兽”,据此才能返回有意义的结果。更智能的搜索需要依赖大数据、机器学习等技术,这也是该领域的创业门槛所在。
国内的视觉搜索市场,除百度识图、腾讯SOSO慧眼等巨头产品外,还有图答应、慧眼开发平台、图图导购等创业玩家。随着Google Glass和BaiduEye等穿戴硬件的逐渐成熟,相信视觉搜索行业也会迎来一个高速成长期。