每当人们在生活中发现一些不认识的植物、动物,就会想要找人询问。微博上常有这种类型的智囊,粉丝会去提问然后艾特他们,比如“博物君,请问,这是XXX?附上图片”,然后等回答。
而今天要介绍的“形色”APP(杭州大拿科技股份有限公司旗下产品),就是通过图像识别和人工智能解决人们在生活中识别植物的好奇心,帮助人们识别植物,解决此类问题。
创始人陈明权,告诉36氪,当初开发形色APP的初衷,是当面对儿子在小区和路上对于各色花卉的好奇和提问时候,作为父亲的他无法一一准确解答的一点点“尴尬”。所以,他决定自己建个模型来解决这个场景,同时也能让其他父母也能够在小孩子面前“显摆”一下。而最初的模型相对简单,形色搜集杭州本地常见花卉的图片包括从Google和百度的图库。当时已经能实现40%的识别率,比当时百度的图片搜索要准确很多。陈明权打趣到,最初版本的人工智能,其实是“人工+智能”,当时为了避免因为数据不足而产生的识别错误,形色还在后台配备了人工解答问题。
而从技术上看,形色并未采用传统的专家系统(Expert System)来解决植物的分类及识别问题,陈明权解释道,如果采用传统的专家系统,将所有分类学的规则进行程序的编码,需要不断修订此前的规则来完善鉴别系统的规则,数量的上限大约在500种,超过这个数量级,系统的工作量和数据库的承载能力都无法实现。而植物的物种在全球超过60万,而常见的也在4000多种。所以,形色采用深度卷积神经网络的机器学习方法,让系统不断扫描植物图片的特征,并通过专家鉴定的补充,来增加识别的种类和准确度。上传的图片会经过预处理,包括光线调整、颜色反转、曝光度、切出关键部位,再聚焦等,并通过图片分类及物体识别的技术,提高图片在场景中的鉴别准确度。
目前形色的识别准确率已经达到90%以上,可以识别4000种以上植物,正在测试的植物则更多更复杂。
陈明权告诉36氪,随着数据库的不断增长,形色不仅能够认识植物开花时的照片,还能够识别枯萎,或者落叶时的照片,并且已经能够识别一些模仿植物或者是根据植物来制作的物件,不论是雕塑或是其他产品。
从产品来看,最新版本的APP暂无任何广告,界面清新简洁,基本实现了从发现植物、拍照、鉴定到最后识别,整个过程在2-3秒钟。如果用户对于得到的结果有疑问,还可在鉴定区找专家和植物爱好者鉴定。并通过UGC内容、社群运营、拍脸识花和分享功能等,帮助用户进行交流和传播。
形色的界面
目前已经接近300万自然增长的用户,甚至包括欧洲、美洲及非洲都有用户进行使用,暂时未进行任何商业推广。2016年7月份,形色曾被苹果App Store选为了榜首推荐,实现第一次大规模的用户增长。另外,用户的增长也与天气和季节相关,通常春秋天和夏冬天的比例增长数量在2:1。而节假日周末如果天气好,用户规模就会有比较明显的增长,以清明节为例,单天用户上传的照片超过50万。
创始人陈明权,2005年浙大计算机毕业;原Trilogy中国技术总监;设计、架构并成功交付多个世界500强的核心软件系统。其他团队成员包括浙大、清华、卡内基梅隆(CMU)等软件研发资深人员。形色暂时未考虑商业化,陈明权认为,公司有明确的战略规划,首先是好用的工具,其次是社群培养,最后才是商业化,所以现在暂时未考虑太多的商业化。
形色识花似乎符合爆款级应用所需要的3个条件,首先,有明确的用户群体,带小孩的爸妈,赋闲在家的中老年人,以及植物爱好者,而植物爱好者又能够对前两者提供的照片进行鉴别和补充,增加了更多的互动,智能手机的普及,也让中老年用户对微信和APP的使用不断增多。其次,近期形色曾被腾讯官方评为开脑洞的超实用小程序,有腾讯的支持才能在微信的生态中获得流量和用户。最后,用户、产品、数据的三角关系相对稳固,不同图片类社交应用,对形色而言准确性非常重要,而准确度的提高不仅依赖于算法和程序,更需要用户提供更多的数据。
不同于与足迹、百度魔图PK明星脸这类能够瞬间爆红自带话题性的工具,形色更适合伴随活动和节日稳定的用户增长和社群培养,但依然需要面对未来商业变现的问题。而大拿关于图像识别和人工智能的技术则应该能会在更多场景或垂直领域中得到应用。