金融是个数据密集型行业,经过多年的发展和积累,数据量和数据维度也在快速增长。对业务数据的管理、挖掘和分析以指导业务开展的需求,也促使金融科技向智能化的方向发展。目前人工智能技术尚处于发展初期,可以大规模的量化、替代部分人力分析的工作,未来也可以辅助人脑进行决策。
36氪近日接触到的一家AI驱动的资本市场信息服务提供商——见微数据,就是从金融搜索引擎应用切入金融科技市场。见微数据宣布已完成Pre-A轮融资,BV百度风投和嘉程资本共同领投,华兴Alpha任此次融资的独家财务顾问。公司天使轮由信天创投领投。据悉,此轮融资主要用于技术研发,同时见微数据已开启新一轮融资。
见微数据CEO卢飞飞告诉36氪,金融中介机构(包括投行、律所、审计等)的从业人员在业务过程中需要通过公开数据库查阅大量的资料和相关案例,耗费人力和时间。见微数据希望可以解析这些非结构化的公开数据(包括公众公司公告、法律法规等),以实现非结构化信息的精准提取、检索召回和数据统计,帮助资本市场从业人员提升工作效率。
见微数据通过视觉图像和自然语言处理技术,批量处理A股、三板、港股和美股等各个板块、各种格式的信息的披露文档,逐篇准确提取文件内容、表格数据、章节上下文信息和文档特征,构建多层次、跨市场的多维度结构化数据集。卢飞飞告诉36氪,这些公众公司的信息披露文件多是以PDF的格式发布,而且包含大量的表格以及结构图,想要批量精准地处理这些非结构化文档,对公司的算法能力提出了较高要求。
在解析了非结构化数据后,见微团队基于开源架构打造了专业文本搜索引擎,并不断优化检索精度,以提升用户的使用效率和体验。该款SaaS产品目前主要服务于资本市场专业从业人员,并已为数万名投行、律所、基金等机构的用户累计提供了数千万次搜索、信息统计和消息推送服务,帮助资本市场从业人员在资料搜索环节提升了70%-80%的效率。
线上SaaS服务可以快速规模化,但无法保证用户的粘性和规模化营收。因此,见微数据会将精力集中在为机构客户部署本地解决方案,将机构客户内部的海量数据资料也接入搜索数据集中,并和外部公开数据集融合,以实现内外部数据的统一处理,并以此为基础根据客户的业务流程和需求不断扩展产品线和功能模块。
卢飞飞告诉36氪,全国有数千家文档密集型商业机构,潜在市场规模在百亿量级。资本市场中介机构只是见微数据初期的切入点,未来会针对不同类型的机构提供全方位的资本市场信息服务解决方案。
见微数据现有20人,预期今年可以扩张至30-40人,团队成员均兼具通用技术领域的知识和专有领域的特长,技术团队拥有丰富的工程和算法实践经验。见微数据创始人兼CEO 卢飞飞,本科毕业于南京大学材料物理系,后求学卡耐基梅隆大学攻读工学博士。卢飞飞具有多年期权的量化交易经验和数据分析经验,具有基金从业资格,主要负责公司的商务、战略和投融资事宜。见微数据创始人兼CTO杜宁,本科毕业于北京大学经济学院金融系,后取得香港大学经济学硕士学位,并通过国家司法考试。杜宁曾先后就职于北京市竞天公诚律师事务所和国双科技,分别从事证券法律服务和司法领域的产品设计与技术开发,现主要负责公司的产品和技术事宜。
国内同类的基于视觉图像和自然语言处理技术,对金融市场的公开数据进行解析的公司还有文因互联、、庖丁解文等。卢飞飞表示,虽然各家的技术手段相似,但业务路径有较大区别。而且国内此块业务处于初期起步阶段,尚不形成竞争局面。
百度风投CEO刘维认为,见微数据在信息获取的广度、理解的深度、时间的频度上为金融机构提供了全新的数据来源,帮助金融机构提升效率和处理复杂交易的能力,是AI+细分行业效率提升的典型尝试。嘉程资本创始合伙人李黎认为,资本市场对文本信息服务的需求很大,但一直没有得到有效解决。见微数据的产品有效提高了中介机构文本查找和处理的效率,找到了切入资本市场业务流程,提高业务效率的关键点,有巨大的扩展空间。