36氪获悉,近日NLP自然语言处理技术开发商中科凡语获数千万元A轮融资,投资方为高科新浚和金科君创。本轮融资将主要用于企业发展、产品开发,以及产品推广。
中科凡语深入挖掘NLP的垂直应用,在医疗、科技、金融、法律、文化的等领域,提供覆盖英、日、德、法、俄等七十多个语种的机器智能翻译服务。为“一带一路”中政府、机构组织、企业等多层面提供翻译、信息整合及分析服务等。
自然语言处理是人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、人工智能算法、数学等于一体的科学。在这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但是又需要涉及更多的应用领域,并在这些领域进行深度学习,即建立通用领域和垂直行业领域交叉的神经网络。
中科凡语2018年孵化于中国科学院自动化研究所,是一家机器翻译及多语言信息处理解决方案提供商。依托中国科学院自动化研究所在人工智能、自然语言处理和机器翻译等方向积累的理论成果,公司自主研发了自然语言处理算法和工具,并提供面向不同专业方向的行业解决方案,推出了以“信译”、“信推”、“信析”、“信服”和“信取”为代表的五种NLP技术产品,还有一款可离线运行,能够为行业用户提供定制的“基于神经网络及领域知识的机器混译系统成套装备”,以及最新可以面向C端的飞译CAT平台。
其中,基于神经网络及领域知识的机器混译系统成套装备,作为翻译引擎,涵盖大多数常用文档格式,支持百万级别术语库、记忆库,低功耗、方便携带,可即时提供面向不同专业领域的翻译服务。
飞译CAT平台则是一个可提供众多翻译学习方法、辅助翻译技术和全球资讯等服务的AI赋能平台,解决了人工智能在跨语言、跨领域信息分析处理和语言翻译方面存在的诸多问题。该平台根据国内外用户的不同需求,已推出具有实用性和针对性的四个版本,即高校版、医疗版、通用版和个人版,实现了对不同人群、不同领域、不同需求的全方位覆盖。
NLP是目前人工智能从感知智能向认知智能进化的方向之一。据Tractiac发布的报告“自然语言处理(NLP)市场研究报告-全球预测2022”中指出,NLP市场在五年内将保持快速增长,2021年全球NLP市场将达到1607亿美元。Google、Facebook、阿里、腾讯、百度等国际、国内头部企业均已在NLP领域布局,以提供通用型产品为主。中科凡语则基于涵盖政治、法律、航空、医疗多个细分领域的亿级双语平行语料建立了与具体业务场景结合的NLP工具。
公司面向医疗、科技、金融、法律、文化等垂直领域设计了定制化翻译及信息分析服务工具。比如为某国际知名航空公司所定制的飞机维修日志汉英机器翻译产品在投入使用后,每天可完成约10万条飞行维修日志的实时翻译、译后信息处理;针对医疗AI方向,公司研发出医疗机器翻译系统、电子病历结构化处理系统、医疗文本分析系统、智能辅助诊疗系统、智能分诊问诊系统等,已与某全球性生物制药集团及国内某三甲医院开展合作;此外,公司还承担了多项面向国家和政府重大战略需求的合作项目,如为“一带一路”沿线国家提供翻译、信息整合及分析服务等。
据中科凡语介绍,机器翻译在面向不同专业领域,特别是提供多语种服务的时候,翻译的准确率并不是考量的唯一标准。翻译+NLP服务的作用更多体现在两个方面:一是效率,二是信达雅。中科凡语基于先进的算法模型和数亿级的语料库,适配新的行业应用,最快定制迁移周期为一到两周的时间。
在NLP特别是机器翻译这个领域,可以深入其他垂直领域提供定制化服务的公司,在全球范围内并不多见。中科凡语告诉36氪,这个领域确实有比较高的技术门槛:首先需要先进的技术框架,包括基于神经网络主体框架,辅之记忆、规则统计及知识等多任务模型,和基于预训练模型、主动学习及终生学习等分析算法;其次需要完备的基础算法,包括1)多语言词法分析、句义工具,2)多主题聚类、分类工具,3)跨语言多模态自动摘要、信息检索工具;再次需要丰富的语言资源,包括数亿级别的双语平行语料,覆盖英、日俄等七十多个语种,涵盖法律、航空医疗等多个细分领域,和数亿级别的单语数据;最后要有快速的迁移能力,提供专业的语料加工、精准的知识挖掘。
中科凡语的首席科学家宗成庆是中科院自动化所研究员、博士生导师,现任国家重点研发计划重点专项首席科学家。核心团队成员均为博士学历,有阿里、IBM等高级算法专家的从业经历。获得了一百余项国家发明专利、软著等,目前服务于国际国内20余家知名企业,80余家B端G端重要客户,其中包括包括阿里、华为、联想、金山等。
高科新浚 评语