亿橙NLP内容分析平台基于我们十七年在情报分析、文献挖掘领域积累的训练样本和算法模型,从内容提取阶段,到词句分析、机器阅读理解提供内容分析全流程的技术服务。
平台目前支持400余种格式及小版本的内容提取,包括Office word、ppt、excel、Visio,WPS,PDF、RAR、ZIP、DWG、HTML、TXT、BMP、JPEG等上百种主流文档,并支持基于文档结构深入解析的文档冗余信息提取、嵌入信息提取等功能,实现文档类型伪装的准确检查。解析提取速度高达10GB/分钟,配合OCR可实现图片、视频内容提取。
收起
点评