CV(Computer Vison)行业在中国发展至今,在商业化落地方面最成熟的方向有三个,分别是人脸识别引擎、无人机视觉分析与视频结构化分析。其中视频结构化分析主要有两个应用场景,一方面是在公安领域,对行人和车辆属性分析与目标检索;另一方面是在视频行业对视频内容做理解与检索。
周同科技CEO邵塬翔告诉36氪,相比图文信息,视频所包含的信息量更大,但问题在于优质视频内容的制作耗时长且成本高,商业价值也没有得到充分利用。而传统视频广告的缺点也非常明显:投放形式生硬、投放精确度低,植入与内容关联性差。
因此,周同科技想要利用视频结构化分析的能力,聚焦于互联网营销行业,实现广告物料的自动生成、关联广告的智能投放以及精准推送。
目前周同科技一共上线3个功能,分别是“视频摘要”、“视频识别”与“视频搜索”。其中视频摘要是通过深度学习技术,以语义分析为基础,自动化截取视频精彩时刻,输出GIF或者短视频;
视频识别是运用计算机视觉和深度学习技术,识别出影片中的人脸、场景、动作、物体、商标等多维度的信息,将非结构化视频转化为结构化的视频大数据;
而视频搜索则通过视频结构化,提升搜索引擎的搜索能力,精准定位到你所想找的每一秒、每一个场景。例如搜索模特,输出结果是从长视频中切成的包含模特的片段场景。
邵塬翔告诉36氪,虽然目前在视频结构化领域内的公司不止有周同科技一家,但周同在底层技术上从3个维度做出了微创新。
首先,与友商在视频识别上采用抽帧检测或是逐帧检测不同,周同科技通过视频切片,进行场景分割,再根据场景的时长和内容选择不等的关键帧进行检测,最后根据检测结果,对场景分割结果进行修正,确保检测结果不丢失关键内容。这能有效避免大量算力的消耗,而且在识别速度上能够提到十余倍。
其次,是在行业细分上,周同科技针对旅游、电竞、体育、综艺方向的视频,进行了专项数据训练。邵塬翔告诉36氪,目前这四类的视频准确率可以达到95%。
最后一点微创新则源自公司成立之前。技术团队曾以LAB的形式在美国进行算法研发,期间积累了大量的训练数据。这些数据主要便是对中国的广告市场进行了针对性的数据训练,目前能识别两万种物体、二百类场景、三百个商标。以车辆识别为例,已可以识别包括车辆、车型、品牌、子品牌等多种车辆描述信息。
邵塬翔告诉36氪,周同科技在提供技术解决方案的同时,一直在整合广告主的资源,逐步构建从视频内容生产到分发的商业闭环。
周同科技目前有17名全职员工,CEO 邵塬翔,为帝国理工大学硕士,西南交通大学学士。曾任HBA中国区主理人,Ueye VR创始人,领导团队独立完成科比退役纪录片《曼走》,浏览量破亿。曾建立移动设备与云服务上个人照片和视频的深度搜索模型。
COO 华鑫毕业于西南财经大学,曾就职于成都市金牛区投资促进局,负责对接科技公司项目融资引进。
视频数据结构化领域最核心的技术有“镜头边界监测”、“场景聚类”、“镜头分类”与“关键帧提取”,主流的CV技术公司均有涉足。
其中安防领域有商汤科技、旷视科技、依图科技、格林深瞳、中科视拓;C2C电商领域有Yi+、Viscovery和视连通;影视广告领域有视连通与周同科技等。