大数据时代已经到来,但是数据分析专业人士却有十分紧缺。因此,
Prior Knowledge、
ClearStory、
Datahero 及
Platfora等一批数据分析型初创企业如雨后春笋一般冒了出来。日前,Prior Knowledge
开放了其数据库API的公共beta版,试图为希望分析数据但又不想学数学的开发者提供解决之道。
数据分析的需求往往从预感开始。但是当你想进一步弄清楚数据之间的关系时,却往往会因为信息不全或者不知道应该用什么样的数学加以分析而放弃努力。
Prior Knowledge希望通过自己的Veritable服务让这些人继续下去。简单来说,就是帮助进行数据分析的人想出一个统计相关的答案。
其目标是利用机器学习的最新技术来创建出可帮助处理数据不确定性的数学。Veritable建立起一个相当智能的预测数据库,能够针对用户的问题选择合适的数学运算来解决。此外,Veritable还可以对用户提交的数据进行分析,帮助用户找出也许他们自己都没有发现的数据之间的关联关系。
帮助建立预测模型
Veritable会在考虑不同变量之间数万亿种关联关系的基础上搭建预测模型。
用户只需提交数据和问题,Prior Knowledge会进行运算和验证。Veritable的理想用户是了解Ruby或Python且对于自己想要的模型略知一二的开发者。应用场景可能是利用疾控中心的数据来判定某人是否感冒,提高电子商务网站推荐的成功率,希望卖出的罩杯更符合买家尺寸的网上商店也能用得上。了解用户体验但对统计和数学知之甚少的开发者可以利用Veritable。
[caption id="attachment_126265" align="aligncenter" width="604" caption="数据分组示例图1"]
[/caption]
分析潜在关联关系
数据库能够查看用户提交的数据并确定哪些数据跟查询问题最相关,同时还会找出不同数据集之间有趣的关联关系。比方说,如果提交了某人的购物历史数据,Veritable分析后就会显示说年龄是买家选择购鞋类型的最佳预测因素,卖家/开发者则可以相应调整自己的推荐引擎。
[caption id="attachment_126267" align="aligncenter" width="604" caption="数据分组示例图2"]
[/caption]
概括而言,Veritable给开发者提供了对数据进行“预测、解释和归类”的能力,利用其提供的服务,开发者的应用也许可以为用户提供更好的预测,更合理地解释行为(具有这些症状的人得了感冒),以及对用户进行更精准地分组(这一类的买家会买产品X)。
Prior Knowledge今年二月从Founders Fund拿到140万美元的融资。其Veritable 在封闭beta测试期间有两个应用开发者在试用其服务。一个是为对冲基金开发金融风险评估工具的应用,另一个则做的应用跟医疗保健有关。该平台能否成为数据分析的基础平台仍有待观察,但随着其公测的开放,相信会引起更多开发者的注意。