面向校园的大数据存储平台,能够提供Web界面化安装部署,并具有图形化、向导式的集群安装部署方式
机架和主机管理:支持图形化地展示主机在机架上的物理位置,并对主机和服务进行可视化的监控,方便大型集群的管理。
数据计算:提供MapReduce、Spark、Storm、Tez等多种计算框架,离线计算、内存计算和流式计算并存,满足高吞吐、大数据量和低时延实时处理等多方面的数据计算要求。
数据挖掘:提供机器学习算法库Mahout和Spark MLlib,包含聚类分析、分类算法、频度关联分析和推荐系统在内的常用机器学习算法。
多类型数据结构支持:支持结构化、半结构化、非结构化的数据结构。
安全性:对管理员的权限进行控制,采用最小授权原则对系统管理员、安全保密员、安全审计员进行系统权限的赋予。
收起
点评