基于Hadoop/Spark集群,通过分布式文件系统HDFS的数据接口,提供数据整合和数据质量管理等技术,支持海量数据快速存储和加载
采用多种数据处理和统计分析技术,通过交互式和可视化工具,实现数据处理、变量分析和数据可视化等
集合众多主流的机器学习算法,结合Hadoop / Spark平台的分布式能力,支持基于海量数据集的全量数据描述性建模
基于海量数据的描述性探究建模结果,通过对模型和数据的再处理,得到数据的独立化预测性模型,实现了对测试数据的一键式预测
点击图片查看