代码(notebook)模式,支持Python、R、SQL、Scala等语言对数据和模型进行操作;组件模式,针对特定场景定制交互框和拖拽式操作,所见即所得。
支持常见的数据预处理算子,包含但不仅限于归一化、零值填充、采样、join、PCA等;对算子结果进行适合的可视化展现,更易理解;提供集群化和硬件适配,以加速算子执行。
集成传统机器学习算法,LR、GBDT、Clustering等;集成深度学习框架,百度PaddlePaddle和谷歌Tensorflow;多种增强服务:board形式的训练过程可视化、分布式和硬件适配的算法加速、模型debug和fine-tunning。
以类似表的方式管理特征和模型;提供简洁的多语言API;支持多级命名空间、分组和版本管理。
从数据预处理到在线预测的整个处理流程都可以托管到作业调度系统例行执行;提供统一的RESTful API;支持流量控制和版本控制;提供多种部署方式,方便与应用结合。
支持交互框和拖拽式操作,所见即所得。
支持Python、R、SQL、Scala等操作数据和模型。
轻松一键(一行代码)导入导出,兼容常见数据和模型格式。
插件化方式便捷地集成丰富的数据预处理、特征工程算子以及机器学习算法。
优选常用算子和算法,提供可视化绑定和加速(包含集群加速和硬件加速)服务。
集成百度PaddlePaddle和谷歌Tensorflow。
提供模型的debug和fine-tuning的能力。
支持小流量实验、灰度测试等流量控制特性。
支持workflow全过程管理以及全流程托管。
集成个性化推荐、用户画像以及知识图谱解决方案。