1.3.1 阿里PAI
1.平台概况
阿里云机器学习平台PAI(Platform of Artificial Intelligence)面向企业客户及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-DSW交互式建模、PAI-Studio拖曳式可视化建模、PAI-DLC分布式训练到PAI-EAS模型在线部署的全流程,支持百亿特征、千亿样本规模加速训练,百余种落地场景,全面提升机器学习工程效率。PAI平台的机器学习应用设计界面如图1.3所示。
2.平台特点
(1)良好的交互设计:使用Web UI界面,通过对底层的分布式算法封装,提供拖拉拽的可视化操作环境,同时也提供了命令行工具,可方便地将算法嵌入到自身的工程中。
(2)优质、丰富的机器学习算法:机器学习平台上的算法都是经过阿里大规模业务锤炼而成的,阿里云机器学习平台不仅提供了基础的聚类、回归类等机器学习算法,也提供了文本分析、特征处理等比较复杂的算法。
图1.3 阿里PAI平台界面
(3)使用阿里云机器学习平台计算的模型直接存储在OSS或MaxCompute上,可以配合其他阿里云的产品组件加以利用。
(4)支持主流深度学习框架:阿里云机器学习平台已经包含了TensorFlow、Caffe、MXNet这三款主流的机器学习框架,还支持流式处理框架Flink、Spark、PySpark、MapReduce等业内主流框架。
(5)除了提供模型训练功能,还提供了在线预测以及离线调度功能,让机器学习训练结果和业务可以无缝衔接。
(6)基于阿里云的云计算平台,具有超大规模的数据处理能力和分布式的存储能力,同时整个模型支持超大规模的建模以及计算。
(7)对于每个输出型组件,都可以通过右键单击组件来查看可视化输出模型。可视化输出有多种表示方法,包括折线图、点图和柱形图等。