8. Ray Data#
Ray Data是基于Ray Core构建的数据处理框架,它专注于解决机器学习和深度学习中模型训练或推理阶段的数据准备和处理问题,通常这些问题被称为数据的“最后一公里”(Last-mile Preprocessing)问题。本章将主要介绍 Ray Data 的工作原理,以及 Modin,这是一个在Ray之上实现的Pandas接口,用于加速数据处理任务。
Ray Data是基于Ray Core构建的数据处理框架,它专注于解决机器学习和深度学习中模型训练或推理阶段的数据准备和处理问题,通常这些问题被称为数据的“最后一公里”(Last-mile Preprocessing)问题。本章将主要介绍 Ray Data 的工作原理,以及 Modin,这是一个在Ray之上实现的Pandas接口,用于加速数据处理任务。