Skip to main content
Back to top
Ctrl
+
K
English Version
Search
Ctrl
+
K
Python 数据科学加速
1. 并行计算基础
1.1. 现代计算机体系结构
1.2. 串行执行与并行执行
1.3. 线程和进程
1.4. 并行程序设计方法
1.5. 性能指标
2. 数据科学
2.1. 数据科学生命周期
2.2. 机器学习
2.3. 深度学习
2.4. 超参数调优
2.5. 软件生态与本书内容
3. Dask
3.1. Dask 简介
3.2. Dask DataFrame 快速入门
3.3. 将 Dask 扩展到集群
3.4. GPU
3.5. Task Graph 与数据切分
4. Dask DataFrame
4.1. 读写数据
4.2. 索引
4.3.
map_partitions
4.4. Shuffle
4.5. 基于 Dask 的数据分析案例
5. Dask 机器学习
5.1. 数据预处理
5.2. 超参数调优
5.3. 分布式机器学习
6. Ray
6.1. Ray 简介
6.2. 分布式函数
6.3. 分布式对象存储
6.4. 分布式类
7. Ray 集群
7.1. Ray 集群
7.2. 计算资源与资源组
7.3. Ray 作业
8. Ray Data
8.1. Ray Data 简介
8.2. 数据加载、查看与保存
8.3. 数据转换
8.4. Preprocessor
8.5. Modin
9. Ray 机器学习
9.1. Ray Train
9.2. Ray Tune
9.3. Ray Serve
10. Xorbits
10.1. Xorbits Data
10.2. Xinference
11. MPI
11.1. MPI 简介
11.2. MPI Hello World
11.3. 点对点通信
11.4. 集合通信
11.5. 远程内存访问
12. MPI 与大模型
12.1. NCCL 简介
12.2. 数据并行
12.3. 流水线并行
13. 参考文献
Index