MPI 与大模型

12. MPI 与大模型#

本章主要解释大模型的并行方法。所谓大模型,指的是参数量庞大的神经网络,它们必须通过并行方式进行训练和推理。大模型并行具有以下几个特点:

  • 计算运行在 GPU 这样的加速卡上,这些硬件专为提高计算效率而设计。;

  • 加速卡的成本非常高昂,因此应努力提高其利用率,确保投资的回报。

  • 由于模型参数量巨大,在训练或推理过程中,可能需要在加速卡之间传输大量数据,这要求有很高的带宽和低延迟以保证效率。

本章将从概念和原理上进行详细解读,而具体的实现细节可以参考其他学术论文和开源库。