书单推荐 新书推荐 |
从RTL级代码剖析FPGA加速大模型训练与推理
本书共分为12章, 内容涵盖FPGA与Verilog HDL基础、FPGA的基本架构、深度学习算法的计算特性、硬件加速的基本思路、模型压缩与量化技术、FPGA在Transformer模型中的应用、大模型训练的硬件优化、异构计算架构中的FPGA角色, 以及面向FPGA的深度学习编译器开发。
你还可能感兴趣
我要评论
|