![]() ![]() |
大模型核心原理与企业落地实践
本书分两大篇。第1篇原理篇 (第1、2章); 尝试引导读者共同探索和揭秘研发领域大模型背后的核心原理, 以使读者“既知其然, 又知其所以然”, 并为后续章节的学习打下坚实的基础。从概率、最优化等基础理论入手, 进而深入浅出地阐述Transformer、神经元等大模型的核心组成元素, 以及评估方法、数据工程建设等通用能力的建设。针对技术细节, 采用通俗易懂的行文风格, 并辅以大量的图表和数据, “零基础”的读者也可以高效地学习。第2篇应用实践篇 (第3-8章), 产业界最新实践成果的总结。选取代码生成、代码转换、知识问答、推理加速、运维运营等研发大模型领域的高频业务作为剖析对象, 详细展示作者在针对这些问题时的端到端思考, 包括设计理念、关键技术瓶颈、解决方案及落地结果等。
你还可能感兴趣
我要评论
|