中文21
从零构建大型语言模型
学习资料
GPT实现LLM从零+3
作者: Sebastian Raschka
发表时间:
《Build a Large Language Model (From Scratch)》官方代码库提供从零实现GPT类LLM的完整教学代码,覆盖数据处理、注意力、预训练、分类微调、指令微调与推理,采用纯PyTorch、可在普通笔记本运行,并扩展Llama、Qwen、Gemma、MoE等架构,配套视频、自测、Docker、答疑及推理模型续作资源。
浏览 学习资料 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文《Build a Large Language Model (From Scratch)》官方代码库提供从零实现GPT类LLM的完整教学代码,覆盖数据处理、注意力、预训练、分类微调、指令微调与推理,采用纯PyTorch、可在普通笔记本运行,并扩展Llama、Qwen、Gemma、MoE等架构,配套视频、自测、Docker、答疑及推理模型续作资源。