分类:开源项目作者:Andrej Karpathy排序:发表时间倒序

开源项目 全部文章

浏览 开源项目 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园

分类:开源项目作者:Andrej Karpathy排序:发表时间倒序
microgpt: 一个最小化的 GPT 实现英文
12

microgpt: 一个最小化的 GPT 实现

开源项目
作者: Andrej Karpathy
发表时间

microgpt以200行无依赖Python把数据集、字符级分词、自写autograd、类GPT-2网络、Adam训练与采样推理压进单文件,在3.2万姓名上训练1000步使loss约3.3降至2.37并生成新名字,结论是GPT训练与生成的算法本质可被极简复现,生产差异主要在规模与工程效率。

每页显示 1
上一页 1 / 1 下一页