【[23星]nGPT:开源复现NVIDIA的nGPT模型,大幅提升Transfo

爱生活爱珂珂 2025-03-08 11:26:04

【[23星]nGPT:开源复现NVIDIA的nGPT模型,大幅提升Transformer训练效率。亮点:1. 相比传统Transformer,训练速度提升4-20倍;2. 使用LLaMA分词器,优化模型性能;3. 在1k和4k上下文中分别实现1.5-2倍和4倍的加速效果】

'nGPT: an open source reproduction of NVIDIA's nGPT (Normalized Transformer with Representation Learning on the Hypersphere)'

GitHub: github.com/JoeLi12345/nGPT

开源复现 Transformer优化 高效训练 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注