斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家
现有大语言模型的训练和推理速度,还能再快一点——快多少?2-4倍。
发表于 7/19/2023 1:38:19 PM
阅读(1038)
Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70%
微软大模型新架构,正式向Transformer发起挑战!
发表于 7/19/2023 1:30:20 PM
阅读(1296)