斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家
现有大语言模型的训练和推理速度,还能再快一点——快多少?2-4倍。
发表于 2023/7/19 13:38:19
阅读(997)
Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70%
微软大模型新架构,正式向Transformer发起挑战!
发表于 2023/7/19 13:30:20
阅读(1265)