量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势,关注科技行业新突破!

斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家

现有大语言模型的训练和推理速度,还能再快一点——快多少?2-4倍。

Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70%

微软大模型新架构,正式向Transformer发起挑战!

650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目

650亿参数大模型的预训练方案,发布即开源。 
Baidu
map