首个线性注意力架构的大模型来了，MiniMax 400 万超长上

首页
文科汇编
编程日记

首页 > 标签 > 首个线性注意力架构的大模型来了，MiniMax 400 万超长上

首个线性注意力架构的大模型来了，MiniMax 400 万超长上下文大模型重磅开源！

首个线性注意力架构的大模型来了，MiniMax 400 万超长上下文大模型重磅开源！

最近一个月，大模型领域热闹非凡，各大科技公司纷纷加码。阿里推出了 QwQ 模型，OpenAI 发布了 o1 Pro，Google 带来了 Gemini-2.0-Flash-Exp，而 DeepSeek 则凭借 V3 模型成功出圈。然而，也有

1天前20

CopyRight © 2022 All Rights Reserved 阿南达文事网沪ICP备2024057019号-16 友情链接：范文网|IT编程|电脑技术