2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
吉利汽车:拟进行23亿港元股份回购计划|界面新闻 · 快讯
金融监管总局披露9月第三批罚单,一个月合计罚超3亿|界面新闻
全国铁路预计今日发送1820万人次,已连续4天客发量超1800万人次|界面新闻 · 快讯
交大思诺董事长李伟被实施留置,上半年净利润同比下滑超五成|界面新闻 · 证券
香港恒生指数收跌0.54%,恒生科技指数收跌0.90%|界面新闻 · 快讯
王健林限高措施已取消|界面新闻 · 地产
芝商所将于2026年起提供24/7全天候加密货币期货和期权交易|界面新闻 · 快讯
西贝调改后首日:羊肉串现串,部分菜品降价|界面新闻
发表评论