DeepSeek在下一代人工智能模型中首次引入“稀疏注意力”机制

作者:admin 时间:2025年09月30日 阅读:15 评论:0

  DeepSeek周一更新了一个实验性的人工智能模型,并称之为迈向新一代架构的中间步骤。

  DeekSeek在Hugging Face上发布帖子,概述了DeepSeek-V3.1-Exp平台,并解释说该平台引入一种名为DeepSeek Sparse Attention的“稀疏注意力机制”,该公司还暗示正在与芯片制造商合作开发该模型。

  今年早些时候,DeepSeek的R1模型以其精妙的算法震惊硅谷,如今该公司正致力于开发新产品。最新版本在V3.1的基础上,引入旨在探索和优化人工智能训练和运行的机制。该公司表示,此举的目的是对长文本的训练和推理效率进行探索性的优化和验证。

  与其他AI初创公司一样,DeepSeek也试图通过降价来吸引用户。该公司称,将把开发者调用DeepSeek API的成本降低50%以上。

DeepSeek在下一代人工智能模型中首次引入“稀疏注意力”机制

本文地址: http://www.jiaotongmi.com/article/11772.html

文章来源:admin

版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关推荐
  • 最新动态
  • 热点阅读
  • 随机阅读
站点信息集合

网站首页 · 交通知识 · 交通资讯 · 工具专区 · 交通迷社区

本站转载作品版权归原作者及来源网站所有,原创内容版权归本站作者所有。
如需转载或商业使用,请联系原作者并注明来源。

Copyright © 2025 交通迷网 All Rights Reserved.
Powered By Zblog-php · 湘ICP备2366号 · 站长统计
相关侵权、举报、投诉及建议,请发送邮件至:facai770880@gmail.com