DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型_每日快讯(日常热点指南)

DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型


DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型

  2025-09-20 01:51:14     简体|繁體
http://mrkx.qghjm.com/1171772.html

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:红星新闻)

9月18日,梁文锋作为通讯作者,带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning》。

图据澎湃新闻

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。最终它学会了推理——逐步解决问题并揭示这些步骤——更有可能得出正确答案。这使得DeepSeek-R1能够自我验证和自我反思,在给出新问题的答案之前检查其性能,从而提高其在编程和研究生水平科学问题上的表现。

图据澎湃新闻

据悉,DeepSeekR1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

今年1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行业,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAIo1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

伴随AI大模型行业的日新月异,DeepSeek已经更新出R1以外的新版本,但万众期待的R2尚未面世。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。

据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

当时,DeepSeek表示,DeepSeek-V3.1使用UE8M0FP8Scale的参数精度。UE8M0FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。相关表态,一度带动国产芯片算力股价迎来飙升。

来源:澎湃新闻(记者范佳来)、界面新闻

海量资讯、精准解读,尽在新浪财经APP

编辑:财经 来源:市场资讯

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2025年 » « 09月 »
    1234567
    891011121314
    15161718192021
    22232425262728
    2930

    最新资讯

    [开户代运营]红果短剧 京东金融 58 菜鸟裹裹 陌陌 他趣 心遇 爱聊 映客 快手等拉新有预算来
  • 2025-09-20 03:44:40

     

    [开户代运营]高德商业化广告和商户通广告开店+运营
  • 2025-09-20 03:36:34

     

    【金融教育宣传周】破离奇案件 学防诈法则
  • 2025-09-20 03:28:28

     

    济宁市任城区南张街道开展“九一八”事变系列主题宣讲
  • 2025-09-20 03:20:22

     

    “泉心戎耀 就业护航”2025年度退役军人就业服务专项行动跨区域直播带岗即将开启
  • 2025-09-20 03:12:15

     

    已上线启用!这些持卡人可免费乘坐济南公交和地铁
  • 2025-09-20 03:04:09

     

    会吃!德国田径女运动员施密特盛赞中国美食:爱了爱了
  • 2025-09-20 02:56:03

     

    【金融教育宣传周】节庆照妖镜 藏在传统里的现代骗局
  • 2025-09-20 02:47:57

     

    河南5起成功避险避灾案例被应急管理部通报表扬
  • 2025-09-20 02:39:51

     

    中国成全球医药创新策源地,拜耳Co.Lab推动全球资本平台在华首发
  • 2025-09-20 02:31:44

     

    从“客户”到“伙伴”,济宁银行全周期金融服务构建财富管理新生态
  • 2025-09-20 02:23:38

     

    扬子江药业亮相首都国际医学大会 多维度践行健康使命
  • 2025-09-20 02:15:32

     

    三甲医院党委书记、原院长,3天内相继被查
  • 2025-09-20 02:07:26

     

    中国医生,获国际泌尿外科最高荣誉!
  • 2025-09-20 01:59:20

     

    DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型
  • 2025-09-20 01:51:14