AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
在当今人工智能领域,模型的自我反思能力一直是研究的热点之一。最近,复旦大学知识工场实验室的肖仰华教授与梁家卿副研究员的团队,成功以简洁代码复现了DeepSeek R1的自发反思能力,成为该领域一项引人注目的研究成果。
作者:yulei丨 导语自DeepSeek ...
自从DeepSeek全球爆火以来,网上掀起了一股“向DeepSeek提问”的热潮,有人问职场规划,有人问情感困惑,还有人问它:如果要买一台100吋大屏电视,怎么选才不踩坑?没想到的是连续三次追问后,AI竟给出惊人一致的答案——海信电视。
《2024中国低代码平台市场现状与发展趋势研究报告》发布:“基座型”低代码平台,引领企业关键业务系统建设迈向新阶段,代码 ...
在AI技术飞速发展的今天,中国AI领域正迎来一场新的变革。中泰证券最新发布的研究报告《DeepSeek将如何改变AI应用?》为我们揭示了这一变革的核心力量——DeepSeek。它不仅代表着中国基础大模型的快速演进,更可能成为推动AI应用大规模落地的关 ...
上周传媒、食品饮料、消费者服务涨幅居前。其中传媒受春节档电影《哪吒2》票房超预期带动大涨,尤其影视、游戏板块领涨。消费者服务中的教育板块也表现较好,主要原因在于教育板块前期下跌幅度较大,股价位于低位,且教育、游戏都是AI技术较为重要的应用场景,在全市 ...
自2月5日华为宣布“小艺智能体”接入DeepSeek-R1算起,在一周多的时间里,包括星纪魅族、荣耀、OPPO、努比亚、vivo在内的6家手机厂商宣布接入DeepSeek。
根据 Deepseek 公布的信息,许多人认为,只有训练更大规模的模型,才能真正发挥强化学习(RL)的威力。然而,训练大模型需要庞大的计算资源,让开源社区望而却步。目前的工作(如 TinyZero)仅在简单任务上复现了所谓的 “Aha moment” ...
1 天
来自MSN史上最全deepseek喂饭指令更多ai资料和使用技巧👀最后一张图 想必这两天大家都被国产大模型deep seek刷屏了吧 ! 那么对于我们的写作来说,这款大模型能带来什么便利呢?小编肝了一晚上整理出了最新的调试指令,希望对大家有所帮助。 ——— ...
2 天
来自MSN如何评价 DeepSeek 的 R1 与 R1-Zero 模型?rule based看着越是简单,复现越是艰难 从r1报告放出来的那天起,手头做的其他工作都不香了,忍不住砸了大量时间来复现。 复现效果不是很好,并没有出现response length总是越训越长的情况。训练样本的利用效率太低了,很难训出什么 我也不能说自己训出了aha ...
因为根据DeepSeek的研究,模型的进步并非均匀渐进的。在强化学习过程中,响应长度会出现突然的显著增长,这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟,暗示着某种深层的认知突破。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果