AIWeekly11月1824日DeepSeek发布国内首个推理模型Gemini新模型夺

小火箭shadowrocket • 2026年1月20日 am7:38 • 小火箭

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“ 外挂 ”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于 AI科普， AI工具测评， AI效率提升， AI行业洞察。关注我，AI之路不迷路，2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说：“我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇，所以我们觉得非常重要。”

AI Weekly回来了！

“ AI Weekly ”是AI领域的前沿资讯周报，每周与你相约，精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒，帮助你高效掌握最新动态，增强对AI技术及应用趋势的洞察力。

省流版摘要

DeepSeek推出 R1-Lite 预览版：DeepSeek发布推理模型 DeepSeek-R1-Lite ，在数学、编程等复杂逻辑任务中表现媲美 o1-preview ，并超越 GPT-4o 。模型已开放网页使用，正式版将开源并支持API调用。

昆仑万维推出中文逻辑推理模型“天工4.0 O1版” ：昆仑万维宣布天工大模型4.0 O1版将于11月27日启动邀测，支持思考、计划和反思等能力。官方称这是国内首款中文逻辑推理模型，但发布时间与其他模型相近，实际表现有待验证。

夸克推出“学术搜索”功能：夸克上线“学术搜索”AI工具，每次回答引用10篇以上文献，支持生成学术大纲和PPT，提升学术研究效率。

OpenAI发布新版 GPT-4o ：新版 GPT-4o 提升创意写作能力和文件处理表现，登顶大模型竞技场榜首，但仅领先谷歌一天。

谷歌发布 Gemini-Exp-1121 实验版：谷歌推出 Gemini-Exp-1121 实验版，在代码生成和推理任务上表现优异，再次登顶大模型竞技场榜首。

Mistral推出多模态AI模型 Pixtral Large ：Mistral发布多模态模型 Pixtral Large ，在视觉数据、图表理解和数学推理领域超越 GPT-4o ，适用于研究、教育和商业用途。

1. DeepSeek推出R1-Lite预览版，推理能力媲美o1-preview

2024年11月20日，DeepSeek宣布其全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。该模型采用强化学习训练，推理过程中包含大量反思和验证，思维链长度可达数万字。在数学、编程等复杂逻辑推理任务中， DeepSeek-R1-Lite 展现出媲美 OpenAI o1-preview 的性能，并为用户呈现了 o1 未公开的完整思考过程。

在美国数学竞赛（AMC）中难度最高的AIME以及全球顶级编程竞赛（Codeforces）等评测中， DeepSeek-R1-Lite 超越了 GPT-4o 等知名模型。值得注意的是， DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不提供API调用。官方表示，正式版 DeepSeek-R1 模型将完全开源，并公开技术报告和部署API服务。

感兴趣的小伙伴可以翻看我这篇介绍文章：《国内首个对标o1的推理模型发布：DeepSeek-R1-Lite初体验！》。

2. 昆仑万维“发布”国内首款中文逻辑推理模型“天工4.0 O1版”

2024年11月18日，昆仑万维（开发天工AI 的公司）官方宣布，其新一代具备推理能力的天工大模型4.0 O1版（英文名： Skywork O1 ）将于2024年11月27日启动邀请测试。作为支持中文逻辑推理的模型，它能够输出包含思考、计划和反思等能力的答案。

虽然昆仑万维强调天工大模型4.0 O1版是国内第一款具有中文逻辑推理能力的模型，但其实这并不是事实。首先，月之暗面（开发Kimi的公司）早在两天前（11月16日）就已官宣了其数学推理模型 k0-math 。其次，和昆仑万维、月之暗面停留在PPT上的发布不同，DeepSeek（中文名：深度求索）已于2024年11月20日真正发布了推理模型 DeepSeek-R1-Lite ，该模型在各项基准测试中表现优秀，现已面向所有用户免费开放使用，每用户每天使用数量限制为50次。

3. 夸克推出AI产品“学术搜索”

2024年11月18日，夸克发布AI产品“学术搜索”，旨在提升学术工作中的信息获取、创作和处理效率。该产品依托AI技术和亿级学术文献资源，能够在每次AI回答中引用超过10篇文献内容，实现多维度的信息归纳和知识整理，确保搜索内容的准确性。

在创作写作方面，夸克学术搜索可根据用户提出的学术问题，结合研究背景、市场现状和发展趋势等因素，智能生成学术大纲，并支持一键制作PPT，进一步提高学术工作效率。

4. OpenAI发布新版GPT-4o，重夺竞技场榜首

2024年11月20日，OpenAI官宣了新版本的 GPT-4o 模型，此次更新主要提升了该模型的创意写作能力，使其生成的文本更加自然、吸引人且相关性更高。此外，模型在处理上传文件时，能够提供更深入的见解和全面的响应。

最新版本的 GPT-4o 模型在大模型竞技场中重新夺回榜首位置，超越了此前排名第一的谷歌Gemini。

5. 谷歌发布新模型Gemini-Exp-1121，重夺竞技场榜首

2024年11月21日，谷歌发布了最新实验版模型 Gemini-Exp-1121 ，在大模型竞技场中重新夺回榜首位置（直到我写这篇文章时， Gemini-Exp-1121 仍为第一名）。此前，OpenAI的 GPT-4o 模型刚刚登顶，但仅领先一天，详情见上一条信息。

Gemini-Exp-1121 在代码生成、推理能力和视觉理解等方面表现出色，尤其在复杂提示词的风格控制下，与 o1-preview 和 New Sonnet 3.5 等模型水平相当。在经典的逻辑推理题目中， Gemini-Exp-1121 的回答更加全面且详细，展示了其强大的推理能力。

版权声明：
作者：小火箭shadowrocket
链接：https://www.shadowrocket888.vip/416.html
来源：小火箭官网
文章版权归作者所有，未经允许请勿转载。

THE END

小火箭小火箭下载小火箭加速小火箭加速器小火箭官网小火箭节点

二维码

OpenAI直播发布第6天ChatGPT视频聊天屏幕共享和圣诞语音包

< <上一篇

谷歌悄悄上线新App让AI模型在手机离线运行还开源了

下一篇>>

搜索内容

AIWeekly11月1824日DeepSeek发布国内首个推理模型Gemini新模型夺

取消回复

共有 0 条评论

小火箭高速节点推荐

标签

热门文章