AIWeekly12月915日OpenAI发布Sora谷歌发布Gemini20xA

小火箭shadowrocket • 2026年1月16日 am8:09 • 小火箭

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“ 外挂 ”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于 AI科普， AI工具测评， AI效率提升， AI行业洞察。关注我，AI之路不迷路，2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说：“我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇，所以我们觉得非常重要。”

AI Weekly回来了！

“ AI Weekly ”是AI领域的前沿资讯周报，每周与你相约，精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒，帮助你高效掌握最新动态，增强对AI技术及应用趋势的洞察力。

省流版摘要

OpenAI连续12天直播发布：本周推出多项新模型/功能，包括文生视频模型 Sora 、升级版ChatGPT Canvas、深度集成ChatGPT的Apple Intelligence、视频聊天功能（支持屏幕共享和圣诞模式）以及ChatGPT Projects。

谷歌发布 Gemini 2.0 模型：性能显著提升，关键基准测试速度较 Gemini 1.5 Pro 快两倍，新增多模态输出功能，并支持自主决策能力。

xAI新版 Grok-2 模型向全体用户免费开放：新版 Grok-2 支持网页搜索和引用功能，实时整合X平台信息，Premium用户享有更多功能和更高的使用限制。

阶跃星辰发布千亿参数语音大模型 Step-1o ：国内首个端到端语音大模型，支持语音和文本输入输出，具有情感识别、深度模仿和自学习能力，近期将接入“跃问”App。

字节跳动豆包电脑版上线视频生成功能：视频生成模型 PixelDance 开启内测，每日可免费生成十支视频，适用于广告、电商和文旅等领域。

360推出自研推理模型 360gpt2-o1 ：在数学和逻辑推理任务上表现优异，显著超越前代模型 360gpt2-pro ，适用于复杂推理和学术场景。

1. OpenAI连续12天直播发布，本周推出Sora文生视频模型

为方便阅读，关于OpenAI连续12天直播发布活动相关的信息均整合到了这条新闻下。

本周是OpenAI直播活动的第二周，对应Day 3 - Day 7，主要发布内容包括：

文生视频模型 Sora ，Sora是作为一个独立的产品发布的（sora.com），刚发布时由于OpenAI准备不足，太多人同时涌入，Sora被迫关闭了注册，目前已正常开放。

ChatGPT Canvas ，新发布的Canvas是之前beta版本的升级版，加入了直接在沙盒运行Python代码的功能，并向所有用户开放使用，包括免费用户。

Apple Intelligence ，即深度集成了ChatGPT的Apple Intelligence，尤其是Siri。遗憾的是，Apple Intelligence并未在国区设备上开放，开放时间待定。

高级语音模式视觉功能，现在你可以和ChatGPT视频聊天了，大大扩展了ChatGPT实时语音功能的使用场景，另外也支持屏幕共享，以及新推出的圣诞老人模式。

ChatGPT Projects ，本周最实用的功能，能够有效进行历史对话管理，支持同一项目下的知识库管理和自定义指令，以及Canvas和联网搜索。

日期

发布关键词

详细解读文章

? Day 1

满血版 o1 、 ChatGPT Pro 新套餐

满血版o1，200美元/月的ChatGPT Pro新套餐！

✨ Day 2

强化学习微调（Reinforcement Fine-Tuning, RFT）

o1+强化学习微调=定制化推理模型！

? Day 3

文生视频模型 Sora

Sora文生视频模型真的来了？！

?️ Day 4

ChatGPT Canvas

ChatGPT Canvas全面升级，免费开放！

? Day 5

Apple Intelligence

OpenAI直播发布第5天：ChatGPT+Siri=新Apple Intelligence！

? Day 6

视频聊天、屏幕共享、圣诞模式

OpenAI直播发布第6天：ChatGPT视频聊天、屏幕共享和圣诞语音包！

? Day 7

ChatGPT Projects

OpenAI直播发布第7天：ChatGPT推出Projects，本周最强功能！

2. 谷歌发布Gemini 2.0：性能提升，押注AI Agent

2024年12月11日，谷歌正式推出其最新AI模型 Gemini 2.0 。该模型在关键基准测试中表现出色，性能与 Gemini 1.5 Pro 相当，响应速度则是其两倍。

Gemini 2.0 引入了多模态功能，支持原生图像和音频输出，并具备自主决策能力，可在用户最少干预下完成复杂任务。目前，谷歌推出的是该系列模型的首发实验版本 Gemini 2.0 Flash ，旨在提高任务执行的速度和效率。

3. xAI宣布新版Grok-2模型向X平台全体用户免费开放

2024年12月13日，埃隆·马斯克旗下的人工智能公司xAI宣布，其最新版本的 Grok-2 聊天机器人现已免费向所有X平台用户开放。此前，该服务仅面向付费用户提供。根据新政策，所有用户均可使用 Grok-2 模型，而Premium和Premium+用户将享有更高的使用限制，并优先体验未来的新功能。

Grok-2 模型能够实时整合X平台的信息，为用户提供更直观、可控且多样化的互动体验。此外， Grok-2 还引入了网页搜索和引用功能，利用X平台的帖子和更广泛的互联网资源，为用户的查询提供及时且准确的答案。引用功能使用户能够深入了解信息来源，便于获取更多信息或验证Grok提供的内容。

4. 阶跃星辰推出国内首个千亿参数端到端语音大模型 Step-1o

2024年12月13日，人工智能公司阶跃星辰发布了 Step-1o ，据称是国内首个千亿参数的端到端语音大模型。与传统的级联式语音模型不同， Step-1o 直接处理语音输入和输出（类似于ChatGPT高级语音模式的 GPT-4o ），避免了中间的文本转换过程，从而提高了传输效率，并保留了情感等信息。

Step-1o 支持语音、文本等多种输入输出形式，能够快速响应并允许随时打断。它还具备深度理解和模仿音色、韵律、方言等特征的能力，可通过自我学习不断提升回复质量，提供专业建议和情感陪伴。阶跃星辰官方表示 Step-1o 近期将接入“跃问”App，为用户提供实时语音通话服务。

5. 字节跳动豆包电脑版上线视频生成功能

字节跳动旗下的AI助手豆包近期在电脑版中开启了视频生成模型 PixelDance 的内测。部分用户已获得体验资格，每日可免费生成十支视频。

PixelDance采用DiT（扩散Transformer）架构，具备出色的语义理解能力，能够将文本或图片信息转化为生动逼真的视频内容。该模型支持复杂的动态运镜、多镜头切换，并能保持内容一致性，适用于电商营销、动画教育、城市文旅等领域。此前，豆包已在即梦AI和火山引擎平台上进行小范围测试。

版权声明：
作者：小火箭shadowrocket
链接：https://www.shadowrocket888.vip/397.html
来源：小火箭官网
文章版权归作者所有，未经允许请勿转载。

THE END

小火箭小火箭下载小火箭加速小火箭加速器小火箭官网小火箭节点

二维码

AnthropicCursor对谈实录程序员的工作方式正被AI重新定义

< <上一篇

谷歌悄悄发了篇技术博客藏着Gemini3真正的杀手锏

下一篇>>

搜索内容

AIWeekly12月915日OpenAI发布Sora谷歌发布Gemini20xA

取消回复

共有 0 条评论

小火箭高速节点推荐

标签

热门文章