OpenAI12天直播过半速来领取三大核心中期总结
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“ 外挂 ”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于 AI科普 , AI工具测评 , AI效率提升 , AI行业洞察 。关注我,AI之路不迷路,2024我们一起变强。
OpenAI连续12天直播发布活动已进行到第 7 天。我把OpenAI的这次直播活动写成了一个系列文章,前7天每一天的详细解读文章可以在公众号 历史文章 里找到,并且每一天的直播视频我也都放在了对应的视频号中,方便小伙伴们“食”用。
既然OpenAI的直播发布已经过半,今天就来进行一波多维度中期总结。
话不多说,直接开始。
综合篇
首先总结一下这7天以来的发布时间线,直接上图。

接下来是每一天的重点发布内容及对应的文章,总结在了这个表格中。
日期
发布关键词
详细解读文章
🌟 Day 1
满血版 o1 · ChatGPT Pro 新套餐
📖 满血版o1,200美元/月的ChatGPT Pro新套餐!
✨ Day 2
强化学习微调 (RFT)
📖 o1+强化学习微调=定制化推理模型!
🎥 Day 3
文生视频模型 Sora
📖 Sora文生视频模型真的来了?!
🖌️ Day 4
ChatGPT Canvas
📖 ChatGPT Canvas全面升级,免费开放!
🍎 Day 5
Apple Intelligence
📖 ChatGPT+Siri=新Apple Intelligence!
🎄 Day 6
视频聊天 · 屏幕共享 · 圣诞模式
📖 ChatGPT视频聊天、屏幕共享和圣诞语音包!
🚀 Day 7
ChatGPT Projects
📖 ChatGPT推出Projects,本周最强功能!
附上一张对应的HTML卡片。

一项新技术
在前7天里,有一天的发布是纯技术向的: 强化学习微调 (RFT) 。强化微调技术旨在快速构建特定领域的定制化专家模型,我在对应的解读文章中提到,该技术给AI模型应用带来的意义可能要大于功能本身。
像 GPT-4o 、 Claude 3.5 、 Gemini 这类模型,属于通用模型,不论是哪个行业,哪个领域都能拿来直接用。太通用导致的结果必然是 不够专业 。现在得 GPT-4o 能直接用在医疗或者金融领域吗?也许可以,但专业性肯定不够强。这时,就需要用特定输入数据集对模型进行“微调”。

强化微调技术支持基于推理模型 o1 进行微调,能够利用强化学习算法教会模型在特定领域中进行复杂推理。通过分析模型在不同场景下的表现,并对正确的推理路径进行奖励,对错误的推理路径进行惩罚,强化微调可以引导模型逐步改进其推理能力。这一过程仅需要少量的示例(通常几十个即可),即可显著提升模型的性能。也就是,未来针对特定领域定制化专家模型的成本和门槛将会大大降低。
两个新模型
前7天共发布了两个新模型: 满血版本的推理模型 o1 , 以及 文本生视频模型 Sora 。

o1
对于 o1 模型,有两点需要注意: 满血版本 和 推理 。
满血版本是相对于之前发布的预览版本 o1-preview 来说的,新发布的 o1 是正式版本,总结来说,推理能力更强,可靠性更强(AI模型的输出具有随机性,可靠性用来衡量模型在回答问题时的稳定性和一致性,具体对比见下面这张“4/4可靠性”测评结果),思考时间更长。并且,最新版本的 o1 支持图片输入,也就是能解析图片内容了。

推理则是相较于 o1 这个系列模型的性质来说的。 o1 的本质是推理模型,那么就决定了它不会像 GPT-4o 一样普遍适用。 o1 模型更适合有难度的问题和任务, GPT-4o 则适合一般任务。也正因此, GPT-4 系列模型的下一代并不是 o1 ,而应该是未来会发布的 GPT-4.5 或 GPT-5 。
Sora
Sora 本身是一个文生视频模型,也是一个独立的产品(sora.com)。OpenAI并没有选择将Sora整合到ChatGPT中,同时也为Sora推出了独立的积分消耗机制。并且,OpenAI显然没有预测到全世界热心网友对Sora的热情,刚发布半小时就冲爆了Sora网站,导致OpenAI不得不暂停了Sora的注册,直到2天前才彻底恢复。
而Sora的真实体验也是一言难尽,有惊喜有失望吧。生成的视频效果并没有想象中惊艳,毕竟是一个“鸽”了近10个月的产品,用户的期待还是比较高的。并且ChatGPT Plus会员仅能生成最高720p分辨率,5秒时长的视频,720p实在有点低。
总结来说,如果你已经开通了ChatGPT Plus会员,那么Sora可以尝试一波,毕竟是附加在Plus套餐中的。但如果你单纯是为了文生视频功能,那么不值得开通ChatGPT Plus,国内的文生视频产品如可灵、即梦更值得一试。

三个新功能
在OpenAI 12天直播的前半程中,共发布了三个ChatGPT的新功能: ChatGPT Canvas 、 高级语音模式的视觉(Vision)功能 和 ChatGPT Projects 。
其中, ChatGPT Canvas 对标的是Claude Artifacts,但并不完全相同。ChatGPT Canvas专门针对写作和编程任务,提供了一个协作式的文档和代码编辑环境,支持实时协作创作(和ChatGPT一起)、自动调试和内容优化,代码方面则新引入了Python代码执行的功能,不用再复制代码到别的IDE里进行运行调试了。如果你有写作或者代码需求,ChatGPT Canvas值得尝试。

高级语音模式的 视觉(Vision)功能 包括三部分: 视频聊天 、 屏幕共享 和限时提供的 圣诞老人(Santa)模式 。这个功能远比想象的强大,它使得ChatGPT可以“睁眼看世界”了!实测,该功能基于 GPT-4o 这个强大的基座模型,语音和视频聊天时的问答质量相当有保证。同时基于 GPT-4o 的多模态能力,实现端到端的通话,即直接输入语音和输出语音,聊天的体验很丝滑顺畅,并支持随时打断。可以说有了这个功能,ChatGPT Plus套餐变得更值。

版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/395.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论