AIWeekly12月2329日DeepSeekV3开源发布xAI完成60亿美元C轮融
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“ 外挂 ”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于 AI科普 , AI工具测评 , AI效率提升 , AI行业洞察 。关注我,AI之路不迷路,2024我们一起变强。
关于AI Weekly
马化腾 谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”
AI Weekly回来了!

“ AI Weekly ”是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。
省流版摘要
DeepSeek发布6710亿参数模型DeepSeek-V3 :DeepSeek宣布开源专家混合模型 DeepSeek-V3 ,具备6710亿参数,激活参数370亿,在算法代码和数学推理等领域表现媲美 GPT-4o 。
智谱开源智能体基座模型CogAgent-9B :智谱发布GLM-PC基座模型 CogAgent-9B ,支持屏幕截图任务预测,在多项数据集测试中表现优异,进一步提升了智能体任务能力。
阶跃星辰推出Step-1X-Medium模型 :阶跃星辰发布增强型AI图像模型 Step-1X-Medium ,生成速度提升30%,新增“图生图”功能,并强化了中国风内容创作能力。
阿里通义千问开源视觉推理模型QVQ-72B-Preview :阿里发布 QVQ-72B-Preview 视觉推理模型,在多模态任务和数学基准测试中表现出色,但仍需优化语言混合与递归推理能力。
马斯克xAI完成60亿美元C轮融资 :xAI获得60亿美元融资,估值超400亿美元,投资方包括英伟达、AMD及多家知名机构,资金将用于基础设施建设与AI技术研发。
AI编程助手Cursor融资1亿美元,估值飙升至26亿美元 :Cursor完成B轮融资,由Thrive Capital领投,估值从4月的4亿美元增至26亿美元,其AI工具被广泛应用于代码自动补全和重写任务。
1. DeepSeek发布671B参数开源模型DeepSeek-V3
本周最靓的仔必须是 DeepSeek 。
12月26日,AI初创公司DeepSeek宣布开源其最新专家混合(MoE)模型 DeepSeek-V3 。该模型拥有671B(6710亿)参数,激活参数为37B(370亿),并在14.8万亿个token上进行了预训练。

DeepSeek-V3 在算法代码、数学推理等领域的表现超越了多个现有开源模型,性能可媲美 GPT-4o 和 Claude-3.5-Sonnet 等顶尖闭源模型。同时,该模型支持原生FP8权重开源,并提供BF16转换脚本,方便开发者进行适配和应用。
2. 智谱开源GLM-PC基座模型CogAgent-9B
智谱AI于12月26日宣布开源其GLM-PC基座模型 CogAgent-9B-20241220 。该模型基于 GLM-4V-9B 训练,专为智能体(Agent)任务设计。 CogAgent-9B 仅需屏幕截图作为输入(无需HTML等文本表征),即可根据用户指定的任务,结合历史操作,预测下一步的GUI操作。

与2023年12月开源的第一版CogAgent模型相比, CogAgent-9B 在GUI感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均有提升,并支持中英文双语的屏幕截图和语言交互。在Screenspot、OmniAct、CogAgentBench-basic-cn和OSWorld等数据集上的测试结果显示,CogAgent-9B在多个数据集上取得了领先的成绩。
3. 阶跃星辰发布Step-1X-Medium模型
12月25日,阶跃星辰宣布推出增强型AI图像模型 Step-1X-Medium 。该模型基于MMDit架构,生成速度提升超过30%,并通过针对性训练,增强了对用户指令的理解能力和图文一致性,生成的画面细节更加自然。

此外, Step-1X-Medium 新增了“图生图”功能,允许用户上传基础图片,并通过简单的指令对原图进行细节增强、风格迁移或局部修改。该模型还对中国风内容的创作能力进行了升级,能够更好地捕捉东方面孔的神韵,呈现高级、细腻的画面质感。
4. 阿里通义千问开源视觉推理模型QVQ-72B-Preview
12月25日,阿里巴巴通义千问团队发布了 QVQ-72B-Preview ,这是一个基于 Qwen2-VL-72B 构建的开源多模态推理模型,旨在提升AI在视觉理解和复杂问题解决方面的能力。

在多项评测中, QVQ-72B-Preview 表现出色:在MMMU评测中取得了70.3的高分,超越了 Qwen2-VL-72B-Instruct ;在MathVista等数学相关基准测试中也有显著提升。尽管如此,团队指出模型仍存在语言混合与切换、递归推理等局限性,需进一步优化。
5. xAI完成60亿美元C轮融资,估值超400亿美元
埃隆·马斯克创立的人工智能公司xAI宣布完成60亿美元的C轮融资,估值从半年前的240亿美元跃升至超过400亿美元。本轮融资吸引了包括A16Z、贝莱德、富达管理与研究公司、红杉资本、摩根士丹利等知名投资机构,以及GPU巨头英伟达和AMD在内的多方参与。

xAI表示,此次融资将用于加速先进基础设施建设,推出面向数十亿用户的突破性产品,并推进未来技术的研发。公司计划通过这笔资金进一步提升其AI模型能力,强化竞争优势,并实现“探索宇宙真实本质”的使命。
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/382.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论