2025年12月12日,蚂蚁技术研究院发布LLaDA2.0系列离散扩散大语言模型,包含16B和100B两个版本,宣称是业内首个达100B参数规模的扩散语言模型。该模型采用创新的WSD持续预训练策略及CAP、扩散DPO等训练方法,继承自回归(AR)模型知识,实现2.1倍推理加速,在代码、数学等结构化生成任务上表现超越同级AR模型。模型权重与训练代码已开源至Huggingface。
原创文章,作者:梁志镅,如若转载,请注明出处:https://www.liangzhimei.com/806.html
相关推荐
-
阿里通义开源语音交互大模型Fun-Audio-Chat-8B!超低延迟,能读懂情绪
阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理…
-
Runway发布GWM-1世界模型并拓展新领域
2025年12月12日,AI公司Runway发布GWM-1“世界模型”系列,宣称可保持数分钟画面连贯性,并具备物理规律模拟能力。该模型由三个后训练模型组成,旨在为机器人、物理及生命…
-
AI日报:字节发布Seed Prover1.5;MiniMax M2.1开源;通义开源语音交互大模型Fun-Audio-Chat-8B
1、字节跳动发布 Seed Prover1.5:推动形式化数学推理的新进展 字节跳动Seed团队推出的Seed Prover1.5在形式化数学推理领域取得重要突破,其通过Agent…
-
摩尔线程发布MTT AIBOOK笔记本:首发自研长江SoC!32GB+1TB售价9999元
摩尔线程在首届MUSA开发者大会上发布长江智能SoC,并推出基于该芯片的MTT AIBOOK笔记本电脑。产品已在京东预售,32GB+1TB配置售价9999元,将于2026年1月10…
-
OPPO推AI妙听:文章转双人播客
2025年12月,OPPO ColorOS将上线“AI妙听”功能,可将文字内容一键转化为双人播客。该功能不仅实现文本转语音,还重构内容并加入背景音乐,以更自然的对话形式呈现。据Co…
-
Vidu推出Vidu Q1参考生图功能,可支持7张参考图输入
据报道,马斯克在社交平台回应网友关于特斯拉将开始自己生产变压器的提问时,给予了肯定回答。(第一财经) 相亲找对象微信搜索“寻爱相亲网” 也可以加微信:yunanxqw
-
5年后将淘汰C语言 微软澄清:不会用AI重写Win11系统
快科技12月24日消息,日前一位微软工程师在个人页面宣布微软将在2030年删除所有C及C++语言编写的代码,用Rust取而代之。 这一表态引发了极大的关注与争议,微软偏好Rust这…
-
阿里上线“千问智学”,字节推“AnyGen”:AI 应用正式接管你的书包与办公桌
随着人工智能技术的深度演进,大厂正加速将 AI 能力具象化为垂直场景的终端应用。近日,阿里巴巴正式推出 AI 教育应用程序“千问智学”,而字节跳动则在海外市场低调上线了 AI 办公…
-
全国首个规划资源大模型“云宇星空”发布!6000亿参数,让城市规划“问不倒、调图快、识图准”
城市治理迈入“AI原生”时代。 12 月 24 日,上海市规划和自然资源局联合商汤科技“大装置”正式发布全国规划资源领域首个基础大模型——“云宇星空大模型(专业版)。该模型以 60…
-
豆包DAU突破1亿,字节AI战略再升级
2025年12月24日,据36氪报道,字节跳动旗下AI应用豆包的日均活跃用户(DAU)已突破1亿,成为字节又一“亿级DAU”产品。该数据经多方证实属实,且市场推广成本为历史最低。豆…
