2025年12月12日,蚂蚁技术研究院发布LLaDA2.0系列离散扩散大语言模型,包含16B和100B两个版本,宣称是业内首个达100B参数规模的扩散语言模型。该模型采用创新的WSD持续预训练策略及CAP、扩散DPO等训练方法,继承自回归(AR)模型知识,实现2.1倍推理加速,在代码、数学等结构化生成任务上表现超越同级AR模型。模型权重与训练代码已开源至Huggingface。
原创文章,作者:梁志镅,如若转载,请注明出处:https://www.liangzhimei.com/806.html
相关推荐
-
知乎2025年度 AI 产品榜单揭晓,豆包位居榜首
近日,知乎正式发布了备受关注的 “2025年度 AI 产品榜单”。这一榜单经过了多轮筛选与系统化的加权计算,旨在汇聚广大用户的真实反馈与专业视角,成为一份反映市场趋势的权威报告。榜…
-
AI日报:字节发布Seed Prover1.5;MiniMax M2.1开源;通义开源语音交互大模型Fun-Audio-Chat-8B
1、字节跳动发布 Seed Prover1.5:推动形式化数学推理的新进展 字节跳动Seed团队推出的Seed Prover1.5在形式化数学推理领域取得重要突破,其通过Agent…
-
可灵2.1最强首尾帧上线 生成效果提升235%
8月22日,可灵AI正式推出基于2.1模型的全新首尾帧功能。该功能通过端到端多模态语义推理能力的升级,显著提升首尾帧功能视频生成效果。据评测数据显示,与此前1.6版本相比效果提升2…
-
豆包DAU突破1亿,字节AI战略再升级
2025年12月24日,据36氪报道,字节跳动旗下AI应用豆包的日均活跃用户(DAU)已突破1亿,成为字节又一“亿级DAU”产品。该数据经多方证实属实,且市场推广成本为历史最低。豆…
-
腾讯元宝:DeepSeek模式使用量较年初增长超100倍
快科技12月24日消息,今天,腾讯元宝发布的《元宝 x DeepSeek年度报告》。 报告显示,自今年2月接入DeepSeek模型以来,其DeepSeek模式使用量持续飙升,12月…
-
阿里上线“千问智学”,字节推“AnyGen”:AI 应用正式接管你的书包与办公桌
随着人工智能技术的深度演进,大厂正加速将 AI 能力具象化为垂直场景的终端应用。近日,阿里巴巴正式推出 AI 教育应用程序“千问智学”,而字节跳动则在海外市场低调上线了 AI 办公…
-
摩尔线程发布MTT AIBOOK笔记本:首发自研长江SoC!32GB+1TB售价9999元
摩尔线程在首届MUSA开发者大会上发布长江智能SoC,并推出基于该芯片的MTT AIBOOK笔记本电脑。产品已在京东预售,32GB+1TB配置售价9999元,将于2026年1月10…
-
Google与OpenAI绘图工具遭利用,可一键生成女性不雅深伪照片
近日,主流生成式AI工具的安全边界再次引发关注。据科技媒体报道,原本用于创意生产的Google Gemini以及OpenAI的ChatGPT正被部分用户恶意利用,通过特定的提示词绕…
-
阿里巴巴与荣耀深化战略合作,首次将全栈AI能力应用于AI手机
9月9日,阿里巴巴集团与荣耀宣布全面深化战略合作,合作覆盖AI云基础设施、AI模型、AI智能体(Agent)生态等多个领域,以及线上线下商业生态。这是阿里巴巴全栈AI技术能力首次整…
-
5年后将淘汰C语言 微软澄清:不会用AI重写Win11系统
快科技12月24日消息,日前一位微软工程师在个人页面宣布微软将在2030年删除所有C及C++语言编写的代码,用Rust取而代之。 这一表态引发了极大的关注与争议,微软偏好Rust这…
