昊梵体育网

机器之心的文章

CVPR | LoRA遇上RoPE!WaDi:面向单步图像生成的权重方向感知蒸馏

CVPR | LoRA遇上RoPE!WaDi:面向单步图像生成的权重方向感知蒸馏

CVPR | LoRA遇上RoPE!WaDi:面向单步图像生成的权重方向感知蒸馏
刚刚,智元拿下WorldArena世界模型总分冠军!

刚刚,智元拿下WorldArena世界模型总分冠军!

刚刚,智元拿下WorldArena世界模型总分冠军!
DiffusionOPD:复旦联合通义万相提出扩散模型在线策略蒸馏新范式

DiffusionOPD:复旦联合通义万相提出扩散模型在线策略蒸馏新范式

DiffusionOPD:复旦联合通义万相提出扩散模型在线策略蒸馏新范式
阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型

阶跃发布Step 3.7 Flash:一款为「烧钱时代」准备的Agent模型
超越TurboQuant,长上下文推理的真2-bit KV Quantization算法问世

超越TurboQuant,长上下文推理的真2-bit KV Quantization算法问世

超越TurboQuant,长上下文推理的真2-bit KV Quantization算法问世
消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库
「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题

「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题

「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
Claude Opus 4.8问世,Anthropic估值暴涨至9650亿美元

Claude Opus 4.8问世,Anthropic估值暴涨至9650亿美元

Claude Opus 4.8问世,Anthropic估值暴涨至9650亿美元
千寻智能高阳团队提出Legato,入选RSS 2026

千寻智能高阳团队提出Legato,入选RSS 2026

千寻智能高阳团队提出Legato,入选RSS 2026
Google新数据集首次大规模捕捉用户「未言明的想法」

Google新数据集首次大规模捕捉用户「未言明的想法」

Google新数据集首次大规模捕捉用户「未言明的想法」
谷歌AI不认识Google

谷歌AI不认识Google

谷歌AI不认识Google
国产超算生成式压缩模型训练性能突破2.16 EFLOP/s

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s
别在CVPR独自社恐!来丹佛AI Talent Meetup,聊你听得懂的技术与理想

别在CVPR独自社恐!来丹佛AI Talent Meetup,聊你听得懂的技术与理想

别在CVPR独自社恐!来丹佛AI Talent Meetup,聊你听得懂的技术与理想
全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!