【品牌公告】原“7牛AI PPT”已正式更名为“即触AI PPT”（jcppt.com），老用户权益与服务已同步顺延。

阿里通义实验室发布强化学习新框架EAPO 破解大模型长文本推理幻觉难题

2026-04-28 #AI新闻

阿里通义实验室近日推出全新强化学习框架Evidence-Augmented Policy Optimization（简称EAPO）。该框架创新性引入“证据奖励”机制，将监督环节从最终答案层面延伸至证据提取过程，有效解决大模型在长文本推理任务中“搜索到正确信息却给出错误答案”的幻觉问题。基于Qwen3-30B模型搭建的EAPO框架，在多项权威长文本基准测试中表现突出，性能反超GPT-OSS（120B参数）、Claude-Sonnet-4等大模型。

AI快讯

阿里通义实验室发布强化学习新框架EAPO 破解大模型长文本推理幻觉难题

相关推荐

腾讯视频发布工业级AI漫剧制作平台WorkRally

美团发布新一代万亿参数大模型LongCat-2.0并宣布开源

清华系初创企业「厘清智能」获数亿元种子轮融资

OpenAI 发布首款AI硬件产品：与Work Louder联名推出Codex定制键盘