小红书推出并开源端到端文档识别模型FireRed-OCR

2026-03-03 #AI新闻

小红书团队近期发布并开源了一款端到端文档识别模型FireRed-OCR。该模型基于Qwen3-VL架构打造，创新采用了“三阶段渐进优化”策略与“几何+语义”数据工厂，有效解决了通用视觉语言模型（VLM）在处理复杂文档时存在的“结构性幻觉”问题。在权威评测OmniDocBench v1.5中，FireRed-OCR在端到端方案中斩获SOTA（ state-of-the-art，最先进）成绩，综合评分达92.9%，领先于Gemini-3.0 Pro等同类模型。

AI快讯

小红书推出并开源端到端文档识别模型FireRed-OCR

相关推荐

腾讯QClaw海外版启动内测覆盖多国支持远程操控

月之暗面发布开源模型Kimi K2.6，代码与Agent集群能力实现全面升级

阿里通义发布端到端语音识别大模型Fun-ASR1.5

阿里通义千问发布下一代旗舰模型Qwen3.6-Max-Preview早期预览版