阿里通义实验室近日推出全模态知识库RAG框架VimRAG,该框架创新性地采用动态有向无环图(DAG)替代传统线性上下文拼接方式,并融合分支试错机制、视觉能量分配策略以及图引导优化(GGPO)技术,成功实现跨文本、图像、视频等多模态数据的精准检索与关联推理。相关实验结果表明,在Qwen3-VL-8B模型上应用该框架后,准确率达到50.1%,性能显著优于传统方案。