通义实验室正式推出文生图评测基准Qwen-Image-Bench,该基准涵盖56个细粒度创作考点,并配备开源自动化评估模型Q-Judger。此基准由专业艺术家团队参与开发,覆盖世界知识、创作推理、文字渲染、影像叙事、游戏设计等真实创作场景,有效填补了基础生成与专业创作之间的评测鸿沟。
通义实验室正式推出文生图评测基准Qwen-Image-Bench,该基准涵盖56个细粒度创作考点,并配备开源自动化评估模型Q-Judger。此基准由专业艺术家团队参与开发,覆盖世界知识、创作推理、文字渲染、影像叙事、游戏设计等真实创作场景,有效填补了基础生成与专业创作之间的评测鸿沟。