微软发布了一款开源模型,该模型采用MIT许可证,是Phi-4系列中首个同时具备高分辨率视觉感知能力和选择性推理能力的小语言模型。该模型能够根据任务需求在“推理模式”和“非推理模式”之间自动切换,在进行数学推理时会启用多步思考链,而处理简单OCR任务时则直接输出结果以降低延迟。