智谱AI开源了CogAgent,它是一个视觉语言模型,拥有180亿参数规模,该模型在GUI理解和导航方面表现出色,在多个基准测试上取得了SOTA的通用性能,CogAgent还支持OCR相关任务。
更新时间:2024-01-13 14:37:15