视觉质量显著的原因 (视觉质量显著增强-多模态SVG生成模型StarVector)

文章编号:2398 更新时间:2024-01-10 分类:互联网资讯 阅读次数:

资讯内容

站长之家(ChinaZ.com12月21日消息: 该本文介绍了一种名为StarVector的多模态SVG生成模型。该模型有效地结合了代码生成大型语言模型(CodeLLM)和视觉模型,从而能够生成准确表示图像像素的不受限制的SVG。

视觉质量显著的原因视觉质量显著增强多模态

StarVector利用CLIP图像编码器从像素图像中提取视觉表示模块,然后通过适配器将其转换为视觉标记。这些视觉标记事先添加到SVG标记嵌入中,然后StarCoder模型使用下一个标记预测对序列进行建模,以有效地学习对齐标记和代码标记。

本文地址:https://arxiv.org/pdf/2312.11556.pdf

为了评估StarVector的性能,本文引入了SVG-Bench,这是一个综合基准,用于评估SVG方法在多个数据集和相关指标上的表现。在此基准测试中,引入了新颖的数据集,包括SVG-Stack训练集(真实世界SVG示例的大型数据集),并使用它来预测StarVector作为SVG的大型基础模型。

结果表明,与当前方法相比,StarVector在视觉质量和复杂性处理方面有显著增强,从而带来了SVG生成技术的显着进步。因此,StarVector为网页开发和图形设计领域带来了更多可能性。

(举报)

标签: StarVector

本文地址: https://yihaiquanyi.com/article/1dc80349689f302030e3.html

上一篇:高考测试成绩是B4是多少分高考测试成绩接近...
下一篇:重构12万行代码百度Apollo开放平台90发布...

发表评论