视觉质量显著的原因 (视觉质量显著增强-多模态SVG生成模型StarVector)

文章编号：2398 更新时间：2024-01-10 分类：互联网资讯 阅读次数：次

站长之家（ChinaZ.com）12月21日消息: 该本文介绍了一种名为StarVector的多模态SVG生成模型。该模型有效地结合了代码生成大型语言模型（CodeLLM）和视觉模型，从而能够生成准确表示图像像素的不受限制的SVG。

StarVector利用CLIP图像编码器从像素图像中提取视觉表示模块，然后通过适配器将其转换为视觉标记。这些视觉标记事先添加到SVG标记嵌入中，然后StarCoder模型使用下一个标记预测对序列进行建模，以有效地学习对齐标记和代码标记。

本文地址:https://arxiv.org/pdf/2312.11556.pdf

为了评估StarVector的性能，本文引入了SVG-Bench，这是一个综合基准，用于评估SVG方法在多个数据集和相关指标上的表现。在此基准测试中，引入了新颖的数据集，包括SVG-Stack训练集（真实世界SVG示例的大型数据集），并使用它来预测StarVector作为SVG的大型基础模型。

结果表明，与当前方法相比，StarVector在视觉质量和复杂性处理方面有显著增强，从而带来了SVG生成技术的显着进步。因此，StarVector为网页开发和图形设计领域带来了更多可能性。

（举报）

标签： StarVector、

上一篇：高考测试成绩是B4是多少分高考测试成绩接近...
下一篇：重构12万行代码百度Apollo开放平台90发布...