新建拓扑提示该数据集正在被另一应用程序用户使用 (该数据集已用于构建盛行的人工智能图像生成器-钻研发现大型-数据集蕴含迫害儿童图像-包括-Stable-Diffusion-AI)

文章编号:3245 更新时间:2023-12-31 分类:互联网资讯 阅读次数:

资讯内容

站长之家(ChinaZ.com)12月21日信息: 新建拓扑提示该数据集正在被另一应用程序使 依据斯坦福互联网观察站周三颁布的一项新钻研,盛行的人工智能(AI)图像生成器的基础数据库中暗藏着数千张儿童性迫害图片(CSAM)。作为对这一钻研的回应,一些和最罕用的图像数据库的经营商封锁了对它们的访问权限。

斯坦福大学的这个监视团队与加拿大儿童包全中心以及其余反迫害慈善机构协作,在庞大的AI数据库LAION中发现了超越3200张涉嫌儿童性迫害的图片,并向执法部门报告了原始照片链接。其中1000多张涉嫌图片被确以为儿童性迫害资料。

钻研者们写道:「咱们发现即使在2023年晚些时刻,领有LAION-5B数据集也象征着领有数千张合法图片。」

对此,LAION在斯坦福互联网观察站报告颁布前夕做出了迅速反响,宣布临时撤下其数据集。LAION(代表非营利性的大规模人工智能开明网络)在一份申明中示意,「咱们对合法内容采取零容忍政策,出于审慎思考,咱们已撤下LAION数据集,以确保在从新颁布之前它们是安保的」。

虽然这些图片只占LAION约58亿张图片指数的一小局部,斯坦福团队示意,这或者影响AI工具生成有害输入的才干,并加剧对屡次发生的实践受益者的先前迫害

钻研人员示意,这些图片还使AI系统更容易生成虚伪儿童的真切和明白的图像,以及将社交媒体上齐全衣着衣服的实在青少年的照片转换为裸体照片,这让全环球的学校和执法部门感到震惊。直到最近,反迫害钻研人员以为,一些未经审核的AI工具发生迫害儿童的图像的模式是经过联合两类在线图片——成人色情和对孩子的有害照片。

斯坦福互联网观察站呐喊采取更为保守的措施。其中之一是要求一切基于LAION-5B(蕴含超越50亿张图像文本对)构建训练集的人「删除它们或与两边商协作清算资料」另一个措施是实践上让去年推出的StableDiffusion的旧版本从互联网上最光明的角落隐没

斯坦福互联网观察站的首席技术官DavidThiel示意:「合法平台可以中止提供它的下载,特意是假设它们常罕用于生成迫害图像并且没有阻止它们的保证措施。」

处置这个疑问并不容易,可以追溯到许多生成性AI名目「实践上被匆忙地推向市场」并且因为该畛域竞争强烈而宽泛可用,Thiel说。

将整个互联网的抓取数据集用于训练模型本应该限于钻研操作,假设有的话,而不是在没有更多严厉关注的状况下开源,」Thiel在接受采访时说。

影响LAION数据集开发的一个重要LAION用户是总部位于伦敦的初创公司StabilityAI,该公司制造了StableDiffusion文本到图像模型。依据斯坦福报告,StableDiffusion的新版本已大大降落了生成有害内容的或者性,但去年推出的旧版本(StabilityAI示意它没有颁布)依然嵌入到其余运行程序和工具中,并且依然是「生成明白图像的的模型」。

咱们不可撤回这一模型。这个模型曾经在许多人的本地机器上被人们所领有,」加拿大儿童包全中心信息技术主任LloydRichardson说。该中心经营着加拿大网络性盘剥揭发热线。

StabilityAI周三示意,它只托管过滤后的StableDiffusion版本,并且「自从接收StableDiffusion的开发以来,StabilityAI已采取踊跃措施来缩小滥用危险」。

「这些过滤器阻止了不安保内容抵达模型,」该公司在一份预备好的申明中说。「经过在内容抵达模型之前将其移除,咱们可以协助防止模型生成不安保内容。」

LAION本周示意,它开发了「严厉的过滤器」来检测和移除合法内容,而后才颁布其数据集,并仍在努力改良这些过滤器。斯坦福报告抵赖,LAION的开发者试图过滤掉「未成年」的露骨内容,但假设他们早些时刻与儿童安保专家协商,或者会做得更好。

许多文本到图像生成器都以某种模式从LAION数据库派生而来,虽然并不总是清楚是哪些生成器。Dall-E和ChatGPT的开发商OpenAI示意,它没有经常使用LAION,并对其模型启动了微调,以拒绝触及未成年人的色情内容的恳求。

Google基于LAION数据集构建了其文本到图像Imagen模型,但在2022年选择不地下颁布,要素是对数据库启动的审计「发现了少量不当内容,包括色情图像、种族主义唾骂和有害的社会刻板印象」

LAION的开创人是德国钻研员和老师ChristophSchuhmann,他往年早些时刻示意,地下提供如此庞大的视觉数据库的局部要素是为了确保AI开展的未来不受少数弱小公司的控制

(揭发)

标签: 文生图AI头条StableDiffusionAI数据集

本文地址: https://yihaiquanyi.com/article/0fc30dfddd8e3f85d6ab.html

上一篇:都是塑料感情的句子都是塑料感情网友称90%...
下一篇:利亚德lch利亚德斩获2023中国音视频产业两...

发表评论