周三,Meta 发布了一个免费的独立 AI 图像生成器网站,“Imagine with元人工智能,”基于其 Emu 图像合成模型。 Meta 使用 11 亿张公开可见的 Facebook 和 Instagram 图片来训练 AI 模型,该模型可以根据书面提示呈现新颖的图像。此前,Meta 的该技术版本(使用相同的数据)仅在消息传递和 Instagram 等社交网络应用中可用。一个>如果您使用 Facebook 或 Instagram,您的照片(或您拍摄的照片)很可能有助于训练鸸鹋。在某种程度上,老话“如果你不花钱,你就是产品”。被赋予了全新的意义。尽管截至 2016 年,Instagram 用户每天上传超过 9500 万张照片,因此用于训练其 AI 模型的 Meta 数据集只是其人工智能模型的一小部分。由于 Meta 表示它只使用公开的照片进行训练,因此在 Instagram 或 Facebook 上将你的照片设置为私有应该会阻止它们包含在公司未来的 AI 模型训练中(当然,除非它改变了该政策)。用 Meta AI 想象一下类似于稳定扩散、DALL-E 3和中途,Imagine with Meta AI 根据 AI 模型“知道”的内容生成新图像。关于从训练数据中学到的视觉概念。使用新网站创建图像需要一个 Meta 帐户,该帐户可以从现有的 Facebook 或 Instagram 帐户导入。每一代都会创建四个 1280×1280 像素的图像,可以以 JPEG 格式保存。图像包括一个小的“用 AI 想象”的字样。左下角有水印徽标。“我们很高兴听到人们如何使用 Imagine(Meta AI 的文本到图像生成功能)在聊天中制作有趣且富有创意的内容,” Meta 在其新闻稿中表示。 “今日,我们正在扩大聊天之外的 Imagine 访问范围,在美国可以从 Imagine.meta.com 开始使用。这种为创意爱好者提供的独立体验让您可以使用我们的图像基础模型 Emu 的技术来创建图像。”我们使用我们的“带有 CRT 的野蛮人”模型对 Meta 的新 AI 图像生成器进行了一系列低风险的非正式测试。和“喝啤酒的猫”图像合成协议并发现了美学上新颖的结果,如您在上面所看到的。 (顺便说一句,当生成鸸鹋人物的图像时,我们注意到许多看起来像典型的 Instagram 时尚帖子。)

我们还尝试了对抗性测试。该生成器似乎过滤掉了大多数暴力、脏话、性话题以及名人和历史人物的名字(遗憾的是,没有亚伯拉罕·林肯),但它允许像 Elmo 这样的商业角色(是的,甚至“用刀”)和米老鼠(尽管不是用机枪)。

Meta 的模型通常可以很好地创建逼真的图像,但不如 Midjourney。它可以比 Stable Diffusion XL 更好地处理复杂的提示,但可能不如 DALL-E 3。它似乎根本不能很好地进行文本渲染,并且它可以处理不同的媒体输出,如水彩画、刺绣和钢笔- 和墨水的结果好坏参半。它的人物形象似乎包含了种族背景的多样性。总体而言,目前情况人工智能图像合成的水平似乎处于平均水平。那么,我们对 Emu(Meta 的新 AI 图像生成功能背后的 AI 模型)了解多少?根据 Meta 在 9 月份发布的研究论文,Emu 通过称为“质量调整”的过程获得了生成高质量图像的能力。 ;与使用大量图像-文本对训练的传统文本到图像模型不同,Emu 专注于“美学对齐”模型。预训练后,使用一组相对较小但视觉上吸引人的图像。

然而,Emu 的核心是前面提到的从 Facebook 和 Instagram 提取的包含 11 亿个文本-图像对的海量预训练数据集。在 Emu 研究论文中,Meta 没有具体说明训练数据的来源,但 Meta Connect 2023 会议的报告引用了 Meta 全球事务总裁 Nick Clegg 的话确认他们使用社交媒体帖子作为 AI 模型的训练数据,包括输入 Emu 的图像.

与其他人工智能公司相比,这是一种方法上的改变,因为 Meta 可以从其服务中访问大量图像和标题数据。其他图像合成模型使用从互联网非法抓取、商业库存图像库许可的图像< /span>,或两者的组合。有趣的是,Meta 关于 Emu 的研究论文是我们所见过的第1篇关于主要图像合成模型的论文,该模型并没有否认该模型创造现实扭曲的潜力虚假信息或潜在有害的内容。这感觉反映了人们普遍接受(或放弃)人工智能图像合成模型的现实,而这些模型现在变得越来越普遍。这是否是一件好事是一个悬而未决的问题。不过,Meta 似乎正在使用过滤器处理潜在有害输出的问题,这是一种提议的水印系统,尚未运行 (“在未来几周内,我们将通过 Meta AI 体验为图像添加隐形水印,以提高透明度和可追溯性,”该公司表示),并在网站底部有一个小的免责声明:“图像是和可能不准确或不适当。”

这些图像可能不准确(猫喝啤酒吗?),而且在用于训练模型的 11 亿张图像的未透露姓名的作者眼中,它们甚至可能不道德。但我们敢说:生成它们可以很有趣。当然,根据你的性格以及你如何看待人工智能图像合成的速度,这种乐趣可能会被同等程度的关注所抵消。原文链接;https://arstechnica.com/information-technology/2023/12/metas-new-ai-image-generator-was-trained-on-1-1-billion-instagram-and-facebook-photos/

发表评论