精品项目

  • Home
  • 了解亚马逊广告如何利用亚马逊 SageMaker 创建生成式 AI 驱动的图像生成能力 机器学习博客

了解亚马逊广告如何利用亚马逊 SageMaker 创建生成式 AI 驱动的图像生成能力 机器学习博客

2026-01-27 12:18:34 8

亚马逊广告如何利用亚马逊SageMaker打造生成式AI图像生成能力

作者:Anita Lacea Cathy Willcock Christopher de Beer Burak Gozluklu Sravan Sripada Yashal Shakti Kanungo,于2024年5月15日发布于 亚马逊SageMaker,亚马逊SageMaker JumpStart,人工智能,生成式AI,市场与广告 持久链接

关键要点

亚马逊广告推出了一种生成式AI图像生成能力,帮助广告商快速创建生活方式图像以提升品牌故事。该解决方案利用亚马逊SageMaker进行模型开发和部署,简化了广告创意生成流程。广告商可以在没有技术或设计专业知识的情况下,自定义品牌图像,并创建丰富且相关的产品图像。

亚马逊广告帮助广告商和品牌实现其商业目标,开发创新解决方案,能够在消费者购买旅程的每个阶段触达数百万亚马逊客户。亚马逊广告一直相信,广告的有效性在于能够在消费者购买旅程中提供相关的广告。因此,亚马逊广告已利用近二十年的人工智能AI、应用科学和分析帮助客户驱动期望的业务成果。

在2023年3月的一项调查中,亚马逊广告发现,近75的广告商表示创建创意内容是他们面临的最大挑战之一。为了帮助广告商更顺畅地应对这一挑战,亚马逊广告推出了一种能够快速、轻松开发生活方式图像的图像生成能力,帮助广告商将品牌故事生动呈现。 这篇博客文章 介绍了亚马逊广告的生成式AI解决方案如何帮助品牌创造更具视觉吸引力的消费者体验。

在本博客中,我们描述了亚马逊广告如何在AWS上实现其生成式AI图像创建解决方案的架构和操作细节。在深入讨论解决方案之前,我们首先强调生成式AI如何为广告商创造创意体验。接下来,我们介绍了解决方案架构和机器学习ML模型构建、部署和推理的流程。最后,总结我们的经验教训。

广告商的创意体验

在构建广告创意时,广告商希望能够以与潜在受众相关的方式进行自定义。例如,广告商可能会拥有产品在白色背景下的静态图像。从广告商的角度来看,整个流程可以分为三个步骤:

使用生成式AI将仅包含产品的图像转换为丰富且相关的图像,该方法保留了原始产品特征,不需要技术专业知识。任何拥有亚马逊广告控制台访问权限的人都可以创建自定义品牌图像,无需技术或设计专业知识。广告商可以以不额外支付成本的方式创建多个相关且吸引人的产品图像。

图像生成解决方案的一个好处是基于产品选择自动创建相关产品图像,无需广告商提供额外输入。虽然可以选择可增强背景图像的选项,如提示、主题和自定义产品图像,但并非生成引人注目的创意所必需。如果广告商未提供此信息,模型将基于他们在 amazoncom 上的产品列表信息进行推断。

图 1 显示带有各种背景的水壶的图像生成解决方案示例。

解决方案概述

图 2 展示了推理和模型部署的简化解决方案架构。模型开发和部署的步骤以蓝色圆圈表示,并用罗马数字i,ii, iv标识,而推理步骤则用橙色表示,并用阿拉伯数字1 2 8标识。

飞鱼加速器下载

图 2 推理和模型部署的解决方案架构。

亚马逊SageMaker 是模型开发和部署的核心。团队利用 亚马逊SageMaker JumpStart 快速原型设计,进行迭代步骤 i。JumpStart 作为模型中心,提供了 大量基础模型,团队快速在候选模型上进行了基准测试。在选择了候选的大语言模型 (LLMs) 之后,科学团队可以通过添加更多自定义选项继续其余步骤。亚马逊广告的应用科学家使用 SageMaker Studio 作为与SageMaker进行互动的基于网络的界面步骤 ii。SageMaker具有适当的访问策略,可以查看一些中间模型结果,可用于进一步实验步骤 iii。

亚马逊广告团队通过人机协作流程大规模手动审查图像,确保应用程序提供高质量和负责任的图像。为此,团队使用SageMaker部署测试入口,并生成大量跨各种场景和条件的图像步骤 iv。在这里,亚马逊SageMaker Ground Truth使机器学习工程师能够轻松建立人机协作工作流程步骤 v。该工作流程允许亚马逊广告团队通过盲法A/B测试实验不同的基础模型和配置,以确保对生成图像的反馈没有偏见。在选择的模型准备投入生产后,模型使用团队自建的模型生命周期管理工具进行部署步骤 vi。在此过程中,该工具使用SageMaker 生成的工件步骤 vii,然后这些工件部署到生产的AWS帐户步骤 viii,使用 SageMaker SDKs。

在推理方面,现在使用亚马逊广告的客户可以获得一个新的API来接收这些生成的图像。亚马逊API网关 接收 PUT 请求步骤1。该请求随后通过 AWS Lambda 进行处理,AWS Lambda使用 AWS Step Functions 来协调该过程步骤2。产品图像从图像库中获取,该库是该创意功能之前存在的现有解决方案的一部分。接下来的步骤是处理客户文本提示并通过内容摄取限制定制图像。亚马逊Comprehend用于检测文本提示中的不良上下文,而亚马逊Rekognition处理图像以用于 内容审核步骤3。如果输入通过检查,则文本继续作为提示,而图像通过去除背景进行处理步骤4。然后,采用所部署的文本到图像模型,使用提示和处理后的图像生成图像步骤5。图像随后上传到亚马逊简单存储服务 (Amazon S3) 的图像存储桶中,图像的元数据被存储在 亚马逊DynamoDB 表 中步骤6。整个过程从步骤2开始都由AWS Step Functions协调。最后,Lambda函数接收图像和元数据步骤7,并将它们通过API网关发送给亚马逊广告客户服务步骤8。

结论

本文介绍了亚马逊广告的生成式AI图像生成解决方案的技术细节,广告商可以利用该解决方案在无需专门设计团队的情况下创建定制的品牌图像。广告商可以通过编写文本提示、选择不同主题、替换展示产品或从设备或资产库中上传新产品图像等一系列功能来生成和定制图像,使他们能够为产品广告创造出色的图像。

该架构采用了模块化微服务,分别处理模型开发、注册、模型生命周期管理该方案是基于联动和步骤功能的解决方案,以处理广告商输入、选择适当模型,以及在整个服务中跟踪作业,还有一个面向客户的API。在这里,亚马逊SageMaker是该解决方案的核心,从JumpStart开始,到最终的SageMaker部署。

如果你打算在亚马逊SageMaker上构建自己的生成式AI应用,最快的方法是通过 SageMaker JumpStart。观看这场presentation以了解如何使用JumpStart开始你的项目。

了解亚马逊广告如何利用亚马逊 SageMaker 创建生成式 AI 驱动的图像生成能力 机器学习博客

关于作者

Anita Lacea 是亚马逊生成式AI图像广告的单线程领导者,使广告商能够轻松打造视觉出色的广告。Anita结合了自己在硬件和软件行业的广泛专业知识与生成AI领域的最新创新,为客户开发高性能、费用优化的解决方案,彻底改变企业与其受众的连接方式。她热衷于传统视觉艺术,并是一位展出过的版画师。

Burak Gozluklu 是位于马萨诸塞州波士顿的首席AI/ML专家解决方案架构师。他帮助战略客户采用AWS技术,特别是生成式AI解决方案,以实现其商业目标。Burak在METU获得航空航天工程博士学位,在系统工程领域获得硕士学位,并在马萨诸塞州剑桥市的MIT获得系统动力学的博士后学位。Burak仍是MIT的研究合作人;他热衷于瑜伽和冥想。

Christopher de Beer 是亚马逊的高级软件开发工程师,位于英国爱丁堡。凭借视觉设计背景,他致力于为广告构建创意产品,专注于视频生成,帮助广告商通过视觉沟通吸引客户。他构建自动化创意制作的产品,使用传统及生成技术,以减少摩擦并令客户满意。工作之余,Christopher热衷于人机交互HCI和界面设计。

Yashal Shakti Kanungo是亚马逊广告的应用科学家III。他专注于生成基础模型,接受多种用户输入,并生成文本、图像和视频。这是一项研究与应用科学的结合,不断推动生成式AI的边界。多年来,他在在线广告领域研究并部署过多种模型,包括广告来源、点击预测、标题生成、图像生成等。

Sravan Sripada 是位于华盛顿州西雅图的高级应用科学家。他的主要关注点是开发生成式AI模型,使广告商能够以最低的努力创建引人入胜的广告创意图像、视频等。他曾致力于利用机器学习防止亚马逊商店平台的欺诈和滥用。不在工作时,他热衷于参与户外活动,并专注于冥想。

Cathy Willcock 是位于华盛顿州西雅图的首席技术业务发展经理。Cathy领导AWS技术账户团队,支持亚马逊广告采用AWS云技术。她的团队在亚马逊广告中跨越发现、测试、设计、分析和大规模部署AWS服务,特别专注于创新,以塑造AdTech和MarTech行业的格局。Cathy曾领导过工程、产品和市场团队,并发明了地对空呼叫1800RINGSKY。

加载评论

发表评论