亚马逊的新模子来了。
当地时期周二的 re:invent 大会上,在上昼的 Keynote 门径,前亚马逊云科技(AWS)首席推行官、现任亚马逊公司 CEO 安迪 · 贾西(Andy Jassy)限时返场。在约莫 10 分钟的演讲里,贾西先容了亚马逊在生成式 AI 领域的应用进展,并发布了亚马逊的新一代基础模子—— Amazon Nova。
旧年 4 月,亚马逊推出了第一代大模子 Titan,唯有言语单一模态。如果说 Titan 仅仅小试牛刀,那今天的 Amazon Nova 系列模子,是亚马逊的真身手和大动作。到底作念文生文、文生图,照旧图生视频……对亚马逊来说,这个采纳不存在的。因为,Nova 系列主打 Any to Any,大肆模态输入、大肆模态输出。而况在 Benchmark 评测上,也均为 SOTA 大模子,险些可以击败通盘计议量级和商场定位的基础模子。
你可能要问,刚追加了 40 亿好意思元投资 Anthropic 终点 Claude,就发了自研的王炸 Nova。亚马逊奈何想的?尤其是奈何看待我方与模子生态伙伴的关连?

前亚马逊云科技(AWS)首席推行官、现任亚马逊公司 CEO 安迪 · 贾西(Andy Jassy)发布 Nova 系列基础模子。|图片来源:亚马逊云科技
安迪 · 贾西(Andy Jassy)自问自答这一问题,他默示,在亚马逊里面构建的 AI 应用中,使用模子的各样性令东谈主骇怪。征战者亦然这么,但愿有更低的延伸、更低的资本、具备微调能力、能更好地融合不同常识库以固定数据,还想要达成好多自动化融合操作(也便是所谓的智能行径),或者想要取得更好的图像和视频效果等等。为出奇志征战者各样性的需求,亚马逊云科技的模子计谋,便是赐与征战者尽可能多的自主采纳的权益。
「咱们一直齐在继承并吞个资历——持久不会出现一种器具能在某个领域一统天地的情况。就像数据库领域,10 年来,公共会使用各式各样的关连型数据库或者非关连型数据库。在分析领域亦然如斯,也曾公共认为 TensorFlow 会成为独一的 AI 框架,而一直强调会有好多不同框架出现,最终 PyTorch 成为了最受迎接的阿谁,模子方面一样呈现这么的情况。」
闪征战者可以按照我方守望的大肆搜检、组合应用模子,这是大模子时期,亚马逊的谜底。
01 Amazon Nova:资本更低,能力更强
会上,安迪 · 贾西公布了 Nova 系列的六种大模子,其中包括四种生成文本的基础模子,以及生成图像和视频的两种视觉内容生成模子。

当先是体量最轻的 Micro 模子,其属于「仅文本模子」,只相沿输入文本然后输出文本,这亦然 Nova 系列中反馈速率最快、性价比最高的模子。贾西称,在 Amazon 里面的征战者最心爱在许多不详任务中使用它。
贾西默示,在 11 个 Benchmark 测试中,Nova Mirco 的推崇与 Meta LLaMa 3.1 8B 相配以致更优,在 12 个 Benchmark 测试中与 Google Gemini 1.5 Flash-8B 比较推崇更优。该模子的反馈速率达到每秒 210 个 Tokens,相配妥当需要快速反馈的应用。
接下来三种相沿多模态输入,并输出文本内容的多模态模子。
其中 Lite 模子一样是一种低资本的多模态模子,可以快速处理图像、视频和文本输入,并输出文本内容。
贾西默示,在 19 项 Benchmark 测试中,Nova Lite 有 17 项推崇优于或等于 OpenAI 的 GPT-4o Mini;在 21 项基准中,有 17 项优于或等于 Google 的 Gemini 1.5 Flash-8B;在 12 项基准中,有 10 项优于或等于 Anthropic 的 Claude Haiku 3.5。此模子在视频、图表和文档理除名务上也有可以推崇推崇。
Pro 模子则是一种高性能多模态模子,可以针对多种任务提供最好的准确性、速率和资本组合。
在 20 项 Benchmark 测试中,Nova Pro 有 17 项优于或等于 OpenAI 的 GPT-4o;在 21 项 Benchmark 测试中,有 16 项优于或等于 Google 的 Gemini 1.5 Pro。
终末亦然最强的是,是 Nova Premier,该模子可以用于复杂推理任务,也可算作定制模子蒸馏的最好「西宾」。
贾西莫得给出 Premier 的跑分对比,但从先容中咱们不难臆度:该模子对标的是 OpenAI 9 月发布的 Orion 系列模子。
凭据贾西,Amazon Nova Micro、Lite 和 Pro 咫尺还是全面上市,而 Amazon Nova Premier 打算在 2025 年第一季度推出。
除了性能除外,贾西默示这些模子还有其他亮点,当先,它们的资本效益很高,相较于 Amazon Bedrock 中的其他优秀模子居品,能低廉约莫 75%。此外,它们的速率很快,在延伸方面推崇优异,是所能见到的速率较快的模子。
还是上市的模子不仅集成在 Amazon Bedrock 中,还与 Amazon Bedrock 里的通盘功能进行了深度整合。这意味着征战者可以对模子进行微调,或利用 Bedrock 的常识库、RAG 等对模子增强,或者利用 Bedrock 的蒸馏功能来将大模子的智能「转机到」更小的模子,从而提高效益并攻讦延伸。
除了四种生成文本的模子,贾西还预报了两个生成视觉内容的新模子。
当先是 Amazon Nova Canvas,这是一款着手进的图像生成模子,可以凭据文本或图像教唆生成专科级的图像。它还提供了一些简短功能,举例使用文本输入裁剪图像,以及谐和配色决议和布局的适度选项。该模子还内置了相沿安全和负牵扯 AI 使用的功能,包括水印功能(可追溯图像来源)和内容审核功能(放胆潜在无益内容的生成)等。
在第三方进行的东谈主类对比评估中,Amazon Nova Canvas 的推崇优于 OpenAI DALL-E 3 和 Stable Diffusion。底下是由 Amazon Nova Canvas 生成的一系列图片:




然后是 Amazon Nova Reel,这是一款着手进的视频生成模子,可通过文本和图像直快创建高质地视频,相配妥当告白、营销或培训内容创作。用户可以通过当然言语教唆适度视觉作风和节拍,包括镜头通顺、旋转和变焦。在第三方进行的东谈主类对比评估中,Amazon Nova Reel 生成的视频质地和一致性优于 Runway 的 Gen-3 Alpha。
与 Canvas 肖似,Nova Reel 也内置了安全和牵扯 AI 功能,包括水印和内容审核。咫尺相沿生成 6 秒的视频,将来几个月将膨大到最长 2 分钟的视频生成。
贾西还共享了 Nova 接下来的打算,当先是在来岁征战出上述模子的第二代版块。此外,还会在第一季度推出一个语音到语音的模子,并在来岁年中推出一个大肆(any)到大肆(any)的模子。也便是多模态输入到多模态输出的模子,这意味着用户可以输入文本、语音、图像或视频等多种样式的内容,并相应地输出文本、语音、图像或视频。
从 Titan 到 Nova,连发两个大模子的 亚马逊云科技,不免会有东谈主惦记与开阔大模子征战商配合的 亚马逊云科技 正在改变其模子计谋。
贾西领会意志到了,他在会上自问自答阐扬了 亚马逊云科技 的态度:
「未必公共会问,该怎样看待亚马逊云科技的模子计谋?毕竟咱们与开阔模子提供商有着长远的配合关连,同期我方也研发了一些模子。我想说的是,公共可以这么来看待:咱们一直以来的打算便是为公共提供采纳,旨在呈现最浅近且最优质的功能,这势必意味着会有各样化的采纳。」

亚马逊云科技首席推行官 Matt Garman 先容,在 Amazon Bedrock 上,征战者可以凭据自己需要采纳亚马逊或者大肆生态伙伴的模子。|图片来源:亚马逊云科技
02 全球最大的电商平台,用生成式 AI 干什么?
除了发布新的大模子,会上,安迪 · 贾西还可贵先容了亚马逊里面的 AI 应用案例。
算作全球最大的电商平台,也算作亚马逊云科技的「第一客户」,亚马逊在昔时一年尝试为多项业务引入 AI 提效,贬责用户濒临的问题。其中典型的场景如下:
零卖业务中取得更优质的推选以及个性化推选;
为践约中心的拣货员磋磨最好旅途,从而更快地把商品送到客户手上;
将其应用在咱们的 Prime Air 无东谈主机上,守望在将来几年内达成不到一小时就能为你送货上门;
Amazon Go 商店的 Just Walk Out 本领、为 Alexa 提供本领相沿;
提供 25 种以上的亚马逊云科技 AI 服务,方便征战者构建 AI 应用次序。
从亚马逊不雅察到的 AI 用例中,安迪认为,贬责问题的 AI 应用(「实用 AI」)有两种实用价值:降本增效,或者带来新体验。
「从全球范围来看,那些应用 AI 最为得胜的公司,主要体咫尺资本回避和出产力提高方面,而且好多公司在这两方面齐取得了进展。同期,你也初始看到一些富有再行构念念、重塑的全新客户体验。」
在这两类 AI 应用上,安迪给了亚马逊里面的典型使用场景:
降本增效的 AI
1)智能客服
以客户服务为例,亚马逊的零卖业务有着数亿客户,昔时当他们需要考虑客户服务时,可以考虑聊天机器东谈主,昔时这一聊天机器东谈主给与的静态决策树的机器学习本领,客户得输入大批翰墨能力获取谜底。
但生成式 AI 对这个系统进行了重构后,咫尺客户领有了一个懂他 / 她的客服机器东谈主。

比如,假如你几天前订购了一件商品,参加新的聊天机器东谈主界面时,它知谈你是谁、几天前订购了什么、住在那儿,而且它能通过模子预测到,如果在几天后考虑客服,好像率是参谋退货考虑问题。当你初始向它讲明情况时,它可以马上见知你最近的 Whole Foods 或者其他可退货的实体店位置。而况这个模子很智能,当察觉到用户对它给出的回话感到沮丧时,还能判断出用户可能需要考虑东谈主工客服来贬责问题。
在再行想象之前,这个聊天机器东谈主的客户泄气度就还是挺高了,但自从加入了生成式 AI 这个「聪惠大脑」后,客户泄气度提高了 500 个基点。
2)卖家工单填写
亚马逊在全球零卖店有约莫 200 万卖家,销售的商品中跳跃 60% 是由这群卖家提供的,但他们昔时在往网站上架居品时,需要填写一份很长的、包含好多字段的表单,从而让末端客户更简短地浏览并了解卖家的居品信息,这对卖家来说果真是个劳作的任务。

咫尺,亚马逊利用生成式 AI 打造了一款全新的器具,卖家只需输入几个字,或者拍张相片,又或者提供一个 URL,这个器具就能襄理填写好多居品属性信息,这对卖家来说直快多了,咫尺还是有跳跃 50 万卖家在使用这款生成式 AI 器具。
3)库存料理
亚马逊零卖业务中的库存料理亦然一个大场景,有跳跃 1000 个不同的建筑或节点,从而把合适的居品优化竖立到距离最终客户最近的履行中心或者建筑里,以此简约运载时期,更快、更低资腹地把商品送到你手中。但这也就意味着,要明晰某个履行中心的库存情况,比如每个商品的库存水平是若干、哪些商品正在被订购、订购的速率怎样、这个履行中心是否还有更多的仓储容量,以及是否需要将库存转机到其他履行中心来均衡通盘仓储鸠合等问题。

为此,亚马逊应用 Transformer 模子来贬责这些问题并进行预测,现时,一个对持久需求预测的 Transformer 模子还是将预测准确性提高了 10%,区域预测准确性也提高了跳跃 20%,在亚马逊数百亿好意思金的零卖业务界限下,两位数的服从提高意味着数以十亿好意思元狡计的资本简约。
4)机器东谈主
在机器东谈主场景上,亚马逊履行中心还是部署了跳跃 75 万台机器东谈主,一系列 AI 本领匡助机器东谈主场景优化了样式容量和传送能力,缩小处理时期以及为客户服务的资本。

以 Sparrow 为例,它是一款用于再行分类的机器东谈主手臂。它需要不休从开阔漫步区域网罗物品,并将它们聚集到容器里。有了生成式 AI 的大脑,可以告诉 Sparrow 第一个箱子里装了什么物品、要它去拿哪个物品,同期 Sparrow 得永别出每个物品具体是什么,还要明晰依据物品的大小、材质以及材质的柔韧性该怎样抓取,而况知谈能把物品扬弃在接受箱的哪个位置。
咫尺,亚马逊在路易斯安那州什里夫波特的践约中心推出了约莫五项全新的机器东谈主发明,还是看到处理时期提高了 25%,将来,服务资本展望也会攻讦 25%。
调动客户体验的 AI
上述这些齐是亚马逊里面在资本回避和出产力提高方面的实例,亚马逊也看到了生成式 AI 在创造全新购物体验方面的作用,贾西也列举了几个典型例子。
1)Rufus 购物智能体
第一个应用是,Rufus 购物智能体。
当客户不信服我方想要什么,正在纠结采纳时,可能会浏览商品分类、搜检客户评价等,但咫尺 Rufus 购物智能体带来了「真东谈主导购」的体验。
就像走进实体店,不信服我方想要什么时,向销售东谈主员描绘一下观念,他们便会推选可能妥当你的商品,延续问「这个奈何样,阿谁奈何样」,他们也能快速回话你。咫尺,Rufus 带来了肖似的体验。

借助 Rufus,你可以参加任何居品的可贵信息页面、建议任何问题,Rufus 齐会马上给出谜底。它能帮你对不同居品和类别进行比较,还会给出推选,你可以建议很平素的问题来获取推选,它也会进一步究诘一些具体问题,以便更准确田主持你的意图。比如,你对 Rufus 说:「嘿,我想要我之前一直买的那种高尔夫球杆,你能帮我找找吗?」Rufus 就能帮你找到。你如若说:「给我查查那些还没发货的商品订单景象。」它也能帮你查到。
Rufus 相对实体销售东谈主员有一个上风,那便是它不会跳槽去别的零卖商做事,也不会转行干别的,它会一直陪着你,更好地了解你的意图、有趣以及需求。
2)Alexa
亚马逊 2014 年推出的 Alexa 也迎来了新的大脑。
Alexa 的打算和做事是打造全球最优秀的个东谈主助理,跟着大型言语模子和生成式 AI 的出现,这个打算正在越来越近。Alexa 在亚马逊销售的通盘建造之间,有着 5 亿个活跃节点,东谈主们用它来文娱、购物、获取信息以及适度智能家居。

咫尺亚马逊正在使用多个基础模子对 Alexa 进行重构,不仅能让 Alexa 更好地回答你的问题,还能作念到一些当下很少有生成式 AI 应用次序能达成的事,那便是清楚并预测你的需求,以致能替你选择行径。贾西剧透将来几个月可以看到考虑服从。
3)Amazon Lens
亚马逊官网还上了一个新功能叫 Amazon Lens,假定你在一又友家看到一个很心爱的花盆,想知谈这个花盆是从哪儿买的,问一又友,一又友也不知谈。
未必你可以在搜索引擎里输入像「亚马逊、花盆、吊挂、编织」之类的关节词,也许能得到可以的谜底,但也可能一无所获。

但咫尺,你可以使用 Amazon Lens,只消拍下这个物品的相片就行。Amazon Lens 会应用狡计机视觉以及一个多模态模子,依据相片进行搜索查询,径直领导你找到亚马逊上对应的正确搜索扫尾,方便你直快购买。
4)尺寸推选
亚马逊还构建了一个尺寸推选的大言语模子,为网上购物带来了新体验。

比如买衬衫时,不信服这个品牌的尺码是偏大照旧偏小,也不明晰我方该选中号照旧大号。这时,尺寸推选的模子能分析开阔品牌之间的尺码关连,对比出哪些品牌尺码周边,哪些偏大或偏小,然后蚁合你之前购买过的商品情况,自动为你推选合适的尺码。
5)驻守警报
贾西还先容了在视频领域所作念的事,比如亚马逊和 NFL 配合的 Next Gen Stats 神气,每个赛季会网罗 5 亿个数据点,基于这些数据构建 AI 模子,打造了一个叫「驻守警报」的功能。

它能显闪现哪个驻守球员可能会冲向四分卫,还会在画面上圈出来,极地面改变了不雅众的不雅看体验;还打造了「驻守脆弱性」功能,能够为不雅众指出雄壮方应该重心报复的驻守薄弱区域,这些齐给球迷带来了不一样的不雅赛体验。
朝着降本增效、带来新体验的标的,这些是亚马逊里面正在使用 AI 贬责现实问题的场景。安迪 · 贾西默示开云体育,在亚马逊里面还是构建或者正在构建近 1000 个生成式 AI 应用次序。