1. 首页
  2. 公司简介 / 用户投稿

亚马逊云科技发布AI多模态大模型Amazon Nova,涵盖文本、图片、视频生成

金磊 来自 拉斯维加斯

量子比特 |公众号

刚刚,云计算龙头公司亚马逊云科技在大模型这件事上大放异彩——

亚马逊CEO Andy Jassy亲自上台发布了他的全新AI多模态系列大机型,名为Nova。

而且涵盖了文字对话、图像生成、视频生成,甚至直接透露了一个小目标:

未来,我们不仅要,还要Any-to-Any!

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

总体来说,Nova系列的所有型号都是按照功能和尺寸来划分的。

我们先来看看新版新锐基础款的“文字对话篇”,一共包含四种杯型:

现场,Andy还展示了Nova在CRAG、BFCL等方面的成绩。

从结果中不难看出,它在检索增强生成(RAG)、函数调用和代理应用中具有良好的性能。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

据悉,前三款已在亚马逊云技术“模型工厂”上架,该版本将于2025年第一季度推出。

目前,一些实际测试已经被泄露,比如 Nova Pro 的一句话:

用 100 字写一篇该文档。然后,建一棵树。

写一篇 100 字的摘要。然后,构建决策树。

点击一下,结果出来了:

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

再比如让Nova Pro理解下面的合并视频:

它给出的答案是:

该视频显示了海洋上的岩石海岸,然后是沙滩上的大片特写。

视频从海洋上的岩石海岸开始,然后过渡到海滩上一个大贝壳的特写。

接下来是“非文本生成篇”,一共包括两篇文章。

Nova,专注于图像生成。用官方的话来说,它已经达到了“State-of-the-art”(最先进)的水平:

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

至于视频生成模型,称为Nova Reel。给定一张图片和一句话,你可以让它动起来:

而安迪接下来的话,却让现场气氛变得不安起来。

刚才我们提到,安迪已经说过,Nova将会处于一切皆可生成的境地。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

值得细细品味的一点是,在生成式AI时代,亚马逊云科技此前发布的自研大型模型并不是最引人注目的。

虽然此前已经发布过泰坦的大模型,但形态仅限于文本,更多的精力集中在Q、Q等平台和应用上。

但这一次,亚马逊云技术一反常态,以厚积薄发全面覆盖主流形态,甚至说出“Any-toAny”以示野心。

为什么会这样呢?

纵观整个发布会,通过亚马逊云技术CEO Matt的全程介绍,答案或许可以概括为——

实力一直都有,但现在客户有了要求。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any__“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

△Matt首次以CEO身份参与re:

这应该如何理解呢?我们继续往下看。

算力再次升级,价格也非常美丽。

我们先看实力。

作为云计算领域的领导者,计算能力是亚马逊云技术的特色之一。

与传统云服务厂商不同,其自主研发和优化的专用芯片和数据中心,包括Nitro、Nitro等专有服务器主机,为实时计算提供支持。

此次基础设施的一系列更新,从芯片到服务器,可分为三大板块——

计算()、存储()和数据库()。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

在计算层面,亚马逊云技术率先宣布EC2 Trn2实例正式上线。

EC2 Trn2实例采用第二代芯片(),与上一代Trn1实例相比,性能显着提升。具体来说:

此外,Trn2 实例的成本效益比当前基于 GPU 的 EC2 P5e 和 P5en 实例高出 30-40%。

每个 Trn2 实例包含 16 个芯片、192 个 vCPU、2 TiB 内存和 3.2 Tbps (EFA) v3 网络带宽,与上一代相比,延迟降低高达 35%。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

为了应对更高的性能要求,亚马逊云技术还推出了Trn2。

这是一种新型超大规模计算产品,每个产品包含64个芯片,并通过高带宽、低延迟互连实现卓越的性能。

这使得 Trn2 非常适合训练超大规模的基础模型(例如生成式 AI、LLM 等)。

它是亚马逊云技术专有的网络互连技术。它可以将多个服务器组合成逻辑上的单个服务器,连接带宽高达2TB/s,延迟仅为1微秒。

其设计特别适合分布式深度学习任务,网络通信的优化有助于显着缩短训练时间并提高资源利用率。

用官方的话来说:

这正是训练具有数万亿参数的大规模人工智能模型所需的超级计算平台。它非常强大。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

现场,苹果也前来声援亚马逊。机器学习和人工智能高级总监 Dupin 表示:

苹果将​​使用亚马逊云技术的芯片。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any__“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

此外,在芯片层面,亚马逊云技术发布了AWS芯片的预览版,预计将于2025年正式推出。

据悉,它将采用3纳米工艺制造,提供两倍的计算能力,并提高40%的能源效率。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

在()之后是store()的更新。

我们都知道,在数据分析和大数据领域,处理和查询大规模数据集的能力至关重要。

然而,传统的数据查询方式在处理海量数据时往往会导致性能瓶颈和管理复杂性,影响公司数据驱动的决策能力。

为此,亚马逊云技术专门推出了S3。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

S3提供了专门针对表格数据设计的新存储方式,支持使用EMR、Spark等流行查询引擎轻松查询。

S3 的表存储桶是其第三种存储桶类型,与现有的通用存储桶和目录存储桶并列。将表存储桶视为用于存储具有不同模式的表的分析仓库。

与自管理表存储相比,S3 可以实现高达 3 倍的查询性能提升和每秒 10 倍的事务处理能力,同时提供完全托管服务的运行效率。

另外,元数据()也变得越来越重要。例如,手机里有很多照片。正是因为元数据用于存储数据,所以现在可以使用自然语言快速找到照片。

基于这样的需求,亚马逊云技术推出了S3的预览版。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

S3提供了一种自动化的、易于查询的元数据管理方法。这些元数据几乎实时更新,帮助用户组织、识别和使用S3数据进行业务分析、实时推理应用等。

它支持对象元数据,包括系统定义的详细信息(例如大小和对象来源)以及自定义元数据,允许用户使用标签向对象添加产品 SKU、交易 ID 或内容评级等信息。

这些元数据也存储在 S3 中。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

在计算和存储之后,还有基础设施的第三大部分——数据库()。

有趣的一点是,Matt在现场分享了一张“OR”或“AND”图,代表了企业在选择数据库时经常遇到的艰难抉择——跨区域一致性、高可用性、低延迟,往往只有3选2 。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

亚马逊云科技这次给出的答案是:可以。

这就是新的无服务器分布式数据库DSQL,旨在解决传统数据库的可扩展性和性能挑战。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

DSQL 将传统关系数据库的强一致性与 NoSQL 数据库的分布式可扩展性相结合,提供以下关键优势:

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

以上就是亚马逊云技术此次在基础设施方面的努力。

新的构建模块——推理

如果说基础设施的三大部分被视为三个构建块,那么亚马逊云技术在模型层和应用层添加了第四个构建块——()。

推理是生成式人工智能工作流程的核心,是指将经过训练的模型应用于新数据来预测、生成或推理。

马特在会议上强调:

推理在人工智能模型的应用中变得尤为重要,尤其是在处理大型语言模型等复杂模型时。推理需要极高的计算能力和低延迟响应。

作为亚马逊云技术在模型层的AI平台服务,它首先在推理方面与我们上述的基础设施保持同步。

换句话说,通过芯片提供的硬件推理优化,用户可以轻松访问这些资源。

而对于它本身来说,这一次也迎来了诸多能力的升级。

第一个是模型蒸馏(Model),它可以自动创建针对特定用例的蒸馏模型。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

主要通过从大型基础模型(教师模型)生成响应并使用这些响应来微调较小的基础模型(学生模型),实现知识转移,提高小型模型的准确性,同时减少延迟和成本。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

二是多智能体协作(multi-agent)。

在需要多个代理来处理复杂任务的场景中,管理这些代理变得具有挑战性,特别是随着任务复杂性的增加。

使用开源解决方案的开发人员可能会发现自己需要手动实现复杂的操作,例如代理编排、会话处理和内存管理。

这也是亚马逊云技术在互联网上开展多智能体协作的起点。具体特点如下:

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

最后,也是更重要的,是防止大语言模型幻觉导致事实错误的功能——自动推理检查(),这是 .

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any__“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

这一新的保障措施旨在确保法学硕士通过数学验证生成的答案的准确性,并防止幻觉引起的事实错误。

自动推理检查使用基于数学和逻辑的算法验证和推理过程来验证模型生成的信息,确保输出与已知事实一致,而不是基于虚构或不一致的数据。

与机器学习 (ML) 不同,自动推理提供有关系统行为的数学保证。

据悉,亚马逊云技术已在存储、网络、虚拟化、身份和密码学等关键服务领域使用了自动推理。例如,自动推理用于形式化验证密码实现的正确性并提高性能和开发速度。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

性能方面,还推出了低延迟优化推理,用户在使用最先进的大型模型的同时,也能享受到卓越的推理性能。

值得一提的是,Llama 405B和Llama 70B的低延迟优化版本在亚马逊云技术上展现出了超越其他云提供商的出色性能。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

还有应用层等更新

对于开发者和企业来说,亚马逊云技术在应用层的代表作就是Q。

针对越来越多企业寻求从本地数据中心迁移到云端所面临的痛点,亚马逊云技术在Q上推出了多项新功能。

其中比较引人注目的是.NET,它允许企业更快地将.NET应用程序迁移到AWS,同时还显着降低迁移成本。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

Q 为 .NET 应用程序提供了自动化迁移工具,可以识别应用程序中可能存在的不兼容问题,生成迁移计划,并自动调整源代码以确保顺利过渡到云。这种自动化迁移极大地提高了工作效率并减少了人为干预。

通过将应用程序迁移到 Linux,企业可以节省高昂的许可费用并降低 TCO(总拥有成本)。

Matt 指出,使用 Q 的企业可以节省高达 40% 的许可成本。

而且迁移速度比传统手动迁移快四倍,大大降低了系统迁移的停机时间和风险。

除了应用程序迁移之外,亚马逊云技术还推出了Q for功能,专为企业工作负载运行而设计。

通过这个工具,亚马逊云技术可以帮助企业将本地环境迁移到云平台。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

除了应用层之外,还有AI与分析相结合的产品——。

作为一个能够帮助企业加速AI应用的开发、训练和部署的数据科学平台,今天正式进入“下一代”。

新一代的核心是。

这是一个单一的数据和 AI 开发环境,集成了 EMR、AWS Glue、for (MWAA) 以及现有工具和功能。

其次,它可以统一S3数据湖、数据仓库以及第三方和联合数据源。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

亚马逊云技术的“AI脚步”

看完这篇re:的全部内容和能力,亚马逊云技术在生成式AI时代的发展路径其实已经比较清晰了——

从客户的真实业务需求出发。

以上内容的更新都是基于“客户的服务出现了哪些问题”,包括计算、存储、数据库方面的瓶颈,包括客户对模型的选择,包括应用迁移服务等。

_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

了解了其背后的务实逻辑后,就不难理解为什么亚马逊云技术选择在这个时间点发布一系列多模态大模型,或者说是出于客户需求。

这个需求具体来说就是客户对车型的选择。毕竟“没有一种模式能够主宰世界”,而且每种模式都有自己擅长的领域。

但亚马逊云技术所做的是利用其在基础设施、工具/模型和应用程序方面的深厚知识和实力,为客户提供额外的“快、好、经济”的选择。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any__“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

回顾亚马逊云技术诞生之初,这一点似乎从未改变过。

正如马特在会议上回忆的那样:

2006年亚马逊云技术推出时,初创公司是第一批用户,他们总是非常积极地采用新技术,并能够提供有价值的反馈。

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any_

这一反馈进一步推动了亚马逊云技术的发展,有助于了解如何更好地支持创业。

因此,Matt也在大会上宣布了一个重磅消息:

到2025年将为全球初创企业提供10亿美元的财务支持!

还有一件事

今年的re:总共有6万人参与,快来感受一下这份热情和这份感觉吧~

参考链接:

[1]

[2]

[3]

- 超过-

以上部分内容由“文心一言”整理拓展,转载请注明出处:https://www.2sg.net.cn//61599.html

联系我们

在线咨询:点击这里给我发消息

微信号:手机号码调用

工作日:9:30-18:30,节假日休息