在被AI重塑的时代里,企业需要用怎样的技术连接未来?
作者: 刘沙
责任编辑: 刘沙
来源: 电脑商情在线
时间: 2024-06-07 18:48
某生成式AI初创公司宣布有望实现8亿5千万美元年营业额
某公司刚刚发布了建立生成式AI团队的计划
生成式AI如何提升供应链?
生成式AI会对软件工程和职业发展带来哪些影响?
……
近两年,关于生成式AI的新闻话题一直不绝于耳,毫不夸张的说,我们已经进入了AI时代,企业必须要考虑如何用技术更好的使用和支持生成式AI应用。
因为,作为架构师、工程师,或者任何一个有技术信仰的构建者,你的每一行代码,你的每一种选择,你的每一个决定,都是写给未来的信。
三层技术栈支撑生成式AI应用
近日,亚马逊云科技大中华区产品总经理陈晓建在2024年度亚马逊云科技中国峰会上详细介绍了生成式AI的三层技术栈,以及亚马逊云科技相应的技术方案。

- 底层:
底层是以GPU和自研芯片为代表的基础设施,用于基础模型的训练和在生产环境中运行推理。由于训练和推理工作负载会消耗大量算力,企业需要在专门构建的、高性价比的芯片和计算实例去运行训练和推理工作负载。
其中,GPU是运行生成式AI的关键因素,但不是全部,现在的模型规模需要分布式调度和相应的存储、网络性能。算法工程师会通过分布式训练技术,同时使用数千张甚至上万张的 GPU卡来训练基础模型,而GPU 实例之间要传递大量数据,并定期保存,需要更高的带宽来降低通信延迟,提高GPU利用率。Amazon UltraCluster 提供了超大规模,超高带宽以及超高稳定的高性能计算集群,FSx for Lustre和S3 则提供了高性能的存储方案。
为了建造目前世界上最快的GPU超级集群,英伟达与亚马逊云科技一起创立了Project Ceiba。它搭载超过2万个英伟达最新的Grace架构Blackwell 200 超级芯片和第四代 EFA 网络,每个超级芯片可提供800 Gbps网络带宽,AI算力将达到惊人的 414 exaflops。
陈晓建还宣布,亚马逊云科技中国区域正式推出基于英伟达A10G GPU 的Amazon EC2 G5 实例,为中国区客户运行生成式AI工作负载提供更好的性价比。
在自研芯片方面,与基于英伟达GPU的Amazon EC2实例相比,基于Amazon Trainium的Trn1 EC2实例和基于Amazon Inferentia芯片的Inf2 EC2实例可以分别将训练成本降低50%(Trn1),推理成本降低40%(Inf2),同时提升深度学习推理和训练的能效。
Amazon SageMaker托管机器学习服务也是关键的底层,可以让开发人员轻松构建、训练、微调和部署基础模型。自动模型微调、分布式训练、灵活的模型部署选项、机器学习操作工具和面向负责任的AI等创新性功能可以帮助客户更快创新。
- 中间层:
中间层是以Amazon Bedrock为代表的,提供可以访问所需基础模型,以及构建和扩展生成式 AI 应用程序的工具。
陈晓建表示,Amazon Bedrock是使用基础模型构建和扩展生成式AI应用程序的最简单方式,它可以提供模型选择、模型定制、应用集成和负责任AI四大差异化价值,让生成式AI触手可及。
在模型选择方面,由于Amazon Bedrock是全面托管的服务,用户可以通过单一API访问来自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI和亚马逊等领先人工智能公司的高性能基础模型。
在模型定制方面,通过自定义模型导入功能Custom Model Import for Amazon Bedrock:企业可以将基于Llama, Mistral和Flan-T5开发的定制模型导入 Bedrock中,以完全托管的API方式访问。模型评估功能Model Evaluation for Amazon Bedrock则可以简化评估、比较和选择基础模型的过程,帮助客户找到最适合的模型。
在应用集成方面,通过一站式生成式AI应用开发工作站Amazon Bedrock Studio,开发者可以快速访问和使用多种基础模型、以及Bedrock 知识库、Bedrock Agents、Bedrock Guardrails 等 Amazon Bedrock 内置服务和工具,加快构建生成式 AI 应用的速度。
在负责任AI方面,亚马逊云科技承诺以负责任的方式构建服务,同时重点考虑公平和偏见、稳定性、可解释性、治理、透明度、隐私和安全性等6大方面。
陈晓建指出,以安全、可信和负责任的方式部署生成式AI是亚马逊云科技在生成式AI领域的“最高行动纲领”。
- 顶层:
顶层是以Amazon Q为代表的,利用基础模型构建的开箱即用的生成式AI应用程序,用户无需任何专业知识即可快速上手生成式 AI。
亚马逊云科技在本次峰会上宣布Amazon Q Developer、Amazon Q Business 和 Amazon Q in QuickSight均已正式可用。其中Amazon Q Developer可以协助开发人员完成从编码、测试、升级应用到故障排查、安全扫描和修复、优化云资源等繁琐重复的工作,让开发者把更多时间用于创新体验的开发,加快应用部署速度。Amazon Q Business则可以用于统一的对话检索式体验、生成总结与提炼关键发现、提升内容创作的效率,以及简化任务流程四大应用场景。据悉,截止到6月30号,Amazon Q Developer和Amazon Q Business均可以免费试用。
陈晓建表示,“今天是成为构建者的绝佳时机,我们有幸处在下一个技术变革的伟大时代。我们每个人的创新都将对世界产生深远影响,改变行业,甚至改变人类的生活。因此,当您了解到亚马逊云科技的工具、产品、解决方案和合作伙伴后,我想你们会知道如何利用好这些技术来开发应用程序。”
三大主题需求推动技术架构演进
亚马逊云科技大中华区解决方案架构总经理代闻在会上分享了技术架构演进的规律。代闻强调,在生成式AI时代,技术架构演进既要关注什么是变的,积极主动的拥抱、应用这项变革性技术,也要关注什么是不变的,以锚定不变的原则,在技术变革的浪潮中找到前进的灯塔方向。

据介绍,在技术架构演进过程中有三个不变的主题需求:基础组件能力、架构体系创新,以及多元技术融合:
云计算的基础组件是计算、存储和网络,其中计算是最核心的组件。2017年,亚马逊云科技对外宣布了 Nitro虚拟化平台,将安全、管理和监控卸载到硬件上,将主机算力近乎100%地提供给客户,并进一步加强了虚拟化安全,还实现了虚拟化平台和服务器选择的解耦,使底层的虚拟化技术创新和上层的服务器种类发展可以并行展开。
而这也是Amazon EC2发展的拐点,从2006年到2017年,亚马逊云科技用11年时间将一种EC2做到了70种;而从2017年到2023年,EC2的数量种类从70种发展到了750种,能为所有的负载提供合适的计算实例。
如今,亚马逊云科技已经发布了五代Nitro芯片,持续在网络性能、存储性能和安全方面加固,获得了更低的延迟和更高的吞吐量,每秒可处理更多数据包。
架构体系创新拓展的核心能力包括韧性、弹性与效率两个方面。
代闻表示,技术架构与桥梁类似,都需要处理天灾和人祸两种风险,如何应对不可控制的外部风险和管理不善造成的内部风险,是技术架构韧性要解决的主要挑战。
Amazon IAM能够提供高可靠的访问控制服务,它被设计为控制平面和数据平面两个部分,左边的控制平面接受权限更改的请求后,会下发策略信息给右边各区域的数据平面,数据平面独立存在于每个区域,区域中的每个云服务都直接与Amazon IAM数据平面交互,由其处理区域内所有访问控制请求。基于多区域的控制面与数据面的隔离,以及区域内的单元架构,Amazon IAM实现了全球高可靠架构。现在,Amazon IAM每秒可处理超过十亿次调用,是高韧性的安全基石。
弹性与效率则体现在Firecracker、Amazon Lambda SnapStart、Caspian三个解决方案中。
代闻指出,Serverless不仅是产品,更是一种构建方式。2014年Amazon Lambda开始在Serverless领域创新,但是效率低下,无法实现精细的资源管理,因此亚马逊云科技推出了轻量级虚拟化技术Firecracker,它能够快速启动和管理容器化工作负载,提升资源效率和安全性;Amazon Lambda SnapStart可以改善Java函数的冷启动问题,提升10倍冷启动速度;Caspian则融合了虚拟化管理、热管理计划的系统,针对数据库引擎完成了特性改写,实现了类似“多库同宿主,允许共享预留”的逻辑。
谈到多元技术融合时,代闻表示,现代应用的多元化需求包括对生成式AI的智能体验、可持续发展、合规等等,当众多需求都摆在面前时,应用架构必须打开思路,进行创新。多元的需求要用多元的技术各个击破,为此亚马逊云科技专门构建了各种数据服务,包括关系型数据库、非关系型数据库、数据仓库,以及各种批式/流式的数据采集和分析服务。
为了帮助企业在不同服务之间迁移或转换数据的工作,本次峰会上还更新发布了三款Zero-ETL,包括Amazon Aurora Zero-ETL with Amazon Redshift、Amazon OpenSearch Service zero-ETL integration with Amazon S3和Amazon DocumentDB zero-ETL integration with Amazon OpenSearch。通过这些Zero-ETL,企业能够将Amazon Aurora,Amazon Dynamo DB等关系型和非关系型实时数据自动同步到Amazon Redshift数据仓库进行分析,或将Amazon DocumentDB、Amazon DynamoDB等非关系型数据自动ETL到Amazon OpenSearch进行高级检索。
代闻指出,整体应用架构是多元技术均衡的结果,需要考虑成本、合规、扩展性、可持续发展、韧性、安全、性能、访问可达性、可用性等多种因素。架构师的工作就是在不同场景下,对不同需求,进行一系列的折中、取舍、持续优化。
据悉,目前亚马逊云科技的优良架构体系已经超过十年,从卓越运营、安全、可靠、性能效率四个维度演进到了六个维度,新增了可持续发展和成本优化。
“没有一个架构是十全十美的。受技术发展影响,一个良好的架构应该随着多元因素的影响不断演进。我们应该看清变化的技术和不变的需求,积极推进架构演进,连接未来的想象。”代闻总结道,“过去十年,云计算为创新和创业提供了前所未有的便利,未来十年,生成式AI让我们有机会一起重塑各行各业,想想10年后回首现在的自己,在这个特殊的时间点,What Will You Build?”
