数据与智能>业界新闻

生成式AI风口已至,看亚马逊云科技如何助力AI普惠?

作者:刘沙   责任编辑:刘沙 2023-10-30 21:28:52
来源:电脑商情在线关键字:生成式AI,亚马逊云科技,AI,

生成式AI的风口已经到来,你准备好了吗?

IDC的最新报告显示,全球企业在2023年的投资额为160亿美元,得益于AI风口,行业相关支出每年将平均增长73.3%,到2027年企业将在生成式AI解决方案上支出1430亿美元。

Gartner也预测,到2026年,超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用。

随着大数据量的激增,机器学习技术的快速迭代,算力的高度扩展,生成式AI已经以一股燎原之势点燃了全球企业的热情。很多企业都开始思考如何借助生成式AI技术创新业务,快速赢得竞争优势。

那么,企业怎样才能抓住生成式AI带来的机遇呢?

近日,在亚马逊云科技召开的生成式AI构建者大会上,亚马逊云科技大中华区产品部总经理陈晓建分享了亚马逊云科技会如何为企业和开发者助力,让AI实现普惠。

陈晓建指出,"今天,当我们谈论生成式AI时,大多数人都在谈论基础模型。而生成式AI应用就像是浮在海中的冰山,海面上方的冰山一角就像是基础模型,但在冰山底部,还需要大量基础模型以外的服务来支撑,如加速芯片、数据库、数据分析、数据安全服务等等。"因此,亚马逊云科技将会围绕应用场景、工具和基础设施、数据基座、AI原生应用构建和生成式AI服务五个方面来释放生成式AI的潜力,满足客户的需求。

第一是选择合适的应用场景,从典型场景入手创新业务模式

麦肯锡咨询发布的生成式AI生产力前沿技术报告显示,在生成式AI技术带来的经济效益中,有3/4来自营销与销售、产品与研发、软件工程和客户运营。亚马逊云科技认为,这些典型的应用场景将给企业带来三大业务价值:增强客户体验,提升员工生产力与创造力,优化业务流程。

以Salesforce为例,Salesforce为自己的Data Cloud构建了生成式AI解决方案,以帮助客户提升实时见解和预测能力。为此,Salesforce将Amazon Bedrock和Amazon Titan集成到自己的生成式AI产品中,使客户能够在Salesforce Data Cloud上轻松安全地使用数据,构建属于他们自己的生成式AI应用。

还有海尔创新设计中心,他们与亚马逊云科技合作,利用生成式AI实现了文生图、图生图、定量图和全场景图,这样的自动化设计系统应用使相关业务的操作周期缩短了20%。

第二是借助专门构建的生成式AI工具和基础设施,快速构建高性价比的生成式AI应用

亚马逊云科技CEO Adam Selipsky认为,没有一个基础模型可以适用于所有业务场景。用户应该根据自己的场景去选择最适合自己的基础模型。为此,亚马逊云科技推出了Amazon Bedrock和Amazon SageMaker JumpStart两项服务,帮助客户安全、便捷地选择最适合自己的基础模型。

其中,Amazon Bedrock是企业使用基础模型构建和扩展生成式AI应用程序的最简单方法,它提供了广泛的模型选择、数据隐私,能够自定义模型,而且它是一项无服务器服务,客户无需管理任何基础设施。该服务提供的基础模型来自Meta、 Anthropic、Stability AI、AI21 Labs、Cohere等第三方领先提供商和亚马逊云科技自研的Amazon Titan模型。

由于单独的基础模型无法完成需要与外部系统交互且没有最新知识来源的复杂任务,所以Amazon Bedrock还提供了无需编写代码就可以实现的托管代理Amazon Bedrock Agent,使开发人员能够轻松创建基于生成式AI的应用程序,完成各种用例的复杂任务,并根据专有知识源提供最新答案。

Amazon SageMaker JumpStart 则需要客户管理应用程序架构中的模型部署、配置和托管,但同时客户也拥有更大的灵活度和自由度对基础模型进行定制,客户可以从其中选择开源的基础模型,然后根据自身需求进行全量微调或轻量微调,确定微调框架,再利用分布式训练实现微调,从而更好的评估微调效果。

此外,为了给客户提供用于构建生成式AI应用的高性价比基础设施,亚马逊云科技还提供了广泛的加速器选择,包括基于GPU的解决方案。例如:基于英传达最新GPU芯片H100 Tensor Core的Amazon EC2 P5实例,与比上一代速度快了6倍,训练成本节省了40%;基于亚马逊云科技自研的机器学习推理芯片Amazon Inferentia2推出的Amazon EC2 Inf2实例,与其他类似的EC2实例相比性价比高了40%;基于自研机器学习训练芯片Amazon Trainium推出的Amazon EC2 Trn1实例,与同类实例相比训练成本节省高达50%。

据悉,目前OPPO、Airbnb、Autodesk等客户都在使用亚马逊云科技的专用加速器来处理要求苛刻的机器学习工作负载。

第三是夯实数据基座,使用私有化数据,打造差异化竞争优势

在将通用人工智能转变为了解企业业务和客户的人工智能生成模型的过程中,数据是极为关键的武器。因此,企业需要建立明确的数据基础设施战略。

陈晓建表示,要构建强大的数据"基座",企业需要做好三方面工作:

首先,需要一套全面的服务,能够存储用于构建和微调模型的各种类型的数据。

在这方面,亚马逊云科技针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景都提供了专门的数据库。针对检索增强生成(RAG,Retrieval Augment Generation)需要处理的向量数据,亚马逊云科技为Amazon OpenSearch Service、Amazon Aurora PostgreSQL和 Amazon RDS for PostgreSQL加入了向量数据库功能,客户可以使用这些功能来存储和搜索其机器翻译和生成式AI应用中使用的嵌入,将向量与数据同地放置,轻松连接数据并减少数据重复。

以西门子中国为例,西门子中国与亚马逊云科技合作开发了基于生成式人工智能技术的智能会话机器人"小禹",它采用了"检索增强生成RAG架构+向量数据库"设计,仅用三个月就完成了整体开发与部署。据悉未来西门子将把机器人"小禹"服务不断扩展到各应用领域,如利用小禹的知识查询和问答快速解决40%的IT支持问题;产品研发中大约30%与编码、测试、调试和文档编制相关的任务也可以利用小禹加速完成。

其次,通过服务间的集成打破数据孤岛,确保能够随时访问所有数据。

ETL(数据的抽取Extract,转换Transform,加载 Load)是端到端数据旅程迫切需要解决的问题。亚马逊云科技提出"Zero-ETL"的愿景,并推出Aurora Zero ETL for Redshift Integration, 允许存储在Amazon Aurora中实时产生的业务数据,无需ETL工具,以自动的方式同步到数据仓库Amazon Redshift中,以供近实时进行海量数据的聚合分析。

近年来,亚马逊云科技已经在Zero- ETL中取得了一定成果,包括Amazon S3、Amazon Aurora、Amazon Redshift、Amazon SageMaker、Amazon EMR、Amazon Athena、Amazon Kinesis等服务之间的深度数据集成,都在帮助企业执行分析和机器学习,且无需移动数据。

第三,在构建生成式AI应用程序的整个生命周期中确保数据安全并进行管理。

在数据治理方面,亚马逊云科技提供了Amazon DataZone数据治理服务,让客户能够跨组织边界发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时的工作量。通过Amazon DataZone,数据工程师、科学家和分析师等数据使用者可以通过统一的数据分析门户,在亚马逊云科技账户之间共享和访问数据,实现跨部门、跨组织地使用数据、开展数据协作。

第四是借助云原生服务,加速AI应用构建,助力业务敏捷创新

陈晓建指出,要构建云原生乃至AI原生的应用,要考虑微服务化、Serverless First、数据洞察和安全,并且避免重复造轮子:

以微服务化和事件驱动架构为核心的设计框架,可以松耦合的处理每个功能模块之间的互相依赖,让应用在不断变化的需求面前保持快速进化和迭代的能力;

Serverless First能够简化运维,提升效率,把人员从繁重的基础架构部署和运维中解脱出来,从而有更多精力去关注业务和创新;

数据决策优先,要像重视其他资产一样重视数据,把数据能力作为应用的核心竞争壁垒,加入到生成式AI应用的设计理念中;

要关注安全围栏,影响面控制,减小爆炸半径,将安全与数据的合规与保护放在前所未有的重要地位;

避免重复造轮子,除了技术本身,还要在DevOps、基础设施即服务、自动化等现代应用治理理念持续投入,促进企业内部的应用资产与实践的分享,构建高效敏捷的构建者文化。

第五是借助开箱即用的生成式AI服务,消除重复性工作并专注创新本身

众所周知,编程是生成式AI技术最早应用的领域之一。

过去很多软件开发者会花费大量时间编写浅显的、相同的代码,很少有时间用于创新。但如果从网上直接复制代码片段,可能会复制到无效的或有安全隐患的代码,或对开源代码的使用没有进行有效追溯。

为此,亚马逊云科技提供了人工智能编码伙伴Amazon CodeWhisperer,可以实时生成代码建议,提高开发人员的生产力。在亚马逊云科技进行的生产力测试中,使用Amazon CodeWhisperer的参与者与未使用的参与者相比,完成任务速度平均快57%,成功率高27%。

还有新推出的Amazon Whisperer自定义功能,能够生成优于之前的代码建议,它允许客户使用私有代码库安全地定制 CodeWhisperer代码建议,这些私有代码库可涵盖内部API、数据库、最佳实践和架构模式等。

据统计,目前Amazon CodeWhisperer已经帮助1000多家中小企业实现了生成式AI的创新,已经有超过10万中国开发者使用了Amazon CodeWhisperer。

陈晓建强调:开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接。要加速客户应用的商业化落地,除了亚马逊云科技本身的资源,还需要构建强大的合作伙伴生态,携手解决生成式AI应用构建中的各种技术问题。

就如亚马逊云科技CEO Andy Jassay所说:"我们的目标是让任何人都能够获得和大型企业一样先进的基础设施和成本来实现自己的创新。在生成式AI领域,我们同样希望借助亚马逊云科技的产品和服务,实现生成式AI技术的普惠化,赋能更多的企业和个人开发者加速创新。"

意见反馈:zhanheng@cbigroup.com

稿件投诉:zhanglin@cbigroup.com

内容合作QQ:2291221

商务合作:13391790444 詹老师

京ICP备:2022009079号-3

京公网安备:11010502051900号

ICP证:京B2-20230255

关注我们