北京2025年4月8日 /美通社/ -- 亞馬遜云科技日前宣布Amazon SageMaker Unified Studio已正式可用,這是一套獨(dú)立的數(shù)據(jù)與人工智能(AI)開發(fā)環(huán)境,也是新一代Amazon SageMaker的核心。這項新產(chǎn)品將多種工具整合至一站式的界面中,為客戶提供一致的開發(fā)體驗(yàn),不僅能夠節(jié)省開發(fā)時間,還能簡化訪問控制管理,使數(shù)據(jù)從業(yè)者能夠?qū)W⒂诤诵娜蝿?wù)——構(gòu)建高質(zhì)量的數(shù)據(jù)分析場景和AI應(yīng)用。
新一代Amazon SageMaker是亞馬遜云科技在2024 re:Invent全球大會上發(fā)布的一個一站式平臺,涵蓋數(shù)據(jù)、分析和AI等功能。它整合了亞馬遜云科技廣泛應(yīng)用的機(jī)器學(xué)習(xí)和分析功能,通過統(tǒng)一的工具訪問和數(shù)據(jù)治理,解決了企業(yè)在數(shù)據(jù)分析和AI應(yīng)用中面臨的挑戰(zhàn)。它使團(tuán)隊能夠安全地發(fā)現(xiàn)、準(zhǔn)備和協(xié)作處理數(shù)據(jù)資產(chǎn),并在一站式的環(huán)境中構(gòu)建分析和AI應(yīng)用,加快從數(shù)據(jù)到價值的轉(zhuǎn)化過程。
Amazon SageMaker Unified Studio是新一代Amazon SageMaker的核心,這是一個一站式的數(shù)據(jù)和AI開發(fā)環(huán)境,用戶可以在其中發(fā)現(xiàn)和訪問企業(yè)的數(shù)據(jù),并使用最適合的工具處理幾乎所有的應(yīng)用場景。Amazon SageMaker Unified Studio現(xiàn)已正式可用。
Amazon SageMaker Unified Studio的優(yōu)勢
Amazon SageMaker Unified Studio集成了亞馬遜云科技現(xiàn)有的分析、人工智能與機(jī)器學(xué)習(xí)服務(wù),包括Amazon EMR、Amazon Glue、Amazon Athena、Amazon Redshift、Amazon Bedrock及Amazon SageMaker AI。用戶可以在這個一站式的開發(fā)環(huán)境中查找、訪問并查詢數(shù)據(jù)和AI資產(chǎn),并在項目中高效協(xié)作,共享數(shù)據(jù)、模型和生成式AI應(yīng)用。通過Amazon SageMaker Catalog,Amazon SageMaker Unified Studio內(nèi)置的細(xì)粒度權(quán)限控制等治理功能,幫助用戶滿足企業(yè)數(shù)據(jù)資產(chǎn)的安全要求。
Amazon SageMaker Unified Studio具有統(tǒng)一的數(shù)據(jù)訪問能力,該功能由Amazon SageMaker Lakehouse提供,這是一個基于Apache Iceberg開放標(biāo)準(zhǔn)構(gòu)建的統(tǒng)一、開放和安全的數(shù)據(jù)湖倉庫。無論數(shù)據(jù)存儲在Amazon Simple Storage Service (Amazon S3)數(shù)據(jù)湖、Amazon Redshift數(shù)據(jù)倉庫,還是第三方和整合的數(shù)據(jù)源中,用戶都可以從單一入口訪問并使用兼容Apache Iceberg的引擎和工具進(jìn)行處理。此外,Amazon SageMaker Lakehouse現(xiàn)已與Amazon S3 Tables集成,Amazon S3 Tables是首個原生支持Apache Iceberg的云對象存儲服務(wù),用戶能夠使用Amazon SageMaker Lakehouse高效地創(chuàng)建、查詢和處理S3 Tables,既可以使用Amazon SageMaker Unified Studio中的各種分析引擎,也可以使用如Apache Spark和PyIceberg等Apache Iceberg兼容的引擎。
Amazon Bedrock的功能現(xiàn)已在Amazon SageMaker Unified Studio中正式可用,能夠幫助客戶在受管理的環(huán)境中快速構(gòu)建原型、定制和共享生成式AI應(yīng)用??蛻艨梢栽贏mazon SageMaker Unified Studio的界面中使用Amazon Bedrock功能,包括如Claude 3.7、DeepSeek及Amazon Nova等高性能基礎(chǔ)大模型,并能夠通過簡單操作創(chuàng)建 AI助手(Agents)、工作流、知識庫和對大模型生成內(nèi)容的防護(hù)機(jī)制(Guardrails)等。
Amazon SageMaker Unified Studio現(xiàn)已集成Amazon Q Developer。Amazon Q Developer是強(qiáng)大的軟件開發(fā)生成式AI助手,可在Amazon SageMaker Unified Studio中使用,用于簡化數(shù)據(jù)和AI開發(fā)生命周期中的各項任務(wù),包括代碼編寫、SQL生成、數(shù)據(jù)發(fā)現(xiàn)和問題排查。
全新的工作集成方式
Amazon SageMaker Unified Studio是亞馬遜云科技為客戶提供簡化數(shù)據(jù)工作方式的又一重要里程碑,無論是用于數(shù)據(jù)分析還是AI應(yīng)用。許多客戶正在構(gòu)建數(shù)據(jù)驅(qū)動型應(yīng)用來指導(dǎo)業(yè)務(wù)決策、提高敏捷性和推動創(chuàng)新,但由于這些應(yīng)用需要跨團(tuán)隊協(xié)作以及整合數(shù)據(jù)和工具,構(gòu)建過程十分復(fù)雜。客戶不僅需要花費(fèi)時間學(xué)習(xí)多種開發(fā)環(huán)境,而且由于數(shù)據(jù)、代碼和其他開發(fā)資產(chǎn)被分散存儲,要理解各要素資產(chǎn)之間的交互關(guān)系并實(shí)現(xiàn)協(xié)同運(yùn)作對客戶而言就是一大挑戰(zhàn)。配置和管理權(quán)限也是一個繁瑣的手動過程。為了克服這些挑戰(zhàn),許多企業(yè)正在嘗試將各類服務(wù)、工具和企業(yè)的權(quán)限管理系統(tǒng)進(jìn)行定制化集成。然而,客戶真正需要的是:既能夠靈活采用最適合其使用場景的服務(wù),又能為數(shù)據(jù)團(tuán)隊提供一站式的開發(fā)體驗(yàn)。
"在為客戶構(gòu)建數(shù)據(jù)驅(qū)動型應(yīng)用時,我們需要一個一站式的平臺,使各種技術(shù)能夠以集成的方式協(xié)同工作。Amazon SageMaker Unified Studio通過全面的分析功能、一站式的開發(fā)環(huán)境以及整合數(shù)據(jù)倉庫和數(shù)據(jù)湖管理的湖倉架構(gòu),簡化了我們的解決方案交付流程。Amazon SageMaker Unified Studio將客戶數(shù)據(jù)項目的價值實(shí)現(xiàn)時間縮短了多達(dá)40%,幫助我們加速客戶的數(shù)字化轉(zhuǎn)型進(jìn)程。"
——NTT DATA解決方案部門負(fù)責(zé)人鈴江明弘、NTT DATA應(yīng)用與數(shù)據(jù)技術(shù)部高級經(jīng)理莊野裕司、NTT DATA數(shù)字成功解決方案部經(jīng)理齊藤優(yōu)希
數(shù)百萬企業(yè)信任亞馬遜云科技,并利用我們?nèi)娴膶iT構(gòu)建的分析、人工智能與機(jī)器學(xué)習(xí)、生成式AI功能來支持?jǐn)?shù)據(jù)驅(qū)動型應(yīng)用,同時無需在性能、可擴(kuò)展性和成本效益之間進(jìn)行妥協(xié)。亞馬遜云科技希望通過新一代Amazon SageMaker(包括Amazon SageMaker Unified Studio)在一站式的開發(fā)環(huán)境中為企業(yè)提供對所有數(shù)據(jù)和工具的訪問,提升數(shù)據(jù)和AI從業(yè)者的工作效率。
從一站式數(shù)據(jù)和AI開發(fā)環(huán)境開始構(gòu)建
如何通過優(yōu)化潛在客戶挖掘來提升收入是一個常見的業(yè)務(wù)挑戰(zhàn)。請想象這樣一個場景:一個企業(yè)在其網(wǎng)站上部署智能數(shù)字助手來與客戶進(jìn)行互動,這個過程傳統(tǒng)上需要多個工具和數(shù)據(jù)源。現(xiàn)在,通過使用Amazon SageMaker Unified Studio,用戶可以在一站式的數(shù)據(jù)和AI開發(fā)環(huán)境中完成整個過程。
首先,數(shù)據(jù)團(tuán)隊使用Amazon SageMaker Unified Studio中的生成式AI環(huán)境快速評估并選擇最適合客戶互動的模型。然后,團(tuán)隊會創(chuàng)建一個項目來整合用例所需的工具和資源,并在項目中使用Amazon Bedrock構(gòu)建和部署一個智能虛擬助手,該助手可以快速通過網(wǎng)站篩選潛在客戶。
為了識別最具潛力的機(jī)會,團(tuán)隊制定了客戶分層策略。數(shù)據(jù)工程師借助Amazon Q Developer識別含有潛在客戶信息的數(shù)據(jù)集,并通過zero-ETL的方式將數(shù)據(jù)導(dǎo)入Amazon SageMaker Lakehouse。隨后,數(shù)據(jù)分析師發(fā)現(xiàn)這些數(shù)據(jù)并創(chuàng)建關(guān)于他們業(yè)務(wù)的全景視圖。他們使用SQL查詢編輯器構(gòu)建營銷細(xì)分表,然后將查詢結(jié)果寫回Amazon SageMaker Lakehouse,供其他團(tuán)隊成員使用。
最后,數(shù)據(jù)科學(xué)家訪問同一數(shù)據(jù)集,使用Amazon SageMaker AI提供的工具訓(xùn)練和部署自動化的潛在客戶評分模型。在模型開發(fā)階段,他們利用Amazon Q Developer的內(nèi)聯(lián)代碼編寫和問題排查功能,在其JupyterLab notebook中高效編寫無錯誤代碼。最終的模型為銷售團(tuán)隊提供最具價值的機(jī)會,他們可以通過商業(yè)智能儀表板直觀查看并立即采取行動。
在一站式的環(huán)境中加速實(shí)現(xiàn)數(shù)據(jù)價值
這個示例的非凡之處在于,整個過程都在一個統(tǒng)一的環(huán)境中完成。如果沒有Amazon SageMaker Unified Studio,團(tuán)隊就必須在多個數(shù)據(jù)源、工具和服務(wù)之間切換,花費(fèi)大量時間學(xué)習(xí)不同的開發(fā)環(huán)境、創(chuàng)建資源共享和手動配置權(quán)限控制。數(shù)據(jù)工程師和數(shù)據(jù)分析師需要在各種數(shù)據(jù)倉庫、數(shù)據(jù)湖和分析工具中工作,數(shù)據(jù)科學(xué)家需要在機(jī)器學(xué)習(xí)環(huán)境和notebook環(huán)境中工作,應(yīng)用程序開發(fā)者則需要在生成式AI工具中工作。現(xiàn)在,他們能夠在一個統(tǒng)一的環(huán)境中使用所需的數(shù)據(jù)和工具進(jìn)行構(gòu)建和協(xié)作,大大縮短了價值實(shí)現(xiàn)時間。
現(xiàn)在Amazon SageMaker Unified Studio已正式可用,通過將分析和AI所需的一切整合在一處,客戶可以更高效地解決復(fù)雜的端到端問題,比以往更快地實(shí)現(xiàn)創(chuàng)新成果。
豐田是全球領(lǐng)先的汽車制造商之一,豐田內(nèi)部數(shù)據(jù)來源分散,涵蓋數(shù)據(jù)湖、數(shù)據(jù)庫及第三方數(shù)據(jù)源,實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通成為其一大挑戰(zhàn)。豐田不僅需要高效整合數(shù)據(jù),還需從多個來源快速提取信息,獲取洞察并構(gòu)建AI模型。Amazon SageMaker Unified Studio為豐田提供數(shù)據(jù)目錄、MLOps管道和完整的人工智能和機(jī)器學(xué)習(xí)工具集,助力數(shù)據(jù)科學(xué)團(tuán)隊快速部署模型,并高效共享成果,實(shí)現(xiàn)了從數(shù)據(jù)到業(yè)務(wù)價值的快速轉(zhuǎn)化。