北京2024年5月8日 /美通社/ -- 如同造紙術的改良推動了人類文明的傳承、蒸汽機的改進催生了工業(yè)革命,在人類歷史上,創(chuàng)新的工具引領了影響深遠的變革。今天,大模型發(fā)展如火如荼,但企業(yè)在大模型應用落地過程中仍需要解決幻覺、開發(fā)難度大、適配遷移難、試錯成本高等系列挑戰(zhàn)。因此,卓越的大模型應用開發(fā)工具成為AI釋放生產力的關鍵。
浪潮信息發(fā)布的企業(yè)大模型開發(fā)平臺"元腦企智"EPAI(Enterprise Platform of AI),面向企業(yè)大模型應用開發(fā),提供了全鏈路、高可用的系列能力工具,能夠幫助企業(yè)有效降低大模型應用門檻,幫助伙伴提升模型開發(fā)效能,打造智能生產力。
那么,在實際應用場景中,元腦企智EPAI如何通過系列化工具助力企業(yè)化解大模型創(chuàng)新與應用挑戰(zhàn),加速大模型潛力釋放呢?
大模型數據處理工具:專業(yè)數據煉金術
高質量的專有數據資產,已經成為通用大模型落地特定場景并解決"幻覺"問題的第一要素。然而,行業(yè)及企業(yè)的數據類型繁多、質量不一,且常常包含敏感的企業(yè)內部信息,數據處理的技術難度大、時間成本高。
EPAI提供數據處理工具,幫助企業(yè)從種類多樣、場景復雜、規(guī)模龐大的行業(yè)數據、企業(yè)數據中高效地生成微調數據和行業(yè)/企業(yè)知識庫,減少數據篩選和處理的時間和成本。微調數據方面,EPAI數據處理工具通過對行業(yè)或企業(yè)自有數據的提取,形成待處理的文本,再利用大模型生成候選問答數據,經過嚴格的評測篩去低質量的部分,從而生成高質量微調數據。同時,提取后的高質量信息(如段落文本等)經過編碼模型,將以向量的形式存入分布式向量數據庫,為行業(yè)/企業(yè)打造專屬知識庫。
大模型能力提升工具:微調+RAG,為大模型注入行業(yè)智慧
數據處理工作完成后,通過微調與檢索增強生成(RAG)技術,可以幫助大模型在專業(yè)場景中實現更好的理解和生成效果,提高生成內容的可解釋性,解決大模型"幻覺"問題。
EPAI提供支持千億參數模型微調的強化學習工具,結合專有數據進行大模型微調,能夠使通用大模型"再學習"升級為領域大模型,增強其在特定應用場景和任務中的性能和適應性,提升微調的效率與質量。EPAI強化學習工具能夠通過長度外推讓模型具備百萬Token的長文檔處理能力。當用戶將大批量的招投標文件、法律文書、技術文檔輸入到大模型中,并要求大模型答疑解惑時,經過微調并具備長文檔處理能力的領域大模型,將提供更加精確和可靠的回答。
EPAI支持檢索增強生成(RAG)技術。實際業(yè)務場景中,企業(yè)數據更新速度很快,但是微調模型成本較高,企業(yè)難以通過高頻率的微調實現大模型與業(yè)務的同步更新。因此利用RAG技術,企業(yè)可以將最新的數據快速、低成本地導入到知識庫內,模型通過檢索知識庫,提升生成內容的可靠性與準確性,實現模型知識庫與業(yè)務信息的同步更新。
多模多元管理工具:打造AI發(fā)展快車道
如今,不論是大模型還是算力基礎設施都處于百花齊放的階段,企業(yè)往往需要結合業(yè)務需求選擇多種模型、多元算力,因此帶來復雜、高成本的適配與運維工作,為企業(yè)大模型落地造成極大阻礙。
EPAI通過打造多模管理工具,實現業(yè)界多種主流大模型的接入、適配與管理。針對企業(yè)多樣化的應用場景和任務需求,選擇具備相應專長能力的模型,為不同場景下的業(yè)務需求提供靈活、高效且多元化的大模型方案。
EPAI提供多元算力管理工具,通過面向多元、多模的大模型計算框架TensorGlue,通過算子基礎化技術實現上層模型算法和下層基礎設施的邏輯解耦,降低企業(yè)跨算力平臺遷移、多元模型部署適配的試錯成本。同時,EPAI還通過AIStation提供成熟的算力調度管理能力,支持大型數據中心的數千卡多元算力集群管理。
大模型應用服務工具:大模型能力快速接入
EPAI提供API調用、對話式UI、智能體三種交互方式,有效降低企業(yè)基于大模型的應用開發(fā)門檻。
API調用支持將大模型能力快速接入現有系統(tǒng),或開發(fā)原生應用。對話式UI提供了開箱即用的交互方式,通過使用YuanChat等AI助手,實現非專業(yè)研發(fā)人員輕松上手使用,快速開發(fā)大模型應用。智能體編排復雜工作流的方式,利于企業(yè)進行長流程多節(jié)點的應用任務開發(fā)。
安全鏈路防護工具:構筑企業(yè)隱私盾牌
為確保企業(yè)重要數據的安全性,EPAI提供權限管理、數據加密、內容審查等工具,讓數據的流轉更安全,讓生成結果更可靠。同時提供強大的隱私保護能力,構建起一個既能充分利用數據價值,又能保護用戶隱私、符合法規(guī)要求的安全數據處理環(huán)境,做到"數據可用不可見"。
目前,浪潮信息企業(yè)大模型開發(fā)平臺EPAI已成功應用在內部的智能招投標助手場景中,高效支撐大模型應用落地。數據處理工具利用整理出的數萬份招標文件,識別并抽取出10+項招標關鍵信息,使用參數/評分項等數據進行模型微調,提升模型識別、理解與判斷準確性;同時使用項目信息、招標信息、產品信息構建起企業(yè)知識庫,提供更高效、更準確的檢索結果。對話式UI/API調用的方式,實現模型交互操作以及業(yè)務系統(tǒng)接入?,F已構建起投標支持平臺,實現招標參數自動識別,助力業(yè)務釋放50%的招標參數分析時間,識別準確率達85%,同時提供標前分析,助力投標策略的制定。未來還將實現產品技術、成功案例、解決方案等智能問答服務,進一步助力招投標決策智能化。
企業(yè)大模型開發(fā)平臺EPAI,是浪潮信息驅動伙伴AI變革的工具賦能平臺,具備"上手快""精度高""易部署""安全可靠"四大特點,能夠將企業(yè)的大模型應用開發(fā)時間周期縮短至一周,幫助企業(yè)高效開發(fā)部署生成式AI應用、打造智能生產力。未來,浪潮信息將繼續(xù)進行大模型應用開發(fā)平臺的工具升級,通過協同共生、開放共贏的元腦生態(tài)推動AI創(chuàng)新落地。