“大模型”不是新東西。
在這波大模型熱潮之前,工業(yè)界便已存在各種規(guī)模的模型。但由于工業(yè)領(lǐng)域大多涉及關(guān)鍵決策,實(shí)際應(yīng)用時(shí)較為慎重。
(資料圖片)
有了大模型的加持,工業(yè)界的人工智能應(yīng)用,迎來了全新的契機(jī)。但在這個(gè)群“?!眮y舞的時(shí)代,大模型離工業(yè)界大規(guī)模應(yīng)用還有多遠(yuǎn)?有哪些亟待突破的真正的核心技術(shù)?
帶著這些問題,我們希望借WAIC 2023 全球人工智能大會(huì)舉辦的機(jī)會(huì),找到一家一線的工業(yè)界實(shí)踐者,探尋其中的答案。馬上消費(fèi)金融進(jìn)入了我們的視線。
據(jù)馬上消費(fèi)金融副總經(jīng)理兼首席信息官(CIO)蔣寧介紹,馬上消費(fèi)金融成立于2015年,目前約有3000名員工,其中2000+人是研發(fā),而且大部分都是人工智能和大數(shù)據(jù)方向,堅(jiān)持自主研發(fā)不外包,截至2023年6月底,1315件發(fā)明專利申請(qǐng),已公開983件,消金行業(yè)占比52.9%,位居行業(yè)第一,妥妥的一家科技驅(qū)動(dòng)的金融機(jī)構(gòu)。公司目前有10萬+個(gè)風(fēng)險(xiǎn)特征變量,100+個(gè)細(xì)分迭代模型,2000+個(gè)風(fēng)險(xiǎn)策略、決策及數(shù)據(jù)模型算法,實(shí)現(xiàn)了92.4%的智能客服分流率、100%的智能質(zhì)檢覆蓋率、98.6%的客戶綜合滿意度。
馬上消費(fèi)金融副總經(jīng)理兼首席信息官?蔣寧
作為科技賦能業(yè)務(wù)的先行者,金融行業(yè)歷來是新技術(shù)應(yīng)用實(shí)踐的風(fēng)向標(biāo)。新技術(shù)在金融行業(yè)用得如何,一直備受關(guān)注。大模型當(dāng)然也不例外。
在蔣寧看來,當(dāng)前,金融行業(yè)大模型應(yīng)用面臨四個(gè)挑戰(zhàn)。
一是關(guān)鍵任務(wù)和動(dòng)態(tài)適應(yīng)性。關(guān)鍵任務(wù)往往關(guān)系到生命或重大資產(chǎn),比如自動(dòng)駕駛、銀行存款,人工智能要做到100%的準(zhǔn)確,并不容易。而生成式模型,目前與工業(yè)界的判別式模型相結(jié)合的化學(xué)反應(yīng)尚無明顯效果。同時(shí),與AlphaGo的封閉系統(tǒng)不同,大模型要想做到越來越聰明,就要想辦法在開放的體系里讓群體力量貢獻(xiàn)給模型,讓盡量多的用戶參與反饋,形成生態(tài)。
二是個(gè)性化要求和隱私保護(hù)。摒棄千篇一律的教條式服務(wù),做到千人千面,大模型在為用戶提供個(gè)性化體驗(yàn)的同時(shí),又能確保用戶隱私,這也是一個(gè)需要解決的問題。
三是群體智能與安全可控。一方面,中國(guó)的移動(dòng)互聯(lián)網(wǎng)與PC互聯(lián)網(wǎng)是割裂的,導(dǎo)致可用數(shù)據(jù)有限;另一方面,行業(yè)領(lǐng)域的數(shù)據(jù)往往是封閉的,很難共享。如何設(shè)計(jì)一個(gè)跨行業(yè)、組織的數(shù)據(jù)共享、權(quán)益共享且安全可控的機(jī)制,同樣面臨巨大挑戰(zhàn)。
四是基礎(chǔ)設(shè)施能力。GPU、網(wǎng)絡(luò)、機(jī)房等基礎(chǔ)環(huán)境要針對(duì)大模型訓(xùn)練、推理等方面的需求,做出相應(yīng)的改造,才能發(fā)揮最大的效能。這個(gè)挑戰(zhàn)有望最先得到解決。
針對(duì)上面的前三個(gè)挑戰(zhàn),蔣寧給出了他所理解的大模型的三個(gè)真正核心的技術(shù)。
一是持續(xù)學(xué)習(xí)。這是大模型帶來的最大變革,是大模型成功與否的關(guān)鍵。不管是千模還是萬模,最核心的不是模型參數(shù),而是大模型是否具備了生態(tài)能力,讓盡量多的人使用,變得越用越聰明,具備持續(xù)學(xué)習(xí)能力,并進(jìn)行正向反饋。
二是魯棒性決策。在工業(yè)界,包括自動(dòng)駕駛、醫(yī)療、金融等,雖然人工智能有99%是正確的,但只要有1%是錯(cuò)誤的,在工業(yè)界就無法使用,因?yàn)樗婕暗饺嗣P(guān)天的重大決策。因此,要幫助大模型排除噪音、干擾,在突發(fā)、不可預(yù)期的情況下,保持決策的穩(wěn)定、安全合規(guī)。
三是組合式AI。工業(yè)界之前有很多模型,大模型出現(xiàn)后,利用大模型的泛化能力把工作拆解,使得生成式模型可以與原先工業(yè)界的判別式模型有效結(jié)合,讓兩種模型的優(yōu)勢(shì)各自能發(fā)揮更好的價(jià)值,實(shí)現(xiàn)自動(dòng)化GPT。
“形成真正的工業(yè)界可落地的持續(xù)學(xué)習(xí)的、解決魯棒性的、組合式的新型AI系統(tǒng),這是我們未來構(gòu)建可在工業(yè)界有效使用的大模型的方向。”蔣寧如是說。
在蔣寧看來,馬上消費(fèi)金融作為AI驅(qū)動(dòng)的金融科技公司,要幫助解決金融行業(yè)的三個(gè)通用問題。
一是個(gè)性化的服務(wù)和極致用戶體驗(yàn)。金融業(yè)務(wù)有高價(jià)值、低頻的特點(diǎn),很難提供個(gè)性化的體驗(yàn)。傳統(tǒng)的做法是分層打標(biāo)簽,提供不同的產(chǎn)品,但標(biāo)簽是動(dòng)態(tài)變化的,因此如何自動(dòng)化地決策為客戶提供自動(dòng)化的體驗(yàn),就需要產(chǎn)品與眾不同。
二是高效的價(jià)值傳遞效率。雖然金融是技術(shù)密集型、數(shù)據(jù)密集型行業(yè),但目前線下網(wǎng)點(diǎn)還是為數(shù)不少,因?yàn)槿斯ぶ悄苌胁荒茏龅讲怀鲥e(cuò),很多工作還要高度依賴人工操作。
三是合規(guī)安全的決策智能,這與魯棒性相關(guān)。
基于這三方面考慮,以及上萬臺(tái)的服務(wù)器,近千張的GPU卡,40PB的文字、聲音、圖片、視頻等形式的數(shù)據(jù),馬上消費(fèi)金融實(shí)現(xiàn)了算力、算法、數(shù)據(jù)以及場(chǎng)景的閉環(huán),并由此打造了“三縱三橫”的AI戰(zhàn)略。
馬上消費(fèi)金融的“三縱三橫”戰(zhàn)略
三縱
實(shí)時(shí)人機(jī)決策:解決工業(yè)界的魯棒性問題,讓人接手人工智能解決不了的1%的問題。多模態(tài)大模型:積累了海量的語言、文字、圖片等素材,并圍繞其進(jìn)行了大量的訓(xùn)練,形成了一套完整的多模態(tài)的資產(chǎn)。數(shù)據(jù)智能:構(gòu)建了2000+個(gè)模型,為2億多用戶自動(dòng)化的營(yíng)銷、風(fēng)控等服務(wù),這本身就是稀缺的場(chǎng)景和資源。三橫
持續(xù)學(xué)習(xí):確保做的事情不是一次性的,越用越聰明。模型控制:解決魯棒性、突發(fā)、不可預(yù)期的問題,讓模型有穩(wěn)定的輸出,自動(dòng)化找到噪音,有效排處有害的違反社會(huì)道德的數(shù)據(jù)。組合式AI:多種模型組合應(yīng)用,解決問題。目前,馬上消費(fèi)金融的AI主要應(yīng)用在三大場(chǎng)景:一是金融智能對(duì)話,實(shí)現(xiàn)實(shí)時(shí)人機(jī)協(xié)作、持續(xù)學(xué)習(xí)、可信安全合規(guī);二是金融數(shù)字人,通過大模型+組合式AI多模態(tài)能力,實(shí)現(xiàn)有溫度的數(shù)字人;三是金融服務(wù)的AI心里引擎,通過大模型的大腦與心理學(xué)的有機(jī)結(jié)合,實(shí)現(xiàn)有情感的人機(jī)體驗(yàn)。
“垂直領(lǐng)域的判別式模型與生成式模型等多種模型組合,構(gòu)筑一個(gè)開放的持續(xù)學(xué)習(xí)、具備魯棒性、合規(guī)安全的體系,才是大模型的真正落地,而不是一個(gè)模型靠幾千億參數(shù)去落地。我們將為之而努力?!笔Y寧總結(jié)道。
關(guān)鍵詞: