“引入詞元技術后,我們算法模型的響應速度、準確性及資源消耗均實現了可量化的顯著提升?!?月6日,在貴陽市高新區(qū),大數據國家工程研究中心(中電科大數據研究院)技術專家周維一邊展示著最新的測試數據報告,一邊計算著詞元技術為項目帶來的具體成本節(jié)約與效率提升數值。
隨著大數據、人工智能技術的不斷演進和“詞元經濟”的悄然興起,大數據國家工程研究中心(中電科大數據研究院)積極搶抓機遇,率先在中醫(yī)藥、電力等重點行業(yè)的高質量數據集建設中引入詞元技術,并通過對領域專業(yè)知識、業(yè)務規(guī)則及多源異構數據的詞元化拆解與標準化治理,統(tǒng)一了跨行業(yè)的語義表達體系,為行業(yè)高質量數據集的構建奠定了堅實基礎。

貴州特色中醫(yī)藥多場景智能應用項目
“以貴州特色中醫(yī)藥多場景智能應用項目為例,我們搭建了專屬的中醫(yī)藥詞元知識庫,統(tǒng)一古籍、臨床、種植、質控等異構數據語義。”周維說,傳統(tǒng)中醫(yī)藥數據零散、語義不統(tǒng)一、智能推理精度不足,難以形成全鏈條的數據聯動與智能化應用。為此,他們圍繞天麻、八爪金龍等本地道地藥材與民族經典方劑資源,搭建了專屬中醫(yī)藥領域詞元知識庫。
這一創(chuàng)新舉措不僅統(tǒng)一了古籍文獻、臨床診療、田間種植、加工質控等異構數據的語義表達,還依托詞元的語義關聯能力,實現了辨證分型、經典方劑智能推薦等功能,顯著提升了中醫(yī)藥輔助診療的專業(yè)性和精準度。

貴州特色中醫(yī)藥多場景智能應用項目
同時,通過詞元化建模,大數據國家工程研究中心(中電科大數據研究院)還精準輸出了產地適宜性評價、標準化種植規(guī)程及生長風險預警,打通了從藥材源頭種植到臨床方劑應用的全鏈條數據聯動,實現了區(qū)域中醫(yī)藥產業(yè)數字化與智能化的深度落地。
周維介紹,作為大模型處理信息的最小計算單元,詞元技術的運用,還為大數據國家工程研究中心(中電科大數據研究院)在海量數據處理、大模型訓練推理環(huán)節(jié)帶來了可量化的效能提升,實現了速度、精度、資源消耗三重優(yōu)化。
“具體而言,模型推理的整體響應耗時縮短了30%至45%,批量海量數據處理效率提升了20%以上;模型對行業(yè)專業(yè)信息的識別與推理準確率提升了25%以上,專業(yè)場景下的錯誤輸出率下降了35%;而在資源消耗方面,同等數據量下的存儲占用降低了20%至30%,GPU算力利用率得到了大幅提升,綜合運行能耗與服務器資源開銷降低了約28%。”周維說。

大數據國家工程研究中心(中電科大數據研究院)
緊跟詞元經濟發(fā)展浪潮,當前,大數據國家工程研究中心(中電科大數據研究院)正圍繞“五數”工程整體戰(zhàn)略布局,依托數橋、數火、數腦、數人、數根葉茂五大工程系統(tǒng)推進數據要素體系建設。
“詞元作為‘算力貨幣’,將成為智能時代可計量、可定價、可交易的核心價值錨點與結算單位。”周維表示,大數據國家工程研究中心(中電科大數據研究院)將以詞元技術為核心引擎,以數火工程為核心抓手,圍繞“AI+數據”服務創(chuàng)新方向,深度聚焦中醫(yī)藥、民族醫(yī)藥等特色領域,系統(tǒng)性開展場景化高質量數據集建設,持續(xù)完善標準化中醫(yī)藥專屬詞元庫與多模態(tài)訓練數據集,全面推動要素流通市場化,切實筑牢規(guī)?;~元生產、大模型訓練與智能應用落地的高質量數據供給底座。
來源:天眼新聞
關鍵詞: