前言
近期(qi)諾(nuo)貝爾(er)物(wu)理學獎頒發給AI科學(xue)家John J. Hopfield、Geoffrey E. Hinton,讓許多人感到詫(cha)異。當獲(huo)獎電話打到加州時(shi),Hinton教授正(zheng)像往常(chang)那(nei)些(xie)平凡的下午一樣(yang),準備去一個廉價酒店做核磁共振,或許(xu)平凡中就蘊藏著杰(jie)出,正(zheng)如人工智能以潤物細無(wu)聲(sheng)的方式(shi)進入(ru)千行(xing)百業和人類生活(huo)。
人工智能從1956年概念提出開始,經過了幾起幾落;而今(jin)大模型似(si)乎摸到了AGI門口,各(ge)界摩拳擦掌都在(zai)嘗(chang)試用這項新(xin)技(ji)術推動行業變革,顛覆(fu)地(di)提升生(sheng)產力。本文嘗(chang)試從生(sheng)產力要素(su)的視(shi)角,思考大(da)模型技(ji)術如何幫助電力行業進行生(sheng)產力提升。
一、大模型發展和理解:從深度學習到大模型,從點到面(mian)的能力突破(po)
1、深度學習:GPT的(de)試金石(shi)?
回顧(gu)Hinton2007年(nian)在《科學》上發表題(ti)為"Reducing thedimensionality of data with neuralnetworks"的(de)論文,該篇論文是(shi)公認的(de)深(shen)度學(xue)習里程碑,但在2007-2010年期間每(mei)年引用次數(shu)僅為100次(ci)左右(you),無(wu)人無(wu)津;同時期,2007年李(li)飛(fei)飛(fei)啟(qi)動ImageNet項目, 2011第二屆圖像識別(bie)競賽(sai)提交13份(fen),而上一屆是(shi)35份;彼(bi)時Nvidia的GPU已經通(tong)過CUDA改造初獲成功。算力+算法+數據三駕馬車的加(jia)持下,2012年Hinton帶隊開發AlexNet參(can)加ImageNet第(di)三屆,一(yi)舉將(jiang)錯誤率從上一(yi)屆的25%降(jiang)低了11%,高出(chu)第(di)二名41%,深度學習技(ji)術路線至(zhi)此獲得各界認可,得以蓬(peng)勃發展。從這里(li)我們可以總結:AI就是關于三駕馬(ma)車的事(shi)。
2、GPT的成功:OpenAI做對了什么?
過(guo)去十年, GPU算力持(chi)續發(fa)展下,但人(ren)工(gong)智能算法(fa)變(bian)成(cheng)了瓶(ping)頸,深度學習例如RNN在面向文(wen)本等(deng)任務時無法并(bing)行訓練等(deng)問題(ti),模型參數(shu)規模和訓練數(shu)據(ju)規模遇到瓶(ping)頸。
從(cong)下圖可(ke)見,從(cong)2013年開始解決這些問題(ti)的基礎(chu)技(ji)術已經陸續具備,大模型誕生水到(dao)渠成。而為什么是OpenAI?OpenAI的(de)GPT成功做對了什(shen)么(me)?簡單說就是在前人(主要是Google做(zuo)(zuo)(zuo)了(le)嫁衣)的(de)基礎上做(zuo)(zuo)(zuo)了(le)集成創新(xin),選(xuan)對了(le)方向(xiang):利用模型(xing)來做(zuo)(zuo)(zuo)序(xu)列化概率預(yu)測任務(wu)(即預(yu)測下一(yi)個Token),實現AI能力遷移學習(xi)能力和多任務(wu)的泛(fan)化(hua)性。

圖:OpenAI的成功:選擇比努力重要
3、重塑生(sheng)產力:大模型如何改變(bian)世界?
在(zai)思考(kao)大(da)模(mo)型(xing)給行(xing)業(ye)和(he)人類(lei)生活(huo)帶(dai)來改(gai)變之前,我們(men)應該思考(kao)的是(shi)大(da)模(mo)型(xing)本身(shen)技術能(neng)力是(shi)什么。籠統來說(shuo),大(da)模(mo)型(xing)能(neng)力包(bao)括:語(yu)言(yan)理解和(he)表達(da)能(neng)力、知識壓縮(suo)能(neng)力以及邏(luo)輯(ji)推理能(neng)力。類(lei)比(bi)人類(lei),前兩者讓(rang)大(da)模(mo)型(xing)可以實現記(ji)得住(zhu)、看得懂,已經(jing)比(bi)較(jiao)成熟;推理能(neng)力是(shi)會思考(kao),是(shi)最重要的能(neng)力(通(tong)往AGI的鑰匙),不(bu)過目前還有(you)較大短板,OpenAI 最(zui)新發(fa)布的o1就是為了提升這個能力。
人(ren)類(lei)最大(da)的(de)(de)(de)技能是(shi)(shi)會使用工(gong)(gong)具。回顧(gu)幾次(ci)工(gong)(gong)業(ye)革命發展,都是(shi)(shi)圍(wei)繞使用新技術開發出(chu)更好(hao)的(de)(de)(de)工(gong)(gong)具來賦能人(ren)類(lei)的(de)(de)(de)能力,例如望遠鏡賦能眼(yan)、汽車飛機(ji)(ji)賦能腳、紡織機(ji)(ji)賦能手、計算機(ji)(ji)賦能腦等等,這些工(gong)(gong)具本質上(shang)來講是(shi)(shi)人(ren)類(lei)將目標任務的(de)(de)(de)工(gong)(gong)作規則,通過硬件或軟件的(de)(de)(de)方式讓(rang)工(gong)(gong)具實現(xian)自動(dong)化(hua)或半自動(dong)化(hua),實現(xian)生產力躍遷(對(dui)應下圖(tu)中的(de)(de)(de)模式二(er))。

圖:當前生產力的三種(zhong)勞動模式
而那些未能(neng)進行這(zhe)些改造升(sheng)級的勞(lao)動(dong)項目分為(wei)直接勞(lao)動(dong)型(xing)(對(dui)應模(mo)式(shi)一)和間接勞(lao)動(dong)型(xing)(對(dui)應模(mo)式(shi)二)。這(zhe)兩(liang)種(zhong)生產(chan)模(mo)式(shi)依然需要人來完成,本質上都是(shi)在現有(you)技術條件(jian)下還未能(neng)實(shi)現自動(dong)化的工作(zuo)(zuo),需要靠(kao)人與環境、與其他人進行信(xin)(xin)息(xi)(xi)交換,這(zhe)個過程(cheng)通常包(bao)含信(xin)(xin)息(xi)(xi)檢索獲(huo)取、信(xin)(xin)息(xi)(xi)分析加工和信(xin)(xin)息(xi)(xi)決策,最后在物理執(zhi)行階段依靠(kao)人根據作(zuo)(zuo)業(ye)過程(cheng)的反饋(kui)來持續作(zuo)(zuo)業(ye),無(wu)法被機(ji)器(qi)替代。
這(zhe)類環節(jie)正是制約生(sheng)產力(li)的關鍵因素,總(zong)結起(qi)來有三類制約:
(1)某些領域的專業知識(shi)還停留在大(da)腦里,不能(neng)為計(ji)算機(ji)所學習(xi)和理解;
(2)計算機(ji)接收后無法理解、分析和(he)判斷生產(chan)條件(jian)下的大量外部信息;
(3)物理(li)世界未提供自動執行的“API”接口或者未(wei)具備與環境協(xie)同作(zuo)業(ye)裝置。
第(3)點(dian)可以(yi)理解為何當下(xia)各種機器人產業如(ru)火如(ru)荼,除了當前已(yi)經出現的掃(sao)地機器人、AGV和工廠機械臂的初級版(ban),未來具身智(zhi)能保姆機器人(ren)、自(zi)動駕駛虛(xu)擬(ni)司機、搬(ban)運機器人(ren),以(yi)及更多不需要(yao)具身的其他換進感知智(zhi)能機器,這些工作都是(shi)為了模(mo)式(shi)(shi)一(yi)和模(mo)式(shi)(shi)三提(ti)供物理執行階段的裝(zhuang)置,可以(yi)說(shuo)解決模(mo)式(shi)(shi)一(yi)的問題就是(shi)造更智(zhi)能的機器。
在講(1)(2)制約之(zhi)前,我們詳(xiang)細展開模式三分(fen)析一下,對腦力(li)勞動(dong)者的(de)工作進行拆解,看看其中(zhong)(zhong)的(de)勞動(dong)性質。除了(le)臨時交(jiao)(jiao)辦事(shi)項,核(he)心的(de)工作可以分(fen)為四類工作:資料收集(ji)、信(xin)息(xi)分(fen)析、決策制定,任務(wu)督(du)辦。這(zhe)個(ge)過(guo)(guo)程(cheng)中(zhong)(zhong)會有大量的(de)人(ren)(ren)與外(wai)界系(xi)統(計算機系(xi)統、物理(li)世界和人(ren)(ren)等(deng))進行的(de)信(xin)息(xi)交(jiao)(jiao)換、群體(ti)的(de)大量討論(lun)分(fen)析并迭代(dai)、任務(wu)過(guo)(guo)程(cheng)的(de)信(xin)息(xi)收集(ji)跟催和任務(wu)迭代(dai)等(deng)等(deng),這(zhe)些工作之(zhi)所以還(huan)無法自動(dong)化(hua),核(he)心的(de)原(yuan)因就如(ru)上(shang)所述存(cun)在的(de)(1)(2)的問題。而(er)(1)(2)恰好屬于大(da)模(mo)型擅長解決的(de)領(ling)域,能夠(gou)為腦(nao)力(li)勞(lao)動者提(ti)供(gong)更多(duo)的(de)腦(nao)力(li)智(zhi)能來提(ti)升、甚至替代(dai),從而提(ti)高勞(lao)動的(de)效率和效果。
至此,我們可以(yi)看(kan)出今天人工(gong)智能(neng)產業(ye)技術(shu)研究方向的底層(ceng)邏(luo)輯。
二、電力(li)行(xing)業的生產力(li)需求(qiu):圍繞人與電力(li)系(xi)統,提升(sheng)效率和(he)能力(li)的問題
電網行業(ye)是電力系(xi)統的骨干,承(cheng)擔著(zhu)將電能(neng)從發電站輸送到千家萬戶的重要(yao)任務,包括(kuo)輸電、變電、配電和用(yong)電等關鍵(jian)環(huan)節。為了高效(xiao)地開展(zhan)這(zhe)些業(ye)務,企業(ye)內部通常(chang)會(hui)設立發展(zhan)、基建、調度、運檢、營銷(xiao)、配電、物資等多個(ge)部門,以確(que)保電力系(xi)統的穩定運行和服(fu)務質量。
從生產力的(de)角度來(lai)看,電網行(xing)業(ye)的(de)行(xing)業(ye)特點和(he)痛點,可以籠統歸納為兩(liang)個方面:
1. 業務龐大:地域廣、客戶多(duo)、設(she)備多(duo)、從業人員多(duo)
• 地域廣(guang):從農村、郊區到城市(shi),線(xian)纜和架空(kong)線(xian)路(lu)遍布全國各地;
• 客(ke)戶(hu)多:從家庭到(dao)企業,事(shi)業單位等,幾乎都是電網的直(zhi)接客(ke)戶(hu);
• 設(she)備多:大量(liang)的中樞變電站、輸電線(xian)和開(kai)關(guan)柜等設(she)施;
• 從業人員多:需要大(da)量的營銷(xiao)、運檢等(deng)人員(yuan)進(jin)行生產作業;
2. 機理復雜:大電網、電氣化特性等使得電網是一個復雜機理系統
• 復雜性的(de)(de)現狀:電(dian)(dian)(dian)網(wang)是一個(ge)高度復雜的(de)(de)人(ren)(ren)造物(wu)理(li)系統(tong),涉及到電(dian)(dian)(dian)氣(qi)、機械、自(zi)動化等(deng)多(duo)個(ge)領域的(de)(de)專業知識,人(ren)(ren)類目前主要從電(dian)(dian)(dian)網(wang)系統(tong)運行表(biao)征(zheng)出(chu)來的(de)(de)信息(xi)來與(yu)電(dian)(dian)(dian)網(wang)進(jin)(jin)行交互,包括調度方(fang)(fang)式計(ji)(ji)劃、設備檢修和(he)用電(dian)(dian)(dian)計(ji)(ji)劃,而表(biao)征(zheng)系統(tong)除(chu)了(le)設備的(de)(de)物(wu)理(li)外觀,還需要多(duo)個(ge)電(dian)(dian)(dian)氣(qi)方(fang)(fang)程(cheng)進(jin)(jin)行計(ji)(ji)算或估算,例如(ru)潮流計(ji)(ji)算、短路計(ji)(ji)算和(he)穩定計(ji)(ji)算等(deng),通過(guo)分別的(de)(de)計(ji)(ji)算,最后面向(xiang)特定任務進(jin)(jin)行專業決策,中(zhong)間(jian)還需要電(dian)(dian)(dian)力專家的(de)(de)經(jing)驗進(jin)(jin)行過(guo)程(cheng)干預(yu)以提升計(ji)(ji)算效(xiao)率(lv)和(he)效(xiao)果,所(suo)以,這個(ge)過(guo)程(cheng)對人(ren)(ren)和(he)專業性有巨大(da)的(de)(de)依賴。
• 復雜(za)性的挑戰(zhan):如果電力系(xi)統保持不變,也許可以(yi)繼(ji)續沿用過(guo)去的技(ji)術模式;但是隨(sui)著(zhu)“源隨荷動(dong)”到(dao)“源網(wang)荷儲(chu)互(hu)動”的新型電力系(xi)統(tong)升級(ji),地上一(yi)輛電動車,天上一(yi)朵(duo)云就(jiu)可(ke)能會導致(zhi)電網的電氣特性發生變化例如線路負載(zai)越(yue)限,以及設(she)備(bei)損壞例如變壓器(qi)高負載(zai)導致(zhi)繞阻溫度發生過高,需要(yao)秒(miao)級(ji)對事(shi)件進行感(gan)知、分析和決策,這是當前的電網技術體(ti)系(xi)下的工作模式無法應(ying)對的。
所以,站在生產力的角度看:
-電(dian)網業務龐(pang)大(da)需要大(da)量(liang)的(de)從業人員參(can)與勞動過程,是效率提升(sheng)的(de)問題(ti);
-電網機(ji)理復雜需要專業人員參與且仍有提升需求(qiu),是能力提升的(de)問題。
三(san)、大模型+電(dian)力行業(ye):從(cong)易到難、從(cong)外(wai)而(er)內提(ti)升電(dian)力行業(ye)生(sheng)產力
針對以上提到的(de)電(dian)網業務現狀(zhuang)和(he)提升需(xu)求(qiu),以第一章所(suo)述大模型如(ru)何提升生產(chan)(chan)力為方向,同時結(jie)合各(ge)類(lei)大模型技(ji)術的(de)成熟度和(he)能力特(te)性,思考應(ying)用大模型提升電(dian)網生產(chan)(chan)力的(de)思路,主(zhu)要包括兩個方面:
1、作業效率提升方(fang)面。
如前所(suo)述,業務域大是制約生產力的效率因素,需要人(ren)進行相對模式(shi)重復(fu)性工作(zuo),可以從大模型能力角度分為兩個(ge)方面(mian):
(1)結合大語言(yan)模(mo)型解決信(xin)息處理任務(wu)
當前最(zui)成熟的(de)大語言模型(Large Language Model)具備較(jiao)成熟(shu)的語言理(li)解和(he)表(biao)達能力、知識壓縮能力,以(yi)及初級邏(luo)輯推理(li)能力,可(ke)以(yi)幫助調度、運檢(jian)班組長、設(she)備主人(ren)、電(dian)網(wang)規劃專家、物資采(cai)購(gou)、辦公(gong)人(ren)員(yuan)等(deng)崗位(wei)人(ren)員(yuan)完(wan)成信(xin)息收集、信(xin)息分析(xi)、決策制定(ding)和(he)流(liu)程(cheng)督辦,需要將大模型的能力(RAG、Agent、Prompt以及必(bi)要的(de)預(yu)訓練(lian)微調等)和業務(wu)場景深度(du)融合,把業務(wu)專家的(de)工作技(ji)能遷(qian)移(yi)到大模型(xing)上(shang)。從技(ji)術的(de)角度(du)上(shang),今天大模型(xing)的(de)能力初步具(ju)備,重點是大模型(xing)與場景結合的(de)AI工程化。
(2)應用(yong)多模態(tai)大(da)模型解決環(huan)境(jing)感知分析任務
電網有大量(liang)的設備需要(yao)運維、檢修和(he)檢測試驗(yan),這些場景需要(yao)與物理(li)環境進行(xing)信(xin)息交換(huan),包括(kuo)體(ti)(ti)力勞(lao)動(dong)和(he)腦力勞(lao)動(dong)。體(ti)(ti)力勞(lao)動(dong)主(zhu)要(yao)是現場數(shu)據(ju)采集獲取,但自動(dong)化采集技(ji)術已(yi)經比較完(wan)善,例如運維巡視的視頻圖片的采集、現場作業面的視頻采集、設備聲紋(wen)錄波(bo)、五遙信(xin)息等都能夠采集。
關鍵的(de)(de)瓶頸(jing)在于(yu)沒有(you)直接的(de)(de)技術(shu)手(shou)段對(dui)這些數據(ju)進行(xing)解(jie)析(特(te)別(bie)是現(xian)場即(ji)刻處理),以及(ji)解(jie)析后(hou)的(de)(de)相關聯動分析和處置決策(ce),所以這些作業(ye)除了巡視缺(que)陷識別(bie)目前應用視覺識別(bie)模型(xing)外,其他大(da)多無法離(li)開對(dui)應的(de)(de)專業(ye)人員進行(xing)現(xian)場或電腦前的(de)(de)參與。而多模態大(da)模型(xing)(Large Multimodal Model)利用(yong)萬物皆可Transformer的(de)思想(xiang),實(shi)現(xian)了對多模(mo)態(tai)(tai)數據(ju)與大語言模(mo)型的(de)融合,端(duan)到端(duan)解決了從感知(zhi)采集感知(zhi)理解到信息認知(zhi)分析的(de)問題。可以(yi)展望,在(zai)多模(mo)態(tai)(tai)大模(mo)型與變(bian)(bian)(bian)電(dian)站(zhan)巡視(shi)等領(ling)域知(zhi)識結(jie)合后,今天的(de)變(bian)(bian)(bian)電(dian)站(zhan)智巡攝像頭、無人(ren)機(ji)的(de)單模(mo)態(tai)(tai)為(wei)主(zhu)的(de)執行巡視(shi),將(jiang)會(hui)在(zai)未(wei)來變(bian)(bian)(bian)成以(yi)自動(dong)化機(ji)器人(ren)為(wei)主(zhu)的(de)形(xing)式,實(shi)現(xian)變(bian)(bian)(bian)電(dian)站(zhan)無人(ren)化的(de)“望聞問(wen)切”全天候巡視。
不過,由于當前多模(mo)態大(da)模(mo)型采用CLIP思想的(de)對(dui)比學習(xi)方法,需要的(de)半合成樣本(ben)數量是(shi)圖像識(shi)別模型的(de)百倍(bei)千倍(bei),這些樣本(ben)數據(ju)不像LLM預訓(xun)練(lian)時可以完全無標注的(de)自監督訓(xun)練(lian),而是需要(yao)根據(ju)使用(yong)場景對圖像/視頻等(deng)模態樣(yang)本進行自動/半自動標注,并(bing)且需要輔以一定的審核工作,所(suo)以樣本的數量和質量是瓶頸,算(suan)力和算(suan)法沒問題。如何突破,從技術還是數據角度,還是兩者結合(he),尚(shang)有待觀(guan)察。
2、電網專(zhuan)業能力(li)提(ti)升(sheng)方(fang)面
隨同(tong)諾(nuo)貝爾物理獎(jiang)(jiang)一同(tong)頒(ban)發的其他(ta)獎(jiang)(jiang)項,諾(nuo)貝爾化學獎(jiang)(jiang)頒(ban)發給了DeepMind的(de)Demis Hassabis 和John Michael Jumper,以表彰其利用在AlphaFold在蛋白(bai)質結構預測方面的貢獻,AlphaFold2完成了(le)98.5%的(de)人(ren)類蛋白質(zhi)的(de)預測(ce),而過(guo)去數(shu)十(shi)年人(ren)類只預測(ce)了人(ren)類蛋白質(zhi)的(de)17%。AlphaFold工作原(yuan)理粗淺的(de)說(shuo)是(shi)把蛋白質折疊(die)紋路序(xu)列(lie)化Embedding到Transformer中(zhong),結合(he)StableDiffusion進行的(de)蛋(dan)白質折疊的(de)序列預(yu)測,具體可以見原理介(jie)紹[2]。可(ke)見大(da)模型(xing)技術(shu)除了解決(jue)文字信息(xi)和感知信息(xi)的處(chu)理理解外,還可(ke)以結合專(zhuan)業領域(yu)定制專(zhuan)用大(da)模型(xing),來(lai)顛覆性(xing)解決(jue)行業大(da)難題。所以,可以預見AI4S(AI For Science)未來將成為AI領域的重要賽道,成為科(ke)研第四范式時代、科(ke)學(xue)發(fa)現(xian)的奇點(dian),以后科(ke)學(xue)成果的涌現(xian)將呈現(xian)指數級(ji)增長。
回顧(gu)第2章所(suo)述,電(dian)(dian)網(wang)的機(ji)理復雜性,幾乎(hu)不可能靠大(da)語(yu)言模型和多(duo)模態大(da)模型來完成,在(zai)電(dian)(dian)網(wang)領(ling)域,通過構建(jian)一個基于Transformer架(jia)構(gou)的行業(ye)大(da)模型,可(ke)以重(zhong)構(gou)電網分析方法(fa),實現更高(gao)效(xiao)、更準確的電網管理和優化。
以(yi)電網的(de)(de)動(dong)態電氣量指(zhi)標的(de)(de)分析(xi)為(wei)例(li),它(ta)是(shi)電網運(yun)行狀態評估的(de)(de)關鍵,傳(chuan)統分析(xi)方法面臨復雜(za)性(xing)(xing)增加、仿真(zhen)計算(suan)(suan)量大(da)耗(hao)時(shi)過(guo)長、穩定(ding)(ding)性(xing)(xing)定(ding)(ding)義局限性(xing)(xing)、設(she)備動(dong)態特性(xing)(xing)難(nan)以(yi)準(zhun)確(que)(que)刻(ke)畫、不確(que)(que)定(ding)(ding)性(xing)(xing)考量缺失、實時(shi)量測限制和非(fei)線(xian)性(xing)(xing)約束考慮不足等(deng)問題,一定(ding)(ding)程(cheng)度上困擾著電網的(de)(de)安全(quan)經(jing)濟穩定(ding)(ding)運(yun)行目標。并且(qie),整個(ge)(ge)分析(xi)過(guo)程(cheng)是(shi)多個(ge)(ge)算(suan)(suan)法分布計算(suan)(suan),最后如何(he)把結果進行決策和組(zu)合計算(suan)(suan),還要考慮電力(li)分析(xi)的(de)(de)多次(ci)迭代,這個(ge)(ge)過(guo)程(cheng)的(de)(de)復雜(za)度和效(xiao)率可想而(er)知。這個(ge)(ge)過(guo)程(cheng)也非(fei)常類似與過(guo)去(qu)NLP幾十年無法突破的問題(ti):傳統NLP思想是(shi)把實體識別、詞性標注、情(qing)感(gan)分析(xi)等(deng)十幾個不同的(de)(de)任(ren)務(wu),在最(zui)后面向具體應用(yong)的(de)(de)時候進行組裝,這(zhe)種架(jia)構下(xia),從訓練到(dao)推理(li)的(de)(de)迭代過程中的(de)(de)優化就是(shi)一(yi)場災難,而大(da)模型(xing)的(de)(de)特點是(shi)多任(ren)務(wu)合(he)一(yi),端到(dao)端解決問題(ti),值得借鑒。
以訓練(lian)電(dian)網分(fen)析行業(ye)大模型(xing)為目(mu)標,我(wo)們可以將(jiang)電(dian)網中的(de)電(dian)壓、電(dian)流、負荷等(deng)基礎數(shu)據(ju),以及有(you)功(gong)功(gong)率、無功(gong)功(gong)率等(deng)功(gong)率類數(shu)據(ju),通過(guo)特定(ding)特征(zheng)提取方法構造序列化數(shu)據(ju),輸入到Transformer架構(gou)中,面向預測電(dian)網的(de)(de)短(duan)期(qi)態勢感知和長期(qi)運行趨勢分析等任務(wu),例如,通過分析電(dian)網的(de)(de)功(gong)率因素(su)識別出無功(gong)消耗較大(da)的(de)(de)區域(yu),并提出相應的(de)(de)優化措施(shi),通過編(bian)解碼架構(gou)的(de)(de)“預測”能(neng)力(li)(li),輸出預期的(de)(de)分析結果。通過這樣的(de)(de)方(fang)式,可以(yi)用(yong)一個算(suan)法架(jia)構實現對大電網海量數(shu)據的(de)(de)訓練吞吐能(neng)力(li)(li)、大量電氣特征的(de)(de)表達(da)能(neng)力(li)(li),以(yi)及基于(yu)多頭注意(yi)力(li)(li)機制對用(yong)戶預期任務目標的(de)(de)精準(zhun)“理解” 。
其(qi)他的例如(ru)電(dian)網穩定運行(xing)、電(dian)力系(xi)統(tong)建(jian)模與分析(xi)、調度與暫態分析(xi)、保護與控制等方面(mian),亦可(ke)以(yi)參考類似的算法(fa)思想進行(xing)創新研發(fa)。當然,這個過程將(jiang)會(hui)非常復雜艱辛(xin),未(wei)來如(ru)何落(luo)地,還需要業業內各界共(gong)同探索和實踐。
另(ling)外,還(huan)有(you)相對(dui)成熟的時序大模型(xing),可以開展一些(xie)預測任務,例(li)如天氣預測、負荷預測等場景,目前也正(zheng)在技術(shu)結合場景落地中,預期會有(you)一些(xie)成效。
四、實踐心(xin)得:大模型(xing)應用如(ru)何少走彎(wan)路
社(she)會各行各業如(ru)火(huo)如(ru)荼嘗試應用大模型技術(shu),浙達(da)能源以(yi)能源+AI為目標,也投(tou)身其中。行業+大模型應用剛(gang)剛(gang)起步,如何避免失敗是重中(zhong)之重,經過大量項目的實踐,我們(men)總結產業(ye)+大模型的過程中的部分(fen)思考(kao)和心得,供大家參考(kao)。
寫在最后(hou)
以GPT為(wei)代(dai)表的大模(mo)型技術從2018年推出,2022年底爆火,到今天2024年(nian)行業普(pu)遍(bian)入局試水,已經過去(qu)6個年(nian)頭。任何一項新(xin)技(ji)術(shu)提出,都需要(yao)時間(jian),時間(jian)讓技(ji)術(shu)迭代完善,讓先行者進行業務創新(xin)磨合(he),讓普羅大眾(zhong)逐步了解、接(jie)受(shou)和(he)使用。大模型技(ji)術(shu)由(you)于(yu)幻覺(jue)不可(ke)避(bi)免性、工業容錯(cuo)率低等等問題,時至今日不乏質疑、顧慮(lv)和(he)觀望,但路已在,也許今天大模型技(ji)術(shu)亦(yi)如(ru)Hinton教(jiao)授(shou)2007提出的深度學習框架一樣(yang),從(cong)平凡而生。
[1] Hinton, G. E. and Salakhutdinov, R. R.Reducing the dimensionality of data withneural networks. Science, Vol. 313. no.5786, pp.504-507, 28 July 2006.
[2] 深入剖析AlphaFold算法,知乎,//zhuanlan.zhihu.com/p/39369976