前言
近期(qi)諾貝爾物理學(xue)獎頒發給AI科學家John J. Hopfield、Geoffrey E. Hinton,讓許多人感到詫異。當獲獎電話打到加州時(shi),Hinton教授正像往常那些(xie)平凡(fan)的(de)下午一樣,準備去(qu)一個(ge)廉價酒店做核(he)磁共振,或許平凡(fan)中就蘊(yun)藏著(zhu)杰出,正如人工智能以潤物細無聲(sheng)的(de)方式進入千行(xing)百業和人類生活。
人工(gong)智能從(cong)1956年(nian)概念提(ti)出開始,經過了幾(ji)起幾(ji)落(luo);而今大模型似乎摸到(dao)了AGI門口,各界(jie)摩拳擦掌都在嘗試用這項新技(ji)術(shu)推(tui)動行業(ye)變(bian)革,顛覆地提升(sheng)生(sheng)產(chan)力。本文嘗試從(cong)生(sheng)產(chan)力要素(su)的視角,思考大模(mo)型(xing)技(ji)術(shu)如(ru)何幫(bang)助電力行業(ye)進行生(sheng)產(chan)力提升(sheng)。
一、大(da)模(mo)型(xing)發展和理解:從深(shen)度(du)學習到(dao)大(da)模(mo)型(xing),從點到(dao)面的能力突(tu)破(po)
1、深度學習:GPT的(de)試金石?
回顧Hinton2007年在(zai)《科學》上發表題為"Reducing thedimensionality of data with neuralnetworks"的論(lun)文,該篇論(lun)文是(shi)公認的深度學習里(li)程碑,但(dan)在2007-2010年期間每年引用次數僅為(wei)100次左(zuo)右,無(wu)人無(wu)津;同(tong)時期,2007年李飛飛啟動ImageNet項目, 2011第二屆圖(tu)像識(shi)別競(jing)賽提交13份(fen),而上(shang)一屆是35份;彼時(shi)Nvidia的(de)GPU已經通(tong)過CUDA改造初(chu)獲(huo)成功。算力+算法+數(shu)據三駕(jia)馬(ma)車(che)的(de)加持下,2012年(nian)Hinton帶隊(dui)開發AlexNet參(can)加ImageNet第三屆,一舉將錯誤率從上一屆的25%降(jiang)低了11%,高出第二(er)名41%,深度學習技術路線至此獲得(de)各界認可,得(de)以蓬勃(bo)發(fa)展。從這里我們可以總結:AI就是關于三駕(jia)馬車的事。
2、GPT的成(cheng)功:OpenAI做對了什么(me)?
過(guo)去十年, GPU算力持續發展下,但人工智(zhi)能算法(fa)變成了(le)瓶頸,深(shen)度學習例(li)如RNN在面向文本等任務時無法并行訓練(lian)等問題,模(mo)型(xing)參(can)數(shu)規(gui)模(mo)和訓練(lian)數(shu)據(ju)規(gui)模(mo)遇(yu)到瓶頸。
從下圖(tu)可見(jian),從2013年開(kai)始解決這些(xie)問題(ti)的基礎技(ji)術已經陸續具備,大模型誕生水到渠成。而為什么是OpenAI?OpenAI的GPT成(cheng)功做對(dui)了什么?簡(jian)單說就是在前人(主要是Google做了(le)(le)嫁衣)的(de)基礎上做了(le)(le)集成創新,選對了(le)(le)方向:利用模型來(lai)做序列(lie)化概(gai)率預(yu)測(ce)任務(wu)(即預(yu)測(ce)下一個Token),實現AI能(neng)力遷移學習(xi)能(neng)力和(he)多任(ren)務的泛化性(xing)。
圖:OpenAI的(de)成功:選(xuan)擇比努(nu)力重要
3、重塑(su)生產力:大模型如(ru)何改變世(shi)界?
在思考(kao)大(da)模(mo)型(xing)(xing)給行業和人類(lei)生活帶來改(gai)變之前,我們應該思考(kao)的是大(da)模(mo)型(xing)(xing)本身技術能(neng)(neng)力(li)(li)是什么。籠(long)統來說(shuo),大(da)模(mo)型(xing)(xing)能(neng)(neng)力(li)(li)包括:語言理解和表達能(neng)(neng)力(li)(li)、知識(shi)壓縮能(neng)(neng)力(li)(li)以及邏輯推(tui)理能(neng)(neng)力(li)(li)。類(lei)比(bi)人類(lei),前兩者讓大(da)模(mo)型(xing)(xing)可以實現記得(de)住、看得(de)懂,已經(jing)比(bi)較(jiao)成熟;推(tui)理能(neng)(neng)力(li)(li)是會思考(kao),是最重要的能(neng)(neng)力(li)(li)(通(tong)往AGI的(de)鑰匙(chi)),不過目前還有較大短板,OpenAI 最新發布的o1就是為了提升這個能力。
人類(lei)(lei)最大的技能(neng)是會使(shi)用工(gong)(gong)具。回(hui)顧幾次工(gong)(gong)業革(ge)命發展,都是圍繞使(shi)用新(xin)技術開發出更好的工(gong)(gong)具來賦能(neng)人類(lei)(lei)的能(neng)力,例如望遠鏡賦能(neng)眼、汽車飛機(ji)賦能(neng)腳、紡織機(ji)賦能(neng)手、計算機(ji)賦能(neng)腦等(deng)等(deng),這些工(gong)(gong)具本質上來講(jiang)是人類(lei)(lei)將目標任務的工(gong)(gong)作(zuo)規則,通過硬(ying)件或(huo)軟件的方式(shi)讓工(gong)(gong)具實現(xian)自(zi)動(dong)化(hua)(hua)或(huo)半自(zi)動(dong)化(hua)(hua),實現(xian)生產(chan)力躍遷(對(dui)應下圖中的模式(shi)二)。
圖(tu):當前生產力的三種勞動模式(shi)
而那些(xie)未能進行(xing)這(zhe)些(xie)改造升級的(de)勞(lao)動項目(mu)分(fen)為直接勞(lao)動型(對應(ying)模式(shi)一)和間接勞(lao)動型(對應(ying)模式(shi)二)。這(zhe)兩種(zhong)生(sheng)產模式(shi)依然需要人(ren)來(lai)完成,本質上都(dou)是(shi)在現有技術條件下還未能實(shi)現自動化的(de)工作,需要靠(kao)人(ren)與環境、與其(qi)他(ta)人(ren)進行(xing)信息(xi)交(jiao)換,這(zhe)個過程通常包(bao)含信息(xi)檢索(suo)獲取、信息(xi)分(fen)析加(jia)工和信息(xi)決策(ce),最后在物理(li)執行(xing)階段依靠(kao)人(ren)根據作業過程的(de)反饋來(lai)持續作業,無(wu)法(fa)被機器替代。
這類(lei)環節正是制約生產力的關鍵因素(su),總(zong)結起來有(you)三類(lei)制約:
(1)某些領域的專業知(zhi)識還停留在大(da)腦里(li),不能為計算機所學習和理(li)解;
(2)計算機(ji)接收后無法(fa)理(li)解、分析和判斷生產(chan)條件(jian)下(xia)的大量外部信息;
(3)物理世界未提供自動(dong)執行的“API”接口或者未(wei)具備與(yu)環境協(xie)同作業裝置(zhi)。
第(di)(3)點可(ke)以理解為何(he)當下各種(zhong)機(ji)器人(ren)產(chan)業(ye)如火如荼(tu),除(chu)了當前已(yi)經出現的掃地機(ji)器人(ren)、AGV和(he)工(gong)廠機(ji)械臂的(de)初(chu)級版(ban),未來具身智能保姆機(ji)器(qi)(qi)人(ren)、自動(dong)駕駛虛擬司機(ji)、搬運(yun)機(ji)器(qi)(qi)人(ren),以及更(geng)多不需要具身的(de)其他換進感(gan)知智能機(ji)器(qi)(qi),這些工(gong)作都是為了模式(shi)(shi)一和(he)模式(shi)(shi)三(san)提供物理執行(xing)階段的(de)裝置,可以說(shuo)解(jie)決模式(shi)(shi)一的(de)問題就是造更(geng)智能的(de)機(ji)器(qi)(qi)。
在講(1)(2)制(zhi)約(yue)之前(qian),我們詳細展開(kai)模式三分析一下,對腦力勞動者的(de)(de)工作(zuo)進行拆(chai)解,看看其中的(de)(de)勞動性質。除了臨時交辦(ban)事項(xiang),核心的(de)(de)工作(zuo)可以分為四類工作(zuo):資料(liao)收(shou)集、信息(xi)分析、決(jue)策制(zhi)定,任(ren)務督辦(ban)。這(zhe)個過(guo)程中會有大量的(de)(de)人與(yu)外界系統(tong)(計算(suan)機系統(tong)、物理世界和(he)人等(deng))進行的(de)(de)信息(xi)交換、群體(ti)的(de)(de)大量討論分析并(bing)迭(die)代、任(ren)務過(guo)程的(de)(de)信息(xi)收(shou)集跟催和(he)任(ren)務迭(die)代等(deng)等(deng),這(zhe)些工作(zuo)之所(suo)以還無法自動化,核心的(de)(de)原因(yin)就(jiu)如上所(suo)述存在的(de)(de)(1)(2)的問題。而(er)(1)(2)恰好屬于(yu)大模(mo)型(xing)擅長解決的領域(yu),能(neng)夠(gou)為腦力勞動者提供更多的腦力智能(neng)來提升、甚至(zhi)替代,從而提高(gao)勞動的效率和(he)效果。
至此,我們可以看出今天人工智(zhi)能(neng)產業技術研究方向的底層邏輯。
二、電力(li)(li)行業的生產力(li)(li)需求:圍繞人與電力(li)(li)系統,提升(sheng)效率和(he)能力(li)(li)的問(wen)題
電(dian)(dian)網行業是電(dian)(dian)力(li)系(xi)統(tong)的骨干,承擔著將電(dian)(dian)能從發電(dian)(dian)站輸送到千家(jia)萬戶的重要任務(wu),包括輸電(dian)(dian)、變電(dian)(dian)、配電(dian)(dian)和用電(dian)(dian)等(deng)關鍵(jian)環節。為了高(gao)效(xiao)地開(kai)展(zhan)這(zhe)些(xie)業務(wu),企(qi)業內部通常會設(she)立發展(zhan)、基建、調度、運(yun)檢、營銷、配電(dian)(dian)、物資等(deng)多個部門,以確保電(dian)(dian)力(li)系(xi)統(tong)的穩定運(yun)行和服(fu)務(wu)質量(liang)。
從生產力的角度來看,電網行業的行業特(te)點和痛點,可(ke)以(yi)籠統歸納(na)為兩個(ge)方面:
1. 業(ye)務龐(pang)大(da):地域(yu)廣、客戶多(duo)(duo)(duo)、設備多(duo)(duo)(duo)、從業(ye)人(ren)員多(duo)(duo)(duo)
• 地(di)域廣:從農(nong)村(cun)、郊(jiao)區到(dao)城市(shi),線纜(lan)和架空線路遍(bian)布全(quan)國各地(di);
• 客戶(hu)多:從家庭到(dao)企業(ye),事業(ye)單(dan)位等,幾乎(hu)都是電網的(de)直接客戶(hu);
• 設備多:大(da)量的(de)中樞(shu)變電(dian)站(zhan)、輸電(dian)線(xian)和開關柜等設施;
• 從(cong)業(ye)人員多:需要大量的營銷(xiao)、運檢等人員進行(xing)生(sheng)產(chan)作業;
2. 機理復雜:大電網(wang)、電氣化特(te)性等使得電網(wang)是一個復雜機理系統(tong)
• 復(fu)雜性的(de)(de)(de)現狀:電(dian)網(wang)是一(yi)個(ge)高度復(fu)雜的(de)(de)(de)人造物理系統(tong)(tong),涉及(ji)到電(dian)氣(qi)、機械、自動化(hua)等多(duo)個(ge)領域(yu)的(de)(de)(de)專業(ye)知識,人類目前(qian)主要從電(dian)網(wang)系統(tong)(tong)運(yun)行(xing)表征出來的(de)(de)(de)信息來與(yu)電(dian)網(wang)進行(xing)交互,包括調度方(fang)式計劃、設(she)備(bei)檢修和(he)用(yong)電(dian)計劃,而表征系統(tong)(tong)除了設(she)備(bei)的(de)(de)(de)物理外觀,還需(xu)要多(duo)個(ge)電(dian)氣(qi)方(fang)程進行(xing)計算(suan)(suan)(suan)(suan)或(huo)估(gu)算(suan)(suan)(suan)(suan),例如潮(chao)流計算(suan)(suan)(suan)(suan)、短(duan)路計算(suan)(suan)(suan)(suan)和(he)穩定計算(suan)(suan)(suan)(suan)等,通過分(fen)別(bie)的(de)(de)(de)計算(suan)(suan)(suan)(suan),最(zui)后面(mian)向特定任務進行(xing)專業(ye)決策,中(zhong)間還需(xu)要電(dian)力專家的(de)(de)(de)經(jing)驗進行(xing)過程干預以(yi)提升計算(suan)(suan)(suan)(suan)效率和(he)效果,所以(yi),這(zhe)個(ge)過程對人和(he)專業(ye)性有巨大的(de)(de)(de)依賴。
• 復雜性的(de)挑戰(zhan):如(ru)果電(dian)力系統保持不變,也許可以繼續(xu)沿(yan)用過去的(de)技術模式;但是隨(sui)著“源隨(sui)荷動”到“源網(wang)荷(he)儲互動”的(de)新型電(dian)力(li)系統(tong)升級(ji),地上一輛電(dian)動車,天上一朵云就可能會導(dao)致(zhi)電(dian)網(wang)的(de)電(dian)氣特性發(fa)生變化例(li)如(ru)線路負載(zai)越限,以(yi)及設備損壞例(li)如(ru)變壓器(qi)高負載(zai)導(dao)致(zhi)繞(rao)阻溫度發(fa)生過高,需(xu)要秒級(ji)對(dui)事件進行感(gan)知、分析(xi)和決策,這是(shi)當前的(de)電(dian)網(wang)技術體系下的(de)工作模式無(wu)法應對(dui)的(de)。
所以,站在(zai)生產(chan)力的角度看:
-電(dian)網業務龐大需要大量的從業人員參與勞動過程(cheng),是效率提升的問題;
-電網(wang)機理復雜需(xu)要專業人員參與且(qie)仍(reng)有提升需(xu)求,是(shi)能力提升的(de)問(wen)題。
三、大模型+電(dian)力行業:從(cong)易到(dao)難、從(cong)外而(er)內提(ti)升(sheng)電(dian)力行業生產力
針對以上提到的電網業務現狀和提升(sheng)需(xu)求,以第一章所(suo)述大(da)模(mo)型(xing)如(ru)何提升(sheng)生產力(li)(li)為方向,同時結合各類大(da)模(mo)型(xing)技術的成熟(shu)度和能力(li)(li)特性,思考應用大(da)模(mo)型(xing)提升(sheng)電網生產力(li)(li)的思路(lu),主(zhu)要(yao)包括兩個方面(mian):
1、作業(ye)效率提升(sheng)方面(mian)。
如前所述(shu),業務(wu)域大(da)是制約生(sheng)產力(li)的(de)效率因素,需要人進行相對模式重復性工作,可(ke)以從大(da)模型(xing)能力(li)角度分為(wei)兩(liang)個方(fang)面(mian):
(1)結合(he)大語言模型解決信息處理任(ren)務
當前最成熟(shu)的(de)大語言模型(Large Language Model)具(ju)備較(jiao)成熟的(de)語言理解和表達能(neng)(neng)(neng)力、知(zhi)識(shi)壓(ya)縮能(neng)(neng)(neng)力,以(yi)(yi)及初級邏輯推理能(neng)(neng)(neng)力,可以(yi)(yi)幫(bang)助調(diao)度、運檢(jian)班組(zu)長、設備主人(ren)、電(dian)網規(gui)劃專家、物資(zi)采購、辦公人(ren)員等崗位人(ren)員完成信息(xi)收集、信息(xi)分析、決策制定(ding)和流(liu)程督辦,需要將大模型的(de)能(neng)(neng)(neng)力(RAG、Agent、Prompt以(yi)及必(bi)要的(de)預訓(xun)練(lian)微調(diao)等)和(he)業(ye)務(wu)場(chang)景(jing)深度(du)融合,把業(ye)務(wu)專家的(de)工作技能遷(qian)移到大(da)模型上。從技術的(de)角(jiao)度(du)上,今天大(da)模型的(de)能力初步具備(bei),重點是大(da)模型與場(chang)景(jing)結合的(de)AI工程化。
(2)應用(yong)多(duo)模態大模型解決環境感知分析任務
電網有大量的(de)設(she)備(bei)需要(yao)運維、檢修和檢測(ce)試驗,這些場(chang)(chang)景需要(yao)與物理環境進(jin)行(xing)信息(xi)交(jiao)換,包括體(ti)力勞動(dong)(dong)和腦力勞動(dong)(dong)。體(ti)力勞動(dong)(dong)主要(yao)是(shi)現場(chang)(chang)數據采(cai)集(ji)(ji)獲取,但自動(dong)(dong)化采(cai)集(ji)(ji)技術已經比較(jiao)完善(shan),例(li)如運維巡視的(de)視頻(pin)圖(tu)片的(de)采(cai)集(ji)(ji)、現場(chang)(chang)作業面的(de)視頻(pin)采(cai)集(ji)(ji)、設(she)備(bei)聲紋錄波、五遙信息(xi)等都(dou)能夠采(cai)集(ji)(ji)。
關鍵的瓶頸在于沒有直接的技術手(shou)段對這些數據進行解(jie)析(xi)(特別(bie)是現場即刻處理),以及解(jie)析(xi)后的相關聯動分析(xi)和處置決策,所(suo)以這些作(zuo)業除了巡視缺陷識別(bie)目前應用視覺(jue)識別(bie)模型外,其他大(da)多(duo)無法離(li)開對應的專業人員進行現場或電腦前的參(can)與。而多(duo)模態大(da)模型(Large Multimodal Model)利用萬物皆可Transformer的(de)(de)思想,實(shi)現了對(dui)多(duo)模(mo)態(tai)(tai)數(shu)據與(yu)大(da)(da)語言(yan)模(mo)型的(de)(de)融合,端(duan)到(dao)端(duan)解決了從感知采(cai)集感知理解到(dao)信息(xi)認知分析的(de)(de)問題。可以展望(wang),在多(duo)模(mo)態(tai)(tai)大(da)(da)模(mo)型與(yu)變電站(zhan)巡(xun)(xun)視等領域知識結合后,今天的(de)(de)變電站(zhan)智巡(xun)(xun)攝像(xiang)頭、無人機的(de)(de)單模(mo)態(tai)(tai)為主的(de)(de)執行巡(xun)(xun)視,將會在未來變成以自動化機器人為主的(de)(de)形式,實(shi)現變電站(zhan)無人化的(de)(de)“望聞問(wen)切(qie)”全天候巡視。
不過(guo),由(you)于當前(qian)多(duo)模(mo)(mo)態大模(mo)(mo)型采用CLIP思想的對比學習方法,需要的半(ban)合成(cheng)樣本(ben)數量是圖像識別模型(xing)的百倍千倍,這(zhe)些樣本(ben)數據不像LLM預訓練(lian)時可(ke)以完(wan)全無標注的自(zi)監督訓練(lian),而是(shi)需要根據(ju)使用場(chang)景(jing)對圖像/視頻等模態樣本(ben)進行自動/半自(zi)動標注,并(bing)且需要輔以一(yi)定的審核工作(zuo),所以樣本的數量和質量是(shi)瓶頸,算力和算法(fa)沒問(wen)題。如何突(tu)破,從技術還是(shi)數據角度(du),還是(shi)兩者結合(he),尚有待觀察。
2、電網專業(ye)能(neng)力提升方面
隨同諾貝爾物理獎一同頒發的其(qi)他獎項,諾貝爾化學獎頒發給了DeepMind的Demis Hassabis 和John Michael Jumper,以表彰(zhang)其利用在AlphaFold在蛋白(bai)質結構(gou)預(yu)測方面的貢獻,AlphaFold2完成了(le)98.5%的人類(lei)蛋白質的預測,而過(guo)去數十(shi)年人類(lei)只預測了人類(lei)蛋白質的17%。AlphaFold工作原理粗淺(qian)的說是把蛋白(bai)質折疊紋路(lu)序列化Embedding到(dao)Transformer中(zhong),結合StableDiffusion進行的蛋白質折疊的序列預測,具體可以見原(yuan)理介紹[2]。可見大(da)模(mo)型技術除了解(jie)決(jue)文字信息和感知(zhi)信息的處理理解(jie)外,還可以結合專(zhuan)(zhuan)業(ye)領域(yu)定(ding)制專(zhuan)(zhuan)用大(da)模(mo)型,來顛覆(fu)性解(jie)決(jue)行業(ye)大(da)難題。所以,可以(yi)預見AI4S(AI For Science)未來將(jiang)成為AI領域的(de)(de)重(zhong)要賽道,成(cheng)為科研第四范式(shi)時代、科學發現的(de)(de)奇點,以(yi)后科學成(cheng)果的(de)(de)涌現將呈現指數(shu)級(ji)增長(chang)。
回顧第(di)2章所(suo)述,電(dian)網的機理復雜(za)性,幾(ji)乎不可能靠大語言模型和多模態大模型來完成,在電(dian)網領域,通過構建一(yi)個基(ji)于Transformer架構(gou)的(de)行業大模型,可以重(zhong)構(gou)電網(wang)分析方(fang)法(fa),實現更高效(xiao)、更準(zhun)確的(de)電網(wang)管(guan)理和(he)優化(hua)。
以(yi)電(dian)(dian)網(wang)的(de)(de)動態(tai)(tai)電(dian)(dian)氣(qi)量指標的(de)(de)分(fen)(fen)析(xi)為(wei)例,它(ta)是(shi)電(dian)(dian)網(wang)運行狀態(tai)(tai)評估的(de)(de)關鍵,傳統分(fen)(fen)析(xi)方法面(mian)臨(lin)復雜(za)性(xing)(xing)增加、仿真(zhen)計(ji)(ji)算量大(da)耗時(shi)過(guo)長、穩(wen)定(ding)性(xing)(xing)定(ding)義局限性(xing)(xing)、設(she)備動態(tai)(tai)特性(xing)(xing)難以(yi)準確刻畫、不確定(ding)性(xing)(xing)考量缺(que)失、實時(shi)量測(ce)限制和(he)非線性(xing)(xing)約束考慮不足等問題,一(yi)定(ding)程度上困(kun)擾著(zhu)電(dian)(dian)網(wang)的(de)(de)安全經濟穩(wen)定(ding)運行目標。并(bing)且,整個分(fen)(fen)析(xi)過(guo)程是(shi)多個算法分(fen)(fen)布計(ji)(ji)算,最后如何(he)把結果進行決策和(he)組(zu)合(he)計(ji)(ji)算,還要考慮電(dian)(dian)力分(fen)(fen)析(xi)的(de)(de)多次迭代,這(zhe)個過(guo)程的(de)(de)復雜(za)度和(he)效(xiao)率(lv)可想(xiang)而知。這(zhe)個過(guo)程也非常類似與(yu)過(guo)去NLP幾十年無(wu)法突(tu)破(po)的問題:傳(chuan)統NLP思想是(shi)把實體識別(bie)、詞性(xing)標注、情感分析等十(shi)幾個不同的(de)任務,在最后面向具體應用的(de)時候(hou)進行組裝(zhuang),這種架構下,從訓練到推理的(de)迭(die)代過程中的(de)優化(hua)就是(shi)一場災難,而大模型(xing)的(de)特點是(shi)多任務合一,端(duan)到端(duan)解決問題(ti),值得借鑒。
以訓練電網(wang)分析行業(ye)大模型為目標(biao),我們可以將電網(wang)中的(de)電壓(ya)、電流、負荷等(deng)基礎(chu)數(shu)據,以及有功(gong)功(gong)率、無功(gong)功(gong)率等(deng)功(gong)率類數(shu)據,通過特(te)定特(te)征提取方法構造序列化(hua)數(shu)據,輸入到(dao)Transformer架構中(zhong),面向預測電網的(de)短期(qi)態(tai)勢(shi)感知和長期(qi)運行趨勢(shi)分(fen)析等任務,例(li)如,通過(guo)分(fen)析電網的(de)功率因素識(shi)別出(chu)無(wu)功消(xiao)耗較大(da)的(de)區域,并提出(chu)相應的(de)優化措施,通過(guo)編(bian)解碼架構的(de)“預(yu)測(ce)”能力,輸出預期(qi)的分析結果。通過這樣的方式(shi),可以用一個算法架構實現對(dui)大電(dian)網海(hai)量(liang)數(shu)據的訓練吞(tun)吐能力、大量(liang)電(dian)氣特征(zheng)的表達(da)能力,以及基于多頭注意(yi)力機制(zhi)對(dui)用戶預期(qi)任(ren)務目(mu)標的精準“理(li)解” 。
其他的(de)例如電(dian)網(wang)穩(wen)定運(yun)行、電(dian)力系統建(jian)模與(yu)(yu)分(fen)析、調度與(yu)(yu)暫態(tai)分(fen)析、保護與(yu)(yu)控制等方面,亦可以參(can)考(kao)類似的(de)算法思想進行創新研發。當然,這個過程將會非常復雜艱辛(xin),未(wei)來如何落地(di),還(huan)需要業業內各(ge)界共同探索和實踐。
另外,還有(you)(you)相(xiang)對成(cheng)熟的時序大模型,可(ke)以開展一些預測任(ren)務,例如天氣預測、負荷預測等場景,目(mu)前也正(zheng)在技術結合場景落(luo)地中,預期會有(you)(you)一些成(cheng)效。
四、實踐心得(de):大模型應用如何少走彎路
社會各行(xing)各業如火如荼嘗試應(ying)用(yong)大模型技術,浙達能(neng)源以能(neng)源+AI為(wei)目標,也投身其(qi)中。行業+大(da)模型應用剛剛起(qi)步,如(ru)何避免失敗是重中之(zhi)重,經過大(da)量項(xiang)目的實踐,我們總結產業+大(da)(da)模型(xing)的過程(cheng)中的部分思(si)考和心得,供大(da)(da)家(jia)參考。
寫在最后
以GPT為代表的大(da)模型技術從(cong)2018年推(tui)出,2022年底爆火,到今(jin)天2024年行(xing)業普遍入局試水,已(yi)經過去6個年頭。任何一項(xiang)新技(ji)術(shu)提出(chu),都需要時間,時間讓技(ji)術(shu)迭代完善,讓先(xian)行者進行業(ye)務(wu)創新磨合,讓普羅大(da)眾逐步了(le)解、接受(shou)和使用。大(da)模型技(ji)術(shu)由于幻覺不(bu)可避免性、工業(ye)容錯(cuo)率低等等問題,時至今(jin)日不(bu)乏質疑、顧慮和觀望,但路已在(zai),也(ye)許今(jin)天大(da)模型技(ji)術(shu)亦如Hinton教授2007提(ti)出(chu)的深度學(xue)習框架一樣,從平凡而生。
[1] Hinton, G. E. and Salakhutdinov, R. R.Reducing the dimensionality of data withneural networks. Science, Vol. 313. no.5786, pp.504-507, 28 July 2006.
[2] 深入(ru)剖析AlphaFold算法,知(zhi)乎,//zhuanlan.zhihu.com/p/39369976