【ZiDongHua 之“自動(dòng)化學(xué)院派”收錄關(guān)鍵詞:鐵路通信信號(hào)工程技術(shù)  人工智能   大語(yǔ)言模型微調(diào)   思維鏈   鐵路信號(hào)】

【新文速遞】鐵路信號(hào)故障分析領(lǐng)域大語(yǔ)言模型微調(diào)方法

   

《鐵路通信信號(hào)工程技術(shù)》公眾號(hào)“新文速遞”欄目,讓您第一時(shí)間,快速獲取鐵路通信信號(hào)領(lǐng)域的前沿技術(shù),迅速掌握鐵路行業(yè)最新動(dòng)態(tài)。
        請(qǐng)您與《鐵路通信信號(hào)工程技術(shù)》期刊并肩同行,共同見證鐵路通信信號(hào)技術(shù)的每一步堅(jiān)實(shí)進(jìn)展。

 

鐵路信號(hào)故障分析領(lǐng)域大語(yǔ)言模型微調(diào)方法

孫 超1,2,李涵蕊1,2,丁子煥1,2

1.北京全路通信信號(hào)研究設(shè)計(jì)院集團(tuán)有限公司,北京 100070;

2.列車自主運(yùn)行智能控制鐵路行業(yè)工程研究中心,北京 100070

摘要:為提升鐵路信號(hào)設(shè)備故障分析的智能化水平,提出一種針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語(yǔ)言模型微調(diào)方法。采用低秩微調(diào)(Low-Rank Adaptation,LoRA)實(shí)現(xiàn)參數(shù)高效微調(diào),降低訓(xùn)練成本;融入拓?fù)渌季S鏈(CoT)構(gòu)建故障因果推理框架,增強(qiáng)模型思維邏輯可解釋性;外掛故障知識(shí)庫(kù)并通過檢索增強(qiáng)機(jī)制,提升術(shù)語(yǔ)識(shí)別與知識(shí)適配性。實(shí)驗(yàn)表明,該方法使故障板卡信息提取準(zhǔn)確率較基線模型提升11.2%,推理時(shí)間減少52%;在推理時(shí)間相當(dāng)?shù)那闆r下,該方法準(zhǔn)確率較傳統(tǒng)微調(diào)方法提升2.5%;跨域遷移場(chǎng)景下模型準(zhǔn)確率提升42.6%,展現(xiàn)強(qiáng)泛化能力。通過技術(shù)融合與知識(shí)增強(qiáng),該方法有效解決傳統(tǒng)方法的效率與泛化瓶頸,顯著提升故障分析的準(zhǔn)確率、效率及領(lǐng)域適應(yīng)性,為鐵路信號(hào)智能運(yùn)維提供技術(shù)支撐,推動(dòng)人工智能技術(shù)在軌道交通場(chǎng)景的工程化落地,具有突出的應(yīng)用價(jià)值與創(chuàng)新突破。

關(guān)鍵詞:人工智能;大語(yǔ)言模型微調(diào);思維鏈;知識(shí)檢索增強(qiáng);鐵路信號(hào)

中圖分類號(hào)U284; TP18

 
 
基金項(xiàng)目:中國(guó)國(guó)家鐵路集團(tuán)有限公司科技研究開發(fā)計(jì)劃重點(diǎn)課題項(xiàng)目(N2023G081)

第一作者:孫超(1982—),男,高級(jí)工程師,碩士,主要研究方向:軌道交通裝備RAMS設(shè)計(jì)、列車運(yùn)行控制及系統(tǒng)健康管理(PHM),郵箱:sunchao@crscd.com.cn。

 
 
 
 
 

1 概述

鐵路信號(hào)系統(tǒng)故障記錄表涵蓋故障發(fā)生位置、故障現(xiàn)象描述及故障處理措施等核心要素,既是開展設(shè)備狀態(tài)評(píng)估與可靠性分析的重要基礎(chǔ),也是科學(xué)制定維修計(jì)劃的關(guān)鍵依據(jù)。目前大部分故障記錄數(shù)據(jù)分析多依賴于人工逐條標(biāo)注分析。然而,隨著設(shè)備運(yùn)維數(shù)據(jù)規(guī)模的持續(xù)擴(kuò)張,海量故障記錄數(shù)據(jù)資源利用率長(zhǎng)期處于較低水平。自然語(yǔ)言處理方法憑借其強(qiáng)大的語(yǔ)義理解與分析能力,逐漸成為故障數(shù)據(jù)分析領(lǐng)域的研究熱點(diǎn)與重要技術(shù)方向。

現(xiàn)階段,主流自然語(yǔ)言處理方式仍以半自動(dòng)化為主,如胡小溪等人將模糊標(biāo)注的新詞融合既有詞庫(kù)形成特定線路信號(hào)專用詞庫(kù);Lei等人提出結(jié)合主題模型與支持向量機(jī)(SVM)方法,實(shí)現(xiàn)了鐵路信號(hào)故障記錄數(shù)據(jù)分類;Kang等人提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品故障抽取方法,將故障實(shí)體識(shí)別視為多元分類問題以不平衡的故障數(shù)據(jù)。上述文獻(xiàn)中人工操作的路徑依賴,不僅可能導(dǎo)致模型泛化性能不足,還會(huì)造成模型智能性與自主性的缺失。目前,主動(dòng)學(xué)習(xí)作為一種能夠有效減少人工干預(yù)、提升模型自主學(xué)習(xí)能力的方法,正在受到廣泛關(guān)注。Xiao等人研究了在多個(gè)尺度上自動(dòng)提取各種特征,通過使用故障數(shù)據(jù)在智能體和環(huán)境之間進(jìn)行廣泛的交互,提高了故障分類過程的智能性。張奕林等人提出了一種基于BERT的短文本分類模型和知識(shí)圖譜結(jié)合的故障定位方法,以充分挖掘鐵路CIR設(shè)備文本數(shù)據(jù)。在BERT方法基礎(chǔ)上,Lin等人提出了一種基于RoBERTa-wwm的鐵路信號(hào)設(shè)備故障信息實(shí)體識(shí)別方法,有效提高了識(shí)別準(zhǔn)確率。

隨著大語(yǔ)言模型(Large Language Model,LLM)的發(fā)展,無(wú)監(jiān)督自主學(xué)習(xí)方法逐步邁向新的高度。以DeepSeek、GPT-4、LlaMA等為代表的通用領(lǐng)域LLM,已展現(xiàn)出突破自然語(yǔ)言處理傳統(tǒng)方法局限性的強(qiáng)大潛力。因此,上述研究方向也開始利用LLM技術(shù)方法輔助文本分析,應(yīng)用于文本分類、實(shí)體識(shí)別和對(duì)話問答等任務(wù),實(shí)現(xiàn)對(duì)目標(biāo)的語(yǔ)義快速解析和高效處理。但預(yù)訓(xùn)練模型面臨對(duì)象特化度高、數(shù)據(jù)適應(yīng)性不足、場(chǎng)景泛化能力薄弱等問題,使其難以直接應(yīng)用于鐵路行業(yè)實(shí)際情景。目前,針對(duì)軌道交通領(lǐng)域的專用大模型和人工智能領(lǐng)域已取得一定研究成果,例如TransGPT交通大模型、UrbanGPT智慧城市大模型,UniST城市時(shí)空預(yù)測(cè)大模型和智能化區(qū)域協(xié)同等。但是面向故障文本數(shù)據(jù)分析這一特定任務(wù)的研究仍處于探索階段,相關(guān)成果尚不夠系統(tǒng)和深入。

為解決上述問題,本文提出了一種針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語(yǔ)言模型微調(diào)方法,采用LoRA技術(shù)實(shí)現(xiàn)模型參數(shù)微調(diào),并在微調(diào)過程中添加基于“故障現(xiàn)象-故障影響-處理措施”拓?fù)渌季S鏈,將設(shè)備故障的因果邏輯推理過程融入模型訓(xùn)練,構(gòu)建多維度語(yǔ)義關(guān)聯(lián)的深度表征空間。此外,通過外掛信號(hào)設(shè)備故障知識(shí)庫(kù)的技術(shù)路徑,建立領(lǐng)域?qū)I(yè)知識(shí)與模型輸出的動(dòng)態(tài)映射機(jī)制,從而提升故障分析結(jié)果的準(zhǔn)確性與可靠性,為后續(xù)數(shù)據(jù)記錄表的智能總結(jié)、統(tǒng)計(jì)分析及決策支持提供技術(shù)支撐。

2 領(lǐng)域大語(yǔ)言模型微調(diào)方法

針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù),提出領(lǐng)域大語(yǔ)言模型微調(diào)方法,增強(qiáng)模型語(yǔ)義學(xué)習(xí)、邏輯推理能力與分析結(jié)果的準(zhǔn)確性。主要流程包括基于因果推理思維鏈的分析任務(wù)訓(xùn)練集構(gòu)建、LoRA模型微調(diào)訓(xùn)練和融合外掛知識(shí)庫(kù)的故障分析任務(wù)處理3個(gè)步驟,如圖1所示。

 
 
 
 
圖片
 
 
 
 

1)數(shù)據(jù)輸入預(yù)處理與訓(xùn)練集構(gòu)建

將鐵路信號(hào)設(shè)備故障歷史數(shù)據(jù)通過數(shù)據(jù)預(yù)處理操作整理成結(jié)構(gòu)化故障數(shù)據(jù),形成樣本庫(kù)。結(jié)合具體故障分析任務(wù)要求,構(gòu)建針對(duì)特定任務(wù)的基于因果邏輯思維鏈的微調(diào)訓(xùn)練集。

2)LoRA微調(diào)訓(xùn)練

針對(duì)預(yù)訓(xùn)練大模型底座,以融合思維鏈的訓(xùn)練集為數(shù)據(jù)輸入,采用基于規(guī)則的低秩適應(yīng)(LoRA)微調(diào)技術(shù),通過調(diào)整學(xué)習(xí)率、正則化系數(shù)等超參數(shù)完成大模型在特定任務(wù)上的微調(diào)訓(xùn)練,并以準(zhǔn)確率、召回率、F0.5分?jǐn)?shù)等指標(biāo)評(píng)估大模型性能。

3)任務(wù)推理檢索增強(qiáng)

基于微調(diào)訓(xùn)練后的鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析大模型,以故障分析相關(guān)任務(wù)為輸入,通過外掛故障知識(shí)庫(kù)實(shí)現(xiàn)任務(wù)推理的檢索增強(qiáng),最終輸出任務(wù)推理結(jié)果。

2.1 基于故障因果邏輯的思維鏈生成

在構(gòu)建鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域大模型微調(diào)訓(xùn)練集的過程中,需要編寫合適的提示詞作為訓(xùn)練集的輸入數(shù)據(jù),稱之為提示學(xué)習(xí)。本文在大模型的提示學(xué)習(xí)中采用了基于因果邏輯的思維鏈方法,通過語(yǔ)義連貫性優(yōu)化與邏輯結(jié)構(gòu)增強(qiáng)策略,提升輸入提示的自然語(yǔ)言表達(dá)質(zhì)量,有效引導(dǎo)模型構(gòu)建更清晰的上下文線索與推理路徑,從而在后續(xù)推理任務(wù)適配中實(shí)現(xiàn)更精準(zhǔn)的語(yǔ)義理解與知識(shí)整合。

在鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域大模型特定任務(wù)微調(diào)的過程中,基于因果邏輯的思維鏈方法通過構(gòu)建分層推理框架,將復(fù)雜的領(lǐng)域內(nèi)故障分析等自然語(yǔ)言處理任務(wù)解耦為可解釋的邏輯鏈條,然后,在訓(xùn)練集的輸入序列中植入包含多步推理路徑的標(biāo)注示例,引導(dǎo)預(yù)訓(xùn)練模型建立從故障現(xiàn)象到根因分析的可追溯思維過程。以故障板卡實(shí)體識(shí)別任務(wù)的思維鏈微調(diào)訓(xùn)練過程為例,如圖2所示。

 
 
 
 
圖片
 
 
 
 

可以看出,基于因果邏輯的思維鏈提示學(xué)習(xí)訓(xùn)練集與傳統(tǒng)大模型訓(xùn)練集的本質(zhì)區(qū)別在于領(lǐng)域知識(shí)表征的顆粒度和邏輯推理過程的透明度。在上下文學(xué)習(xí)過程中,CoT范式不僅提供輸入輸出對(duì),更構(gòu)建了包含鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域故障分析等任務(wù)專屬推理規(guī)則的中間邏輯層。這使得領(lǐng)域知識(shí)結(jié)構(gòu)化,將分析過程分解為多步可解釋的推理單元,并且基于動(dòng)態(tài)推理引導(dǎo),通過顯式標(biāo)注推理依據(jù),迫使模型在生成答案前進(jìn)行分層邏輯校驗(yàn),提高推理答案的準(zhǔn)確率。同時(shí),利用認(rèn)知路徑對(duì)齊,模擬領(lǐng)域?qū)<业脑u(píng)估分析思維過程,建立從現(xiàn)象到根因的可追溯推理鏈條。

2.2 基于規(guī)則的LoRA微調(diào)技術(shù)

2.2.1 大模型底座

本文使用的大模型底座為DeepSeek預(yù)訓(xùn)練模型,在訓(xùn)練任務(wù)上構(gòu)造了自回歸的空格填充任務(wù),其基本架構(gòu)為Transformer架構(gòu),如圖3所示,由若干個(gè)編碼器和解碼器相互疊加而成。從組成結(jié)構(gòu)上看,每個(gè)編碼器和解碼器均由前饋全連接模塊(Feed Forward Network,F(xiàn)FN)和多頭自注意力模塊(Multi-head Self-Attention,MSA)這兩大基礎(chǔ)模塊組合而成。

其中,自注意力(Self-Attention,SA)模塊是Transformer架構(gòu)中的基礎(chǔ)組件。具體來講,SA通過3個(gè)可學(xué)習(xí)的線性映射矩陣WQWK、WV,將輸入序列投影為一組查詢Q、鍵K和值V,通過另一個(gè)線性映射矩陣Wo實(shí)現(xiàn)輸出變換,其中:

查詢矩陣(WQ)負(fù)責(zé)生成自主提示特征向量,定義注意力搜索范圍;

鍵矩陣(WK)構(gòu)建非自主提示特征向量,標(biāo)識(shí)被匹配的關(guān)鍵特征;

值矩陣(WV)存儲(chǔ)實(shí)體固有特征向量,與鍵矩陣形成語(yǔ)義關(guān)聯(lián);

輸出變換矩陣(Wo)通過特征交互矩陣實(shí)現(xiàn)多頭輸出的融合轉(zhuǎn)換。

在對(duì)輸入序列和輸出序列進(jìn)行線性變換的過程中,SA能夠捕捉輸入序列的語(yǔ)義特征及遠(yuǎn)距離依賴關(guān)系,并在輸出生成式序列時(shí)結(jié)合捕捉到的語(yǔ)義特征。而MSA模塊則是SA的擴(kuò)展形式,由n個(gè)自注意力頭組合而成。

FFN模塊的構(gòu)成則包含兩個(gè)線性層及激活函數(shù)。在結(jié)構(gòu)設(shè)計(jì)上,MSA模塊和FFN模塊均引入了殘差連接與層歸一化(Layer Normalization,LN),如公式(1)所示。

公式(1)中:x0表示初始輸入序列,即原始數(shù)據(jù)經(jīng)過預(yù)處理后形成的符號(hào)序列;xpos表示位置嵌入向量,用于為模型提供序列的位置信息,彌補(bǔ)自注意力機(jī)制對(duì)順序不敏感的缺陷;yk表示第k個(gè)MSA模塊經(jīng)LN處理后的輸出序列;xk-1xk分別表示第k-1和第k個(gè)FFN模塊經(jīng)LN處理后的輸出表征,其整合了前面全部線性層的語(yǔ)義信息與位置關(guān)系。

2.2.2 LoRA微調(diào)技術(shù)

微調(diào)過程是在基礎(chǔ)模型架構(gòu)上,通過數(shù)據(jù)集對(duì)模型參數(shù)進(jìn)行任務(wù)導(dǎo)向的調(diào)參,結(jié)合領(lǐng)域內(nèi)標(biāo)注數(shù)據(jù)進(jìn)行定向優(yōu)化,最終實(shí)現(xiàn)故障分析精準(zhǔn)推理。本文采用基于規(guī)則的LoRA方法實(shí)現(xiàn)預(yù)訓(xùn)練模型在鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域的微調(diào)。首先,基于目前收集到的領(lǐng)域內(nèi)的原始數(shù)據(jù),結(jié)合具體任務(wù)規(guī)則要求,設(shè)計(jì)特定任務(wù)的訓(xùn)練集。其中,針對(duì)訓(xùn)練樣本(xy),其中x代表輸入序列,y代表與任務(wù)相關(guān)的標(biāo)簽,即輸出序列。大模型微調(diào)的目標(biāo)就是最小化以下?lián)p失函數(shù),如公式(2)所示。

圖片

公式(2)中:L' (θ)表示微調(diào)更新后的損失函數(shù);θ表示模型參數(shù);E表示函數(shù)的期望值;P (y|x;θ)表示在給定輸入序列x和模型參數(shù)θ的條件下,生成標(biāo)簽y的概率。

為了微調(diào)大模型以適應(yīng)鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域的特定任務(wù),設(shè)定以下優(yōu)化目標(biāo),如公式(3)所示。

圖片

公式(3)中:θ*表示經(jīng)LoRA微調(diào)后的模型參數(shù);L' (θ)表示針對(duì)鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域任務(wù)相關(guān)數(shù)據(jù)的損失函數(shù);λ表示正則化系數(shù);R(θ)表示正則化項(xiàng),將其設(shè)置為模型參數(shù)的L2范數(shù)。

針對(duì)鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域的故障分析NLP任務(wù),結(jié)合根據(jù)專家經(jīng)驗(yàn)和歷史數(shù)據(jù)制定的領(lǐng)域規(guī)則,進(jìn)行任務(wù)適配輸入編碼(Task-adaptive Input Encoding),對(duì)輸入文本序列x進(jìn)行結(jié)構(gòu)化轉(zhuǎn)換,以引導(dǎo)預(yù)訓(xùn)練模型關(guān)注關(guān)鍵信息。以故障分類任務(wù)為例,將故障現(xiàn)象描述與故障類別數(shù)據(jù)整合為統(tǒng)一輸入序列,通過插入領(lǐng)域特定分隔符(如“[FAULT]”)明確區(qū)分問題類型與上下文信息。

最后,采用參數(shù)凍結(jié)策略固定預(yù)訓(xùn)練模型的基礎(chǔ)權(quán)重,在保持基礎(chǔ)參數(shù)固定的前提下,通過嵌入輕量級(jí)適配網(wǎng)絡(luò)層,并僅對(duì)新增網(wǎng)絡(luò)層內(nèi)的參數(shù)進(jìn)行訓(xùn)練優(yōu)化,實(shí)現(xiàn)大模型的LoRA微調(diào)。以故障板卡實(shí)體識(shí)別任務(wù)為例,通過在預(yù)訓(xùn)練語(yǔ)言模型頂部添加故障特征提取器,僅需更新少量參數(shù)即可實(shí)現(xiàn)對(duì)故障實(shí)體的精準(zhǔn)適配和識(shí)別。

LoRA微調(diào)在訓(xùn)練過程中通過固定預(yù)訓(xùn)練模型參數(shù),在Transformer架構(gòu)的每一層中植入可訓(xùn)練的低秩分解矩陣,即在多頭自注意力模塊中,將WQ、WK、WVWo這4個(gè)核心參數(shù)視為維度dmodel×dmodel的統(tǒng)一參數(shù)空間,這一參數(shù)空間就構(gòu)成了公式(3)中的優(yōu)化目標(biāo)θ*。

通過在每個(gè)注意力頭的輸入輸出空間引入秩分解矩陣ΔW,在保持原始預(yù)訓(xùn)練模型參數(shù)凍結(jié)的前提下,以極小的計(jì)算代價(jià)實(shí)現(xiàn)模型的領(lǐng)域適配。以預(yù)訓(xùn)練模型的權(quán)重矩陣Wo為例,可以讓其參量的更新用低秩分解來表示后者的約束,如公式(4)所示。

圖片

其中:WoRd×k,BRd×r,ARr×k

此時(shí),由于新增的秩r遠(yuǎn)小于min(d,k),修正后的正向傳播計(jì)算,如公式(5)所示。

圖片

在LoRA微調(diào)框架下,Wo保持參數(shù)凍結(jié)狀態(tài),僅對(duì)低秩分解矩陣AB實(shí)施梯度更新。如圖4所示,本文在進(jìn)行基于規(guī)則的LoRA微調(diào)時(shí),對(duì)低秩分解矩陣A使用隨機(jī)高斯初始化,對(duì)B則使用零初始化,因此ΔWBA在訓(xùn)練開始時(shí)為0。

在Transformer架構(gòu)的每一層實(shí)施LoRA微調(diào)策略,有效壓縮模型微調(diào)所需的參數(shù)規(guī)模。在故障板卡實(shí)體識(shí)別、故障原因分類等鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域典型任務(wù)中,該方法僅需維護(hù)參數(shù)矩陣WWoBA的動(dòng)態(tài)合成,即可在后續(xù)任務(wù)問答推理階段保持與原始模型一致的計(jì)算流程。

2.3 知識(shí)庫(kù)檢索增強(qiáng)的任務(wù)推理

為提高故障數(shù)據(jù)分析任務(wù)的準(zhǔn)確率和專業(yè)度,在輸入查詢的內(nèi)容中將外掛故障知識(shí)庫(kù)融入故障分析相關(guān)任務(wù)輸入,實(shí)現(xiàn)大模型任務(wù)推理時(shí)的知識(shí)檢索增強(qiáng)。

構(gòu)建鐵路信號(hào)設(shè)備故障分析特征知識(shí)庫(kù),通過對(duì)歷史故障數(shù)據(jù)進(jìn)行深度分析處理、總結(jié)提煉和專家審核,獲取專業(yè)名詞、故障信息和改正措施等知識(shí),有效彌補(bǔ)大模型知識(shí)更新不及時(shí)和特定領(lǐng)域知識(shí)不足的缺陷。利用詞嵌入技術(shù)將特征知識(shí)庫(kù)中的自然語(yǔ)言數(shù)據(jù)轉(zhuǎn)換為詞向量,實(shí)現(xiàn)知識(shí)的數(shù)值化表示。

在模型任務(wù)推理時(shí),動(dòng)態(tài)融合外掛故障知識(shí)庫(kù)的詞向量和任務(wù)輸入,使模型能夠從知識(shí)庫(kù)中檢索相關(guān)信息,給出更準(zhǔn)確、專業(yè)的回答。知識(shí)庫(kù)支持在線更新,新增案例經(jīng)向量化后可直接注入檢索通道,構(gòu)建閉環(huán)優(yōu)化機(jī)制,確保知識(shí)庫(kù)隨運(yùn)營(yíng)數(shù)據(jù)增長(zhǎng)不斷進(jìn)化,始終保持時(shí)效性和準(zhǔn)確性。

3 案例分析和驗(yàn)證

3.1 數(shù)據(jù)集構(gòu)建

通過前期調(diào)研、收集現(xiàn)有的鐵路信號(hào)設(shè)備故障分析領(lǐng)域原始語(yǔ)料,在分析數(shù)據(jù)特點(diǎn)、明確數(shù)據(jù)內(nèi)涵、提取數(shù)據(jù)共性的基礎(chǔ)上,將其轉(zhuǎn)化為數(shù)據(jù)集形式。

在數(shù)據(jù)集構(gòu)建的過程中,原始語(yǔ)料來源為收集到的某市地鐵各線路信號(hào)設(shè)備真實(shí)故障記錄表等半結(jié)構(gòu)化自然語(yǔ)言文本。其中,故障記錄表中表頭為“故障現(xiàn)象”“原因分析”和“處理措施”等類型的相關(guān)文本可以提取為故障相關(guān)的有效數(shù)據(jù),因此抽取同一故障記錄相對(duì)應(yīng)的文本作為數(shù)據(jù)集的一條。最終得到結(jié)構(gòu)化故障數(shù)據(jù)集如表1所示。

 
 
 
 
圖片
 
 
 
 

以鐵路信號(hào)設(shè)備故障板卡提取任務(wù)為例,作為故障數(shù)據(jù)分析任務(wù)的具體測(cè)試內(nèi)容。 基于各故障現(xiàn)象、影響、措施和標(biāo)注的故障板卡,融合思維鏈,構(gòu)建微調(diào)所需的問答對(duì),共7?395條,最終得到鐵路信號(hào)設(shè)備故障板卡提取任務(wù)微調(diào)訓(xùn)練集,如表2所示。

 
 
 
 
孫超-B2.png
 
 
 
 

針對(duì)含7?395條問答對(duì)的微調(diào)數(shù)據(jù)集,按照約3:1:1的比例分別構(gòu)建鐵路信號(hào)設(shè)備故障板卡提取任務(wù)的訓(xùn)練集、驗(yàn)證集和測(cè)試集,其中,訓(xùn)練集包括4?500條問答對(duì),驗(yàn)證集包括1?500條問答對(duì),測(cè)試集包括1?395條問答對(duì)。

本文為使模型更好理解輸入文本結(jié)構(gòu),還針對(duì)微調(diào)訓(xùn)練集設(shè)計(jì)特定的任務(wù)適配輸入編碼。在輸入文本中插入領(lǐng)域特定分隔符,如“[FAULT]”用于標(biāo)識(shí)故障現(xiàn)象,“[EFFECT]”用于標(biāo)識(shí)影響范圍,“[TASK]”用于標(biāo)識(shí)目標(biāo)任務(wù)類型,“[ANSWER]”用于標(biāo)識(shí)標(biāo)注的任務(wù)答案。對(duì)于故障板卡提取任務(wù),編碼示例為“[FAULT]BTM單元頻繁重啟 [EFFECT]列車緊急制動(dòng) [TASK]故障板卡提取 [ANSWER]BTM單元”。

3.2 環(huán)境配置與超參數(shù)設(shè)置

試驗(yàn)時(shí)所使用的深度學(xué)習(xí)環(huán)境與設(shè)備配置如圖5所示。

訓(xùn)練基于本文針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語(yǔ)言模型微調(diào)方法的軌道交通故障評(píng)估大模型,訓(xùn)練中所使用的超參數(shù)與取值如圖6所示。

4 試驗(yàn)結(jié)果和討論

4.1 有效性分析

在經(jīng)過373輪訓(xùn)練后,其損失函數(shù)loss的結(jié)果如圖7所示。其在訓(xùn)練迭代輪次約150次趨于收斂,約在300次訓(xùn)練迭代后達(dá)到最佳性能。

針對(duì)微調(diào)訓(xùn)練后的軌道交通故障評(píng)估大模型,基于鐵路信號(hào)設(shè)備故障板卡提取任務(wù)測(cè)試集中每個(gè)問答對(duì)的問題進(jìn)行推理,將所得到的預(yù)測(cè)答案與問答對(duì)中實(shí)際的標(biāo)準(zhǔn)答案進(jìn)行比對(duì),最終依據(jù)比對(duì)結(jié)果計(jì)算出準(zhǔn)確率(Precision)、召回率(Recall)和F0.5分?jǐn)?shù)(F0.5-score)評(píng)估指標(biāo)。由于故障板卡提取任務(wù)更注重推理結(jié)果預(yù)測(cè)答案的正確性,因此選擇偏向準(zhǔn)確率的F0.5-score作為準(zhǔn)確率和召回率的權(quán)衡分?jǐn)?shù),按公式(6)計(jì)算獲得。

 

最終得到的結(jié)果如表3所示。本文方法微調(diào)訓(xùn)練后的大模型在故障板卡提取任務(wù)上F0.5-score為0.821?0,這表明訓(xùn)練后的大模型可以有效地實(shí)現(xiàn)從一段涵蓋故障現(xiàn)象、故障原因等故障相關(guān)的自然語(yǔ)言文本中提取出具體故障板卡的任務(wù)。在包括1?395條問答對(duì)的測(cè)試集上,完成任務(wù)推理的總時(shí)間約25?min,平均每條問答對(duì)的推理時(shí)間約1?s,表明本文微調(diào)方法可以較大程度提高故障板卡提取任務(wù)的效率,降低大量時(shí)間成本。

4.2 與基線模型的對(duì)比分析

基于融合思維鏈和知識(shí)庫(kù)的微調(diào)方法訓(xùn)練后的大語(yǔ)言模型與作為基線模型的未微調(diào)的DeepSeek預(yù)訓(xùn)練模型故障板卡提取任務(wù)結(jié)果對(duì)比如表4所示。

分析結(jié)果可以發(fā)現(xiàn),本文基于融合思維鏈和知識(shí)庫(kù)的微調(diào)方法訓(xùn)練后的大語(yǔ)言模型較未微調(diào)的模型故障板卡提取任務(wù)準(zhǔn)確率由0.743?3提高到0.826?7,提高了11.2%。這表明本文提出的微調(diào)方法訓(xùn)練后的大模型較未微調(diào)的基線模型學(xué)習(xí)到了故障分析領(lǐng)域的相關(guān)專業(yè)知識(shí),使得在故障板卡提取任務(wù)上表現(xiàn)更好。同時(shí),在測(cè)試集上的平均推理時(shí)間由70?s降低到1?s,表明訓(xùn)練后的大模型較基線模型大大降低了任務(wù)推理的時(shí)間成本。

4.3 消融試驗(yàn)分析

本文基于融合思維鏈和知識(shí)庫(kù)的微調(diào)方法訓(xùn)練后的大語(yǔ)言模型與傳統(tǒng)微調(diào)方法訓(xùn)練后模型故障板卡提取任務(wù)結(jié)果對(duì)比如表5所示。

分析結(jié)果可以發(fā)現(xiàn),本文微調(diào)方法訓(xùn)練后大語(yǔ)言模型較傳統(tǒng)微調(diào)方法訓(xùn)練后模型的任務(wù)準(zhǔn)確率提高了2.5%,召回率提高了6.1%,F0.5-score提高了3.3%,在平均推理時(shí)間相同的情況下,各指標(biāo)均有了一定提升。

4.4 模型擴(kuò)展性分析

為驗(yàn)證本文微調(diào)訓(xùn)練后的軌道交通故障評(píng)估大模型的泛用性和擴(kuò)展性,設(shè)計(jì)以動(dòng)車、高鐵等各其他鐵路信號(hào)設(shè)備真實(shí)故障記錄為原始語(yǔ)料構(gòu)建的測(cè)試集。其中,構(gòu)建的測(cè)試集包括1?500條問答對(duì),覆蓋車載、列控和聯(lián)鎖信號(hào)設(shè)備。得到的結(jié)果如表6所示。

可以看出,本文基于融合思維鏈和知識(shí)庫(kù)的微調(diào)方法訓(xùn)練后的大語(yǔ)言模型在相似設(shè)備故障板卡提取任務(wù)上較未微調(diào)的模型任務(wù)準(zhǔn)確率由0.449?7提高到0.641?4,提高了42.6%。同時(shí),在測(cè)試集上的平均推理時(shí)間由70?s降低到1.5?s。由此可以得出本文微調(diào)方法訓(xùn)練后的軌道交通故障評(píng)估大模型在非訓(xùn)練集的相似設(shè)備上泛用性和擴(kuò)展性較好。

5 結(jié)束語(yǔ)

根據(jù)本文提出的微調(diào)方法訓(xùn)練后,模型能在包含1?395條問答對(duì)的測(cè)試集上高精度、高效率地完成故障板卡提取任務(wù),準(zhǔn)確率達(dá)0.826?7,F0.5-score達(dá)0.821?0,平均推理時(shí)間為1?s,均優(yōu)于未微調(diào)模型和基于傳統(tǒng)微調(diào)方法訓(xùn)練后模型,說明本文微調(diào)方法訓(xùn)練后模型的有效性。

本文提出的微調(diào)方法訓(xùn)練后,模型能在相似設(shè)備真實(shí)故障記錄構(gòu)建的包含1?500條問答對(duì)的測(cè)試集上較高精度地完成故障板卡提取任務(wù),準(zhǔn)確率較未微調(diào)模型準(zhǔn)確率提升42.6%,說明本文微調(diào)方法訓(xùn)練后模型的泛用性和擴(kuò)展性都得到了提升。

針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語(yǔ)言模型微調(diào)方法,可以讓大語(yǔ)言模型學(xué)習(xí)垂直領(lǐng)域內(nèi)知識(shí),實(shí)現(xiàn)專家經(jīng)驗(yàn)的遷移,降低模型推理的幻覺。同時(shí),在訓(xùn)練中融合基于因果邏輯的思維鏈,可以有效提高大語(yǔ)言模型針對(duì)復(fù)雜任務(wù)的準(zhǔn)確率。

模型在故障數(shù)據(jù)分析任務(wù)上的準(zhǔn)確率還有提升空間,這是由于自然語(yǔ)言處理任務(wù)的復(fù)雜性,單一大模型無(wú)法徹底解決幻覺問題,下一步將探索多智能體架構(gòu)的可能性,進(jìn)一步提升故障數(shù)據(jù)分析任務(wù)的準(zhǔn)確率。