自動(dòng)化學(xué)院派

《鐵路通信信號(hào)工程技術(shù)》新文速遞|鐵路信號(hào)故障分析領(lǐng)域大語言模型微調(diào)方法

時(shí)間：2025-07-09 12:06:34 發(fā)布：自動(dòng)化網(wǎng) 來源：鐵路通信信號(hào)工程技術(shù) 第一對(duì)焦：鐵路通信信號(hào)工程技術(shù)

【ZiDongHua 之“自動(dòng)化學(xué)院派”收錄關(guān)鍵詞：鐵路通信信號(hào)工程技術(shù) 人工智能大語言模型微調(diào) 思維鏈鐵路信號(hào)】

【新文速遞】鐵路信號(hào)故障分析領(lǐng)域大語言模型微調(diào)方法

《鐵路通信信號(hào)工程技術(shù)》公眾號(hào)“新文速遞”欄目，讓您第一時(shí)間，快速獲取鐵路通信信號(hào)領(lǐng)域的前沿技術(shù)，迅速掌握鐵路行業(yè)最新動(dòng)態(tài)。
請(qǐng)您與《鐵路通信信號(hào)工程技術(shù)》期刊并肩同行，共同見證鐵路通信信號(hào)技術(shù)的每一步堅(jiān)實(shí)進(jìn)展。

鐵路信號(hào)故障分析領(lǐng)域大語言模型微調(diào)方法

孫超^1,2，李涵蕊^1,2，丁子煥^1,2

（1．北京全路通信信號(hào)研究設(shè)計(jì)院集團(tuán)有限公司，北京 100070；

2．列車自主運(yùn)行智能控制鐵路行業(yè)工程研究中心，北京 100070）

摘要：為提升鐵路信號(hào)設(shè)備故障分析的智能化水平,提出一種針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語言模型微調(diào)方法。采用低秩微調(diào)（Low-Rank Adaptation，LoRA）實(shí)現(xiàn)參數(shù)高效微調(diào)，降低訓(xùn)練成本；融入拓?fù)渌季S鏈（CoT）構(gòu)建故障因果推理框架，增強(qiáng)模型思維邏輯可解釋性；外掛故障知識(shí)庫并通過檢索增強(qiáng)機(jī)制，提升術(shù)語識(shí)別與知識(shí)適配性。實(shí)驗(yàn)表明，該方法使故障板卡信息提取準(zhǔn)確率較基線模型提升11.2%，推理時(shí)間減少52%；在推理時(shí)間相當(dāng)?shù)那闆r下，該方法準(zhǔn)確率較傳統(tǒng)微調(diào)方法提升2.5%；跨域遷移場景下模型準(zhǔn)確率提升42.6%，展現(xiàn)強(qiáng)泛化能力。通過技術(shù)融合與知識(shí)增強(qiáng)，該方法有效解決傳統(tǒng)方法的效率與泛化瓶頸，顯著提升故障分析的準(zhǔn)確率、效率及領(lǐng)域適應(yīng)性，為鐵路信號(hào)智能運(yùn)維提供技術(shù)支撐，推動(dòng)人工智能技術(shù)在軌道交通場景的工程化落地，具有突出的應(yīng)用價(jià)值與創(chuàng)新突破。

關(guān)鍵詞：人工智能；大語言模型微調(diào)；思維鏈；知識(shí)檢索增強(qiáng)；鐵路信號(hào)

中圖分類號(hào)：U284; TP18

基金項(xiàng)目：中國國家鐵路集團(tuán)有限公司科技研究開發(fā)計(jì)劃重點(diǎn)課題項(xiàng)目（N2023G081）

第一作者：孫超（1982—），男，高級(jí)工程師，碩士，主要研究方向：軌道交通裝備RAMS設(shè)計(jì)、列車運(yùn)行控制及系統(tǒng)健康管理（PHM），郵箱：sunchao@crscd.com.cn。

1 概述

鐵路信號(hào)系統(tǒng)故障記錄表涵蓋故障發(fā)生位置、故障現(xiàn)象描述及故障處理措施等核心要素，既是開展設(shè)備狀態(tài)評(píng)估與可靠性分析的重要基礎(chǔ)，也是科學(xué)制定維修計(jì)劃的關(guān)鍵依據(jù)。目前大部分故障記錄數(shù)據(jù)分析多依賴于人工逐條標(biāo)注分析。然而，隨著設(shè)備運(yùn)維數(shù)據(jù)規(guī)模的持續(xù)擴(kuò)張，海量故障記錄數(shù)據(jù)資源利用率長期處于較低水平。自然語言處理方法憑借其強(qiáng)大的語義理解與分析能力，逐漸成為故障數(shù)據(jù)分析領(lǐng)域的研究熱點(diǎn)與重要技術(shù)方向。

現(xiàn)階段，主流自然語言處理方式仍以半自動(dòng)化為主，如胡小溪等人將模糊標(biāo)注的新詞融合既有詞庫形成特定線路信號(hào)專用詞庫；Lei等人提出結(jié)合主題模型與支持向量機(jī)(SVM)方法，實(shí)現(xiàn)了鐵路信號(hào)故障記錄數(shù)據(jù)分類；Kang等人提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品故障抽取方法，將故障實(shí)體識(shí)別視為多元分類問題以不平衡的故障數(shù)據(jù)。上述文獻(xiàn)中人工操作的路徑依賴，不僅可能導(dǎo)致模型泛化性能不足，還會(huì)造成模型智能性與自主性的缺失。目前，主動(dòng)學(xué)習(xí)作為一種能夠有效減少人工干預(yù)、提升模型自主學(xué)習(xí)能力的方法，正在受到廣泛關(guān)注。Xiao等人研究了在多個(gè)尺度上自動(dòng)提取各種特征，通過使用故障數(shù)據(jù)在智能體和環(huán)境之間進(jìn)行廣泛的交互，提高了故障分類過程的智能性。張奕林等人提出了一種基于BERT的短文本分類模型和知識(shí)圖譜結(jié)合的故障定位方法，以充分挖掘鐵路CIR設(shè)備文本數(shù)據(jù)。在BERT方法基礎(chǔ)上，Lin等人提出了一種基于RoBERTa-wwm的鐵路信號(hào)設(shè)備故障信息實(shí)體識(shí)別方法，有效提高了識(shí)別準(zhǔn)確率。

隨著大語言模型（Large Language Model，LLM）的發(fā)展，無監(jiān)督自主學(xué)習(xí)方法逐步邁向新的高度。以DeepSeek、GPT-4、LlaMA等為代表的通用領(lǐng)域LLM，已展現(xiàn)出突破自然語言處理傳統(tǒng)方法局限性的強(qiáng)大潛力。因此，上述研究方向也開始利用LLM技術(shù)方法輔助文本分析，應(yīng)用于文本分類、實(shí)體識(shí)別和對(duì)話問答等任務(wù)，實(shí)現(xiàn)對(duì)目標(biāo)的語義快速解析和高效處理。但預(yù)訓(xùn)練模型面臨對(duì)象特化度高、數(shù)據(jù)適應(yīng)性不足、場景泛化能力薄弱等問題，使其難以直接應(yīng)用于鐵路行業(yè)實(shí)際情景。目前，針對(duì)軌道交通領(lǐng)域的專用大模型和人工智能領(lǐng)域已取得一定研究成果，例如TransGPT交通大模型、UrbanGPT智慧城市大模型，UniST城市時(shí)空預(yù)測大模型和智能化區(qū)域協(xié)同等。但是面向故障文本數(shù)據(jù)分析這一特定任務(wù)的研究仍處于探索階段，相關(guān)成果尚不夠系統(tǒng)和深入。

為解決上述問題，本文提出了一種針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語言模型微調(diào)方法，采用LoRA技術(shù)實(shí)現(xiàn)模型參數(shù)微調(diào)，并在微調(diào)過程中添加基于“故障現(xiàn)象-故障影響-處理措施”拓?fù)渌季S鏈，將設(shè)備故障的因果邏輯推理過程融入模型訓(xùn)練，構(gòu)建多維度語義關(guān)聯(lián)的深度表征空間。此外，通過外掛信號(hào)設(shè)備故障知識(shí)庫的技術(shù)路徑，建立領(lǐng)域?qū)I(yè)知識(shí)與模型輸出的動(dòng)態(tài)映射機(jī)制，從而提升故障分析結(jié)果的準(zhǔn)確性與可靠性，為后續(xù)數(shù)據(jù)記錄表的智能總結(jié)、統(tǒng)計(jì)分析及決策支持提供技術(shù)支撐。

2 領(lǐng)域大語言模型微調(diào)方法

針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)，提出領(lǐng)域大語言模型微調(diào)方法，增強(qiáng)模型語義學(xué)習(xí)、邏輯推理能力與分析結(jié)果的準(zhǔn)確性。主要流程包括基于因果推理思維鏈的分析任務(wù)訓(xùn)練集構(gòu)建、LoRA模型微調(diào)訓(xùn)練和融合外掛知識(shí)庫的故障分析任務(wù)處理3個(gè)步驟，如圖1所示。

1）數(shù)據(jù)輸入預(yù)處理與訓(xùn)練集構(gòu)建

將鐵路信號(hào)設(shè)備故障歷史數(shù)據(jù)通過數(shù)據(jù)預(yù)處理操作整理成結(jié)構(gòu)化故障數(shù)據(jù)，形成樣本庫。結(jié)合具體故障分析任務(wù)要求，構(gòu)建針對(duì)特定任務(wù)的基于因果邏輯思維鏈的微調(diào)訓(xùn)練集。

2）LoRA微調(diào)訓(xùn)練

針對(duì)預(yù)訓(xùn)練大模型底座，以融合思維鏈的訓(xùn)練集為數(shù)據(jù)輸入，采用基于規(guī)則的低秩適應(yīng)（LoRA）微調(diào)技術(shù)，通過調(diào)整學(xué)習(xí)率、正則化系數(shù)等超參數(shù)完成大模型在特定任務(wù)上的微調(diào)訓(xùn)練，并以準(zhǔn)確率、召回率、F0.5分?jǐn)?shù)等指標(biāo)評(píng)估大模型性能。

3）任務(wù)推理檢索增強(qiáng)

基于微調(diào)訓(xùn)練后的鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析大模型，以故障分析相關(guān)任務(wù)為輸入，通過外掛故障知識(shí)庫實(shí)現(xiàn)任務(wù)推理的檢索增強(qiáng)，最終輸出任務(wù)推理結(jié)果。

2.1 基于故障因果邏輯的思維鏈生成

在構(gòu)建鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域大模型微調(diào)訓(xùn)練集的過程中，需要編寫合適的提示詞作為訓(xùn)練集的輸入數(shù)據(jù)，稱之為提示學(xué)習(xí)。本文在大模型的提示學(xué)習(xí)中采用了基于因果邏輯的思維鏈方法，通過語義連貫性優(yōu)化與邏輯結(jié)構(gòu)增強(qiáng)策略，提升輸入提示的自然語言表達(dá)質(zhì)量，有效引導(dǎo)模型構(gòu)建更清晰的上下文線索與推理路徑，從而在后續(xù)推理任務(wù)適配中實(shí)現(xiàn)更精準(zhǔn)的語義理解與知識(shí)整合。

在鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域大模型特定任務(wù)微調(diào)的過程中，基于因果邏輯的思維鏈方法通過構(gòu)建分層推理框架，將復(fù)雜的領(lǐng)域內(nèi)故障分析等自然語言處理任務(wù)解耦為可解釋的邏輯鏈條，然后，在訓(xùn)練集的輸入序列中植入包含多步推理路徑的標(biāo)注示例，引導(dǎo)預(yù)訓(xùn)練模型建立從故障現(xiàn)象到根因分析的可追溯思維過程。以故障板卡實(shí)體識(shí)別任務(wù)的思維鏈微調(diào)訓(xùn)練過程為例，如圖2所示。

可以看出，基于因果邏輯的思維鏈提示學(xué)習(xí)訓(xùn)練集與傳統(tǒng)大模型訓(xùn)練集的本質(zhì)區(qū)別在于領(lǐng)域知識(shí)表征的顆粒度和邏輯推理過程的透明度。在上下文學(xué)習(xí)過程中，CoT范式不僅提供輸入輸出對(duì)，更構(gòu)建了包含鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域故障分析等任務(wù)專屬推理規(guī)則的中間邏輯層。這使得領(lǐng)域知識(shí)結(jié)構(gòu)化，將分析過程分解為多步可解釋的推理單元，并且基于動(dòng)態(tài)推理引導(dǎo)，通過顯式標(biāo)注推理依據(jù)，迫使模型在生成答案前進(jìn)行分層邏輯校驗(yàn)，提高推理答案的準(zhǔn)確率。同時(shí)，利用認(rèn)知路徑對(duì)齊，模擬領(lǐng)域?qū)＜业脑u(píng)估分析思維過程，建立從現(xiàn)象到根因的可追溯推理鏈條。

2.2 基于規(guī)則的LoRA微調(diào)技術(shù)

2.2.1 大模型底座

本文使用的大模型底座為DeepSeek預(yù)訓(xùn)練模型，在訓(xùn)練任務(wù)上構(gòu)造了自回歸的空格填充任務(wù)，其基本架構(gòu)為Transformer架構(gòu)，如圖3所示，由若干個(gè)編碼器和解碼器相互疊加而成。從組成結(jié)構(gòu)上看，每個(gè)編碼器和解碼器均由前饋全連接模塊（Feed Forward Network，F(xiàn)FN）和多頭自注意力模塊（Multi-head Self-Attention，MSA）這兩大基礎(chǔ)模塊組合而成。

其中，自注意力（Self-Attention，SA）模塊是Transformer架構(gòu)中的基礎(chǔ)組件。具體來講，SA通過3個(gè)可學(xué)習(xí)的線性映射矩陣W_Q、W_K、W_V，將輸入序列投影為一組查詢Q、鍵K和值V，通過另一個(gè)線性映射矩陣W_o實(shí)現(xiàn)輸出變換，其中：

查詢矩陣（W_Q）負(fù)責(zé)生成自主提示特征向量，定義注意力搜索范圍;

鍵矩陣（W_K）構(gòu)建非自主提示特征向量，標(biāo)識(shí)被匹配的關(guān)鍵特征;

值矩陣（W_V）存儲(chǔ)實(shí)體固有特征向量，與鍵矩陣形成語義關(guān)聯(lián);

輸出變換矩陣（W_o）通過特征交互矩陣實(shí)現(xiàn)多頭輸出的融合轉(zhuǎn)換。

在對(duì)輸入序列和輸出序列進(jìn)行線性變換的過程中，SA能夠捕捉輸入序列的語義特征及遠(yuǎn)距離依賴關(guān)系，并在輸出生成式序列時(shí)結(jié)合捕捉到的語義特征。而MSA模塊則是SA的擴(kuò)展形式，由n個(gè)自注意力頭組合而成。

FFN模塊的構(gòu)成則包含兩個(gè)線性層及激活函數(shù)。在結(jié)構(gòu)設(shè)計(jì)上，MSA模塊和FFN模塊均引入了殘差連接與層歸一化（Layer Normalization，LN），如公式（1）所示。

公式（1）中：x₀表示初始輸入序列，即原始數(shù)據(jù)經(jīng)過預(yù)處理后形成的符號(hào)序列；x_pos表示位置嵌入向量，用于為模型提供序列的位置信息，彌補(bǔ)自注意力機(jī)制對(duì)順序不敏感的缺陷；y_k表示第k個(gè)MSA模塊經(jīng)LN處理后的輸出序列；x_k_－1和x_k分別表示第k－1和第k個(gè)FFN模塊經(jīng)LN處理后的輸出表征，其整合了前面全部線性層的語義信息與位置關(guān)系。

2.2.2 LoRA微調(diào)技術(shù)

微調(diào)過程是在基礎(chǔ)模型架構(gòu)上，通過數(shù)據(jù)集對(duì)模型參數(shù)進(jìn)行任務(wù)導(dǎo)向的調(diào)參，結(jié)合領(lǐng)域內(nèi)標(biāo)注數(shù)據(jù)進(jìn)行定向優(yōu)化，最終實(shí)現(xiàn)故障分析精準(zhǔn)推理。本文采用基于規(guī)則的LoRA方法實(shí)現(xiàn)預(yù)訓(xùn)練模型在鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域的微調(diào)。首先，基于目前收集到的領(lǐng)域內(nèi)的原始數(shù)據(jù)，結(jié)合具體任務(wù)規(guī)則要求，設(shè)計(jì)特定任務(wù)的訓(xùn)練集。其中，針對(duì)訓(xùn)練樣本(x, y)，其中x代表輸入序列，y代表與任務(wù)相關(guān)的標(biāo)簽，即輸出序列。大模型微調(diào)的目標(biāo)就是最小化以下?lián)p失函數(shù)，如公式（2）所示。

公式（2）中：L' (θ)表示微調(diào)更新后的損失函數(shù)；θ表示模型參數(shù)；E表示函數(shù)的期望值；P (y|x;θ)表示在給定輸入序列x和模型參數(shù)θ的條件下，生成標(biāo)簽y的概率。

為了微調(diào)大模型以適應(yīng)鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域的特定任務(wù)，設(shè)定以下優(yōu)化目標(biāo)，如公式（3）所示。

公式（3）中：θ*表示經(jīng)LoRA微調(diào)后的模型參數(shù)；L' (θ)表示針對(duì)鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域任務(wù)相關(guān)數(shù)據(jù)的損失函數(shù)；λ表示正則化系數(shù)；R(θ)表示正則化項(xiàng)，將其設(shè)置為模型參數(shù)的L2范數(shù)。

針對(duì)鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域的故障分析NLP任務(wù)，結(jié)合根據(jù)專家經(jīng)驗(yàn)和歷史數(shù)據(jù)制定的領(lǐng)域規(guī)則，進(jìn)行任務(wù)適配輸入編碼（Task-adaptive Input Encoding），對(duì)輸入文本序列x進(jìn)行結(jié)構(gòu)化轉(zhuǎn)換，以引導(dǎo)預(yù)訓(xùn)練模型關(guān)注關(guān)鍵信息。以故障分類任務(wù)為例，將故障現(xiàn)象描述與故障類別數(shù)據(jù)整合為統(tǒng)一輸入序列，通過插入領(lǐng)域特定分隔符（如“[FAULT]”）明確區(qū)分問題類型與上下文信息。

最后，采用參數(shù)凍結(jié)策略固定預(yù)訓(xùn)練模型的基礎(chǔ)權(quán)重，在保持基礎(chǔ)參數(shù)固定的前提下，通過嵌入輕量級(jí)適配網(wǎng)絡(luò)層，并僅對(duì)新增網(wǎng)絡(luò)層內(nèi)的參數(shù)進(jìn)行訓(xùn)練優(yōu)化，實(shí)現(xiàn)大模型的LoRA微調(diào)。以故障板卡實(shí)體識(shí)別任務(wù)為例，通過在預(yù)訓(xùn)練語言模型頂部添加故障特征提取器，僅需更新少量參數(shù)即可實(shí)現(xiàn)對(duì)故障實(shí)體的精準(zhǔn)適配和識(shí)別。

LoRA微調(diào)在訓(xùn)練過程中通過固定預(yù)訓(xùn)練模型參數(shù)，在Transformer架構(gòu)的每一層中植入可訓(xùn)練的低秩分解矩陣，即在多頭自注意力模塊中，將W_Q、W_K、W_V和W_o這4個(gè)核心參數(shù)視為維度d_model×d_model的統(tǒng)一參數(shù)空間，這一參數(shù)空間就構(gòu)成了公式（3）中的優(yōu)化目標(biāo)θ*。

通過在每個(gè)注意力頭的輸入輸出空間引入秩分解矩陣ΔW，在保持原始預(yù)訓(xùn)練模型參數(shù)凍結(jié)的前提下，以極小的計(jì)算代價(jià)實(shí)現(xiàn)模型的領(lǐng)域適配。以預(yù)訓(xùn)練模型的權(quán)重矩陣W_o為例，可以讓其參量的更新用低秩分解來表示后者的約束，如公式（4）所示。

其中：W_o∈R^d^×k,B∈R^d^×r,A∈R^r^×k

此時(shí)，由于新增的秩r遠(yuǎn)小于min(d,k)，修正后的正向傳播計(jì)算，如公式（5）所示。

在LoRA微調(diào)框架下，W_o保持參數(shù)凍結(jié)狀態(tài)，僅對(duì)低秩分解矩陣A和B實(shí)施梯度更新。如圖4所示，本文在進(jìn)行基于規(guī)則的LoRA微調(diào)時(shí)，對(duì)低秩分解矩陣A使用隨機(jī)高斯初始化，對(duì)B則使用零初始化，因此ΔW＝BA在訓(xùn)練開始時(shí)為0。

在Transformer架構(gòu)的每一層實(shí)施LoRA微調(diào)策略，有效壓縮模型微調(diào)所需的參數(shù)規(guī)模。在故障板卡實(shí)體識(shí)別、故障原因分類等鐵路信號(hào)設(shè)備故障數(shù)據(jù)分析領(lǐng)域典型任務(wù)中，該方法僅需維護(hù)參數(shù)矩陣W＝W_o＋BA的動(dòng)態(tài)合成，即可在后續(xù)任務(wù)問答推理階段保持與原始模型一致的計(jì)算流程。

2.3 知識(shí)庫檢索增強(qiáng)的任務(wù)推理

為提高故障數(shù)據(jù)分析任務(wù)的準(zhǔn)確率和專業(yè)度，在輸入查詢的內(nèi)容中將外掛故障知識(shí)庫融入故障分析相關(guān)任務(wù)輸入，實(shí)現(xiàn)大模型任務(wù)推理時(shí)的知識(shí)檢索增強(qiáng)。

構(gòu)建鐵路信號(hào)設(shè)備故障分析特征知識(shí)庫，通過對(duì)歷史故障數(shù)據(jù)進(jìn)行深度分析處理、總結(jié)提煉和專家審核，獲取專業(yè)名詞、故障信息和改正措施等知識(shí)，有效彌補(bǔ)大模型知識(shí)更新不及時(shí)和特定領(lǐng)域知識(shí)不足的缺陷。利用詞嵌入技術(shù)將特征知識(shí)庫中的自然語言數(shù)據(jù)轉(zhuǎn)換為詞向量，實(shí)現(xiàn)知識(shí)的數(shù)值化表示。

在模型任務(wù)推理時(shí)，動(dòng)態(tài)融合外掛故障知識(shí)庫的詞向量和任務(wù)輸入，使模型能夠從知識(shí)庫中檢索相關(guān)信息，給出更準(zhǔn)確、專業(yè)的回答。知識(shí)庫支持在線更新，新增案例經(jīng)向量化后可直接注入檢索通道，構(gòu)建閉環(huán)優(yōu)化機(jī)制，確保知識(shí)庫隨運(yùn)營數(shù)據(jù)增長不斷進(jìn)化，始終保持時(shí)效性和準(zhǔn)確性。

3 案例分析和驗(yàn)證

3.1 數(shù)據(jù)集構(gòu)建

通過前期調(diào)研、收集現(xiàn)有的鐵路信號(hào)設(shè)備故障分析領(lǐng)域原始語料，在分析數(shù)據(jù)特點(diǎn)、明確數(shù)據(jù)內(nèi)涵、提取數(shù)據(jù)共性的基礎(chǔ)上，將其轉(zhuǎn)化為數(shù)據(jù)集形式。

在數(shù)據(jù)集構(gòu)建的過程中，原始語料來源為收集到的某市地鐵各線路信號(hào)設(shè)備真實(shí)故障記錄表等半結(jié)構(gòu)化自然語言文本。其中，故障記錄表中表頭為“故障現(xiàn)象”“原因分析”和“處理措施”等類型的相關(guān)文本可以提取為故障相關(guān)的有效數(shù)據(jù)，因此抽取同一故障記錄相對(duì)應(yīng)的文本作為數(shù)據(jù)集的一條。最終得到結(jié)構(gòu)化故障數(shù)據(jù)集如表1所示。

以鐵路信號(hào)設(shè)備故障板卡提取任務(wù)為例，作為故障數(shù)據(jù)分析任務(wù)的具體測試內(nèi)容。基于各故障現(xiàn)象、影響、措施和標(biāo)注的故障板卡，融合思維鏈，構(gòu)建微調(diào)所需的問答對(duì)，共7?395條，最終得到鐵路信號(hào)設(shè)備故障板卡提取任務(wù)微調(diào)訓(xùn)練集，如表2所示。

針對(duì)含7?395條問答對(duì)的微調(diào)數(shù)據(jù)集，按照約3：1：1的比例分別構(gòu)建鐵路信號(hào)設(shè)備故障板卡提取任務(wù)的訓(xùn)練集、驗(yàn)證集和測試集，其中，訓(xùn)練集包括4?500條問答對(duì)，驗(yàn)證集包括1?500條問答對(duì)，測試集包括1?395條問答對(duì)。

本文為使模型更好理解輸入文本結(jié)構(gòu)，還針對(duì)微調(diào)訓(xùn)練集設(shè)計(jì)特定的任務(wù)適配輸入編碼。在輸入文本中插入領(lǐng)域特定分隔符，如“[FAULT]”用于標(biāo)識(shí)故障現(xiàn)象，“[EFFECT]”用于標(biāo)識(shí)影響范圍，“[TASK]”用于標(biāo)識(shí)目標(biāo)任務(wù)類型，“[ANSWER]”用于標(biāo)識(shí)標(biāo)注的任務(wù)答案。對(duì)于故障板卡提取任務(wù)，編碼示例為“[FAULT]BTM單元頻繁重啟 [EFFECT]列車緊急制動(dòng) [TASK]故障板卡提取 [ANSWER]BTM單元”。

3.2 環(huán)境配置與超參數(shù)設(shè)置

試驗(yàn)時(shí)所使用的深度學(xué)習(xí)環(huán)境與設(shè)備配置如圖5所示。

訓(xùn)練基于本文針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語言模型微調(diào)方法的軌道交通故障評(píng)估大模型，訓(xùn)練中所使用的超參數(shù)與取值如圖6所示。

4 試驗(yàn)結(jié)果和討論

4.1 有效性分析

在經(jīng)過373輪訓(xùn)練后，其損失函數(shù)loss的結(jié)果如圖7所示。其在訓(xùn)練迭代輪次約150次趨于收斂，約在300次訓(xùn)練迭代后達(dá)到最佳性能。

針對(duì)微調(diào)訓(xùn)練后的軌道交通故障評(píng)估大模型，基于鐵路信號(hào)設(shè)備故障板卡提取任務(wù)測試集中每個(gè)問答對(duì)的問題進(jìn)行推理，將所得到的預(yù)測答案與問答對(duì)中實(shí)際的標(biāo)準(zhǔn)答案進(jìn)行比對(duì)，最終依據(jù)比對(duì)結(jié)果計(jì)算出準(zhǔn)確率（Precision）、召回率（Recall）和F_0.5分?jǐn)?shù)（F_0.5-score）評(píng)估指標(biāo)。由于故障板卡提取任務(wù)更注重推理結(jié)果預(yù)測答案的正確性，因此選擇偏向準(zhǔn)確率的F_0.5-score作為準(zhǔn)確率和召回率的權(quán)衡分?jǐn)?shù)，按公式（6）計(jì)算獲得。

最終得到的結(jié)果如表3所示。本文方法微調(diào)訓(xùn)練后的大模型在故障板卡提取任務(wù)上F_0.5-score為0.821?0，這表明訓(xùn)練后的大模型可以有效地實(shí)現(xiàn)從一段涵蓋故障現(xiàn)象、故障原因等故障相關(guān)的自然語言文本中提取出具體故障板卡的任務(wù)。在包括1?395條問答對(duì)的測試集上，完成任務(wù)推理的總時(shí)間約25?min，平均每條問答對(duì)的推理時(shí)間約1?s，表明本文微調(diào)方法可以較大程度提高故障板卡提取任務(wù)的效率，降低大量時(shí)間成本。

4.2 與基線模型的對(duì)比分析

基于融合思維鏈和知識(shí)庫的微調(diào)方法訓(xùn)練后的大語言模型與作為基線模型的未微調(diào)的DeepSeek預(yù)訓(xùn)練模型故障板卡提取任務(wù)結(jié)果對(duì)比如表4所示。

分析結(jié)果可以發(fā)現(xiàn)，本文基于融合思維鏈和知識(shí)庫的微調(diào)方法訓(xùn)練后的大語言模型較未微調(diào)的模型故障板卡提取任務(wù)準(zhǔn)確率由0.743?3提高到0.826?7，提高了11.2%。這表明本文提出的微調(diào)方法訓(xùn)練后的大模型較未微調(diào)的基線模型學(xué)習(xí)到了故障分析領(lǐng)域的相關(guān)專業(yè)知識(shí)，使得在故障板卡提取任務(wù)上表現(xiàn)更好。同時(shí)，在測試集上的平均推理時(shí)間由70?s降低到1?s，表明訓(xùn)練后的大模型較基線模型大大降低了任務(wù)推理的時(shí)間成本。

4.3 消融試驗(yàn)分析

本文基于融合思維鏈和知識(shí)庫的微調(diào)方法訓(xùn)練后的大語言模型與傳統(tǒng)微調(diào)方法訓(xùn)練后模型故障板卡提取任務(wù)結(jié)果對(duì)比如表5所示。

分析結(jié)果可以發(fā)現(xiàn)，本文微調(diào)方法訓(xùn)練后大語言模型較傳統(tǒng)微調(diào)方法訓(xùn)練后模型的任務(wù)準(zhǔn)確率提高了2.5%，召回率提高了6.1%，F_0.5-score提高了3.3%，在平均推理時(shí)間相同的情況下，各指標(biāo)均有了一定提升。

4.4 模型擴(kuò)展性分析

為驗(yàn)證本文微調(diào)訓(xùn)練后的軌道交通故障評(píng)估大模型的泛用性和擴(kuò)展性，設(shè)計(jì)以動(dòng)車、高鐵等各其他鐵路信號(hào)設(shè)備真實(shí)故障記錄為原始語料構(gòu)建的測試集。其中，構(gòu)建的測試集包括1?500條問答對(duì)，覆蓋車載、列控和聯(lián)鎖信號(hào)設(shè)備。得到的結(jié)果如表6所示。

可以看出，本文基于融合思維鏈和知識(shí)庫的微調(diào)方法訓(xùn)練后的大語言模型在相似設(shè)備故障板卡提取任務(wù)上較未微調(diào)的模型任務(wù)準(zhǔn)確率由0.449?7提高到0.641?4，提高了42.6%。同時(shí)，在測試集上的平均推理時(shí)間由70?s降低到1.5?s。由此可以得出本文微調(diào)方法訓(xùn)練后的軌道交通故障評(píng)估大模型在非訓(xùn)練集的相似設(shè)備上泛用性和擴(kuò)展性較好。

5 結(jié)束語

根據(jù)本文提出的微調(diào)方法訓(xùn)練后，模型能在包含1?395條問答對(duì)的測試集上高精度、高效率地完成故障板卡提取任務(wù)，準(zhǔn)確率達(dá)0.826?7，F_0.5-score達(dá)0.821?0，平均推理時(shí)間為1?s，均優(yōu)于未微調(diào)模型和基于傳統(tǒng)微調(diào)方法訓(xùn)練后模型，說明本文微調(diào)方法訓(xùn)練后模型的有效性。

本文提出的微調(diào)方法訓(xùn)練后，模型能在相似設(shè)備真實(shí)故障記錄構(gòu)建的包含1?500條問答對(duì)的測試集上較高精度地完成故障板卡提取任務(wù)，準(zhǔn)確率較未微調(diào)模型準(zhǔn)確率提升42.6%，說明本文微調(diào)方法訓(xùn)練后模型的泛用性和擴(kuò)展性都得到了提升。

針對(duì)鐵路信號(hào)設(shè)備故障分析任務(wù)構(gòu)建的領(lǐng)域大語言模型微調(diào)方法，可以讓大語言模型學(xué)習(xí)垂直領(lǐng)域內(nèi)知識(shí)，實(shí)現(xiàn)專家經(jīng)驗(yàn)的遷移，降低模型推理的幻覺。同時(shí)，在訓(xùn)練中融合基于因果邏輯的思維鏈，可以有效提高大語言模型針對(duì)復(fù)雜任務(wù)的準(zhǔn)確率。

模型在故障數(shù)據(jù)分析任務(wù)上的準(zhǔn)確率還有提升空間，這是由于自然語言處理任務(wù)的復(fù)雜性，單一大模型無法徹底解決幻覺問題，下一步將探索多智能體架構(gòu)的可能性，進(jìn)一步提升故障數(shù)據(jù)分析任務(wù)的準(zhǔn)確率。

我要收藏

點(diǎn)個(gè)贊吧

自動(dòng)對(duì)焦：人工智能大語言模型微調(diào)思維鏈鐵路信號(hào)

咨詢?cè)斍椋喝缧枳稍兾闹猩婕暗南嚓P(guān)技術(shù)、產(chǎn)品或解決方案詳情，請(qǐng)加微信：ZiDongHuaX 。

上一篇：全球數(shù)字經(jīng)濟(jì)大會(huì)“數(shù)字中醫(yī)藥”論壇成功舉辦|李梢分享“AI與中醫(yī)藥...
下一篇：浙江大學(xué)控制科學(xué)與工程學(xué)院誠招海內(nèi)外英才

評(píng)論排行

欄目推薦（1）

美国肥婆操逼视频|浮力影院草草国产|久久久久国产无码|亚洲精品国产久久|亚洲婷婷免费观看|52AV免费52|人妖系列一区二区|丁香五月久久无码|婷婷丁香久久婷婷|国语对白真实自拍

《鐵路通信信號(hào)工程技術(shù)》新文速遞|鐵路信號(hào)故障分析領(lǐng)域大語言模型微調(diào)方法

欄目推薦（1）

信息排行更多

熱點(diǎn)話題更多

高速磁浮專欄|基于運(yùn)行曲線區(qū)間優(yōu)化的磁浮列車分層協(xié)同控制方法

江波龍上海總部落成！以高端存儲(chǔ)"芯"支點(diǎn)鏈動(dòng)全球化布局

霍尼韋爾宣布為計(jì)劃分拆的Solstice Advanced Materials公司提交Form 10注冊(cè)聲明，并將舉行投資者日

國務(wù)院：鐵路信號(hào)設(shè)備將實(shí)行產(chǎn)品認(rèn)證制度

話題推薦更多

欄目最新更多

《鐵路通信信號(hào)工程技術(shù)》新文速遞|鐵路信號(hào)故障分析領(lǐng)域大語言模型微調(diào)方法

評(píng)論排行

相關(guān)文章

欄目推薦（1）

高速磁浮專欄|基于運(yùn)行曲線區(qū)間優(yōu)化的磁浮列車分層協(xié)同控制方法

江波龍上海總部落成！以高端存儲(chǔ)"芯"支點(diǎn)鏈動(dòng)全球化布局

霍尼韋爾宣布為計(jì)劃分拆的Solstice Advanced Materials公司提交Form 10注冊(cè)聲明，并將舉行投資者日

國務(wù)院：鐵路信號(hào)設(shè)備將實(shí)行產(chǎn)品認(rèn)證制度

江波龍上海總部落成！以高端存儲(chǔ)"芯"支點(diǎn)鏈動(dòng)全球化布局

霍尼韋爾宣布為計(jì)劃分拆的Solstice Advanced Materials公司提交Form 10注冊(cè)聲明，并將舉行投資者日