本發(fā)明涉及謠言檢測,尤其涉及一種低資源環(huán)境下基于提示學習和元學習的謠言檢測方法及系統(tǒng)。
背景技術:
1、謠言檢測在當今信息爆炸時代至關重要,其通過識別和遏制虛假信息的傳播,能夠有效防止社會恐慌、公共危機及信任崩塌,尤其在突發(fā)事件中(如疫情、災害)可保障關鍵信息的準確性;同時,它維護了數(shù)字空間的秩序,減少因謠言引發(fā)的經(jīng)濟損耗與社會分裂,并通過技術手段(如多語言模型、低資源算法)促進信息公平,為不同地區(qū)和文化群體構建抵御謠言的防御屏障,是數(shù)字社會治理與安全的基石。
2、但目前對于一些特定領域,用于謠言檢測的數(shù)據(jù)樣本較少,屬于低資源環(huán)境。如何提高低資源環(huán)境下謠言的檢測精度和準確性,是目前急需解決的技術問題。
技術實現(xiàn)思路
1、為解決上述技術問題,本發(fā)明實施例提供一種低資源環(huán)境下基于提示學習和元學習的謠言檢測方法及系統(tǒng)。
2、本發(fā)明實施例的技術方案是這樣實現(xiàn)的:
3、本發(fā)明實施例提供了一種低資源環(huán)境下基于提示學習和元學習的謠言檢測方法,方法包括:
4、獲取待檢測的輸入文本、軟提示參數(shù)和檢測模型;所述軟提示參數(shù)用于對謠言檢測任務進行指導;
5、將所述輸入文本和所述軟提示參數(shù)輸入所述檢測模型,獲得所述檢測模型輸出結果;其中,所述檢測模型包括提示模型和原型表達器;所述提示模型包括雙向長短期記憶網(wǎng)絡、兩層的多層感知機和掩碼語言模型;所述雙向長短期記憶網(wǎng)絡用于對所述軟提示參數(shù)進行上下文信息的建模;所述兩層的多層感知機用于對上下文建模后的軟提示參數(shù)增加非線性特征;所述掩碼語言模型用于對增加非線性特征的軟提示參數(shù)與輸入文本所組成的提示文本執(zhí)行掩碼預測任務,預測所述提示文本中的軟提示參數(shù);所述原型表達器用于將掩碼語言模型的預測結果映射為對應的類別標簽;
6、根據(jù)所述檢測模型輸出的類別標簽確定所述輸入文本對應的謠言檢測結果。
7、在一實施例中,所述提示文本為:
8、
9、其中,為提示文本,為掩碼語言模型的特殊標記,x為輸入文本,為固定的錨點標記,表示填充有軟提示參數(shù)的可訓練的向量,表示句子分隔或序列結束標記。
10、在一實施例中,獲取軟提示參數(shù)和檢測模型,包括:
11、從源數(shù)據(jù)中多次隨機抽取樣本構建元提示任務集;
12、對于所述元提示任務集中的每個元提示任務,獲取對應的任務數(shù)據(jù)集,所述任務數(shù)據(jù)集包括支持集和查詢集;
13、獲取初始提示模型,利用所述支持集對所述初始提示模型中的初始軟提示參數(shù)和初始掩碼語言模型參數(shù)進行一階梯度多步參數(shù)更新,獲得更新后的第一軟提示參數(shù)和第一掩碼語言模型參數(shù);
14、將所述第一軟提示參數(shù)和所述第一掩碼語言模型參數(shù)輸入所述初始提示模型,并利用查詢集對輸入后的初始提示模型中的第一軟提示參數(shù)和第一掩碼語言模型參數(shù)進行二階梯度多步參數(shù)更新,獲得更新后的第二軟提示參數(shù)和第二掩碼語言模型參數(shù);
15、將第二掩碼語言模型參數(shù)輸入所述初始提示模型,根據(jù)輸入后的初始提示模型和原型表達器獲得檢測模型;
16、將第二軟提示參數(shù)作為最終的軟提示參數(shù)。
17、在一實施例中,利用所述支持集對所述初始提示模型中的初始軟提示參數(shù)和初始掩碼語言模型參數(shù)進行一階梯度多步參數(shù)更新,包括:
18、利用如下計算式進行一階梯度多步參數(shù)更新:
19、
20、
21、其中,為第步的掩碼語言模型參數(shù),為第步的軟提示參數(shù),為第-1步的掩碼語言模型參數(shù);為第 -1步的軟提示參數(shù),為在支持集上更新模型參數(shù)時的學習率,符號表示梯度操作,為損失函數(shù),為元提示任務的支持集,為輸入第-1步的掩碼語言模型參數(shù)和第-1步的軟提示參數(shù)的提示模型。
22、在一實施例中,利用查詢集對輸入后的初始提示模型中的第一軟提示參數(shù)和第一掩碼語言模型參數(shù)進行二階梯度多步參數(shù)更新,包括:
23、利用如下計算式進行二階梯度多步參數(shù)更新:
24、
25、其中,為軟提示參數(shù),箭頭表示賦值或更新值,為在查詢集上更新模型參數(shù)時的學習率,為軟提示參數(shù)的二階導數(shù),符號表示梯度操作,為損失函數(shù),為元提示任務的查詢集,為提示模型,表示元提示任務對應的軟提示參數(shù),是單位矩陣,為在支持集上更新模型參數(shù)時的學習率,表示在查詢集上關于參數(shù)的損失函數(shù)梯度,表示在支持集上的損失函數(shù),表示查詢集上關于參數(shù)的損失函數(shù)梯度,表示對求導,表示對參數(shù)計算的hessian矩陣。
26、在一實施例中,二階梯度多步參數(shù)更新的停止更新條件為:
27、
28、其中,分別表示模型參數(shù) θ和軟提示參數(shù)的最優(yōu)值,是損失函數(shù),為元提示任務的查詢集,為提示模型。
29、在一實施例中,將掩碼語言模型的預測結果映射為對應的類別標簽,包括:
30、對于每個類別標簽,構建對應的類別原型;
31、將掩碼語言模型的預測結果編碼為特征表示,并計算所述特征表示與所述類別原型之間的相似度;
32、根據(jù)所述相似度確定所述掩碼語言模型預測結果對應的類別標簽。
33、在一實施例中,對于每個類別標簽,構建對應的類別原型,包括:
34、通過對支持集中的每個類別標簽的所有樣本集合計算嵌入平均值獲得初始原型:
35、
36、其中,表示初始原型,表示支持集中類別標簽為的樣本集合,表示類別標簽為的第個樣本;
37、根據(jù)所述初始原型計算每個樣本的注意力權重;
38、
39、其中,表示歐幾里得距離;表示類別標簽為的第個樣本;
40、根據(jù)每個樣本的注意力權重,利用如下計算式計算每個樣本優(yōu)化后的類別原型:
41、
42、其中,表示原型。
43、在一實施例中,計算所述特征表示與所述類別原型之間的相似度,包括:
44、利用如下計算式計算所述特征表示與所述類別原型之間的相似度:
45、
46、其中,表示查詢樣本屬于類別的概率得分,表示掩碼語言模型的預測結果編碼后的特征表示,表示所有類別標簽的集合,表示以自然對數(shù)為底的指數(shù)函數(shù),是余弦相似度計算公式。
47、本發(fā)明實施例還提供了一種低資源環(huán)境下基于提示學習和元學習的謠言檢測系統(tǒng),包括:處理器和用于存儲能夠在處理器上運行的計算機程序的存儲器;其中,所述處理器用于運行所述計算機程序時,執(zhí)行上述所述方法的步驟。
48、本發(fā)明實施例具有如下有益效果:
49、本發(fā)明實施例利用具有軟提示參數(shù)的提示文本和掩碼語言模型,將謠言檢測任務轉(zhuǎn)化為掩碼預測任務,使得檢測模型能夠在有限的標注數(shù)據(jù)條件下,借助檢測模型中的掩碼語言模型進行有效的特征學習和任務適應,提升檢測模型在缺乏大量標注數(shù)據(jù)的情況下對謠言檢測任務的適應性和檢測精度。