<rt id="mou0a"><small id="mou0a"></small></rt> <rt id="mou0a"><optgroup id="mou0a"></optgroup></rt>

一種漏洞識別方法、裝置、設備和存儲介質與流程

文檔序號:26534902發布日期:2021-09-04 16:50
一種漏洞識別方法、裝置、設備和存儲介質與流程

1.本申請涉及計算機領域,尤其涉及一種漏洞識別方法、裝置、設備和存儲介質。


背景技術:

2.當前,隨著計算機技術的發展,向用戶提供多種服務的程序也越來越多。但是程序可能會在向用戶提供服務的過程中出現漏洞。
3.在一些場景下,用戶可以對使用程序過程中遇到的問題進行反饋,這些問題的反饋包括有關程序漏洞的反饋。技術人員通過對用戶的反饋進行逐條查看,從而獲得有關程序的漏洞信息,以進行相應的處理??梢?,這種漏洞識別的方法效率較低。


技術實現要素:

4.為了解決現有技術中漏洞識別效率低的問題,本申請實施例提供一種漏洞識別方法、裝置、設備和存儲介質,能夠提高漏洞識別的效率。
5.本申請實施例提供一種漏洞識別方法,所述方法包括:
6.獲取目標識別文本;
7.將所述目標識別文本輸入到漏洞識別模型,得到識別結果,所述識別結果用于指示所述目標識別文本中的漏洞信息,所述漏洞識別模型根據目標訓練文本集合訓練得到,所述目標訓練文本集合包括多個標注所述漏洞信息的目標訓練文本。
8.可選地,所述識別結果用于指示所述目標識別文本中的漏洞信息包括:
9.所述識別結果用于指示所述目標識別文本是否描述有漏洞,所述漏洞識別模型根據標注是否描述有漏洞的目標訓練文本訓練得到;或,
10.所述識別結果用于指示所述目標識別文本中描述的漏洞的類型,所述漏洞識別模型根據標注所述漏洞的類型的目標訓練文本訓練得到。
11.可選地,所述方法還包括:
12.獲取多個候選訓練文本;
13.將所述多個候選訓練文本中的每個候選訓練文本分別轉換為對應的向量;
14.對所述多個候選訓練文本對應的向量進行聚類,得到聚類結果;
15.根據所述聚類結果從所述多個候選訓練文本中確定出所述目標訓練文本集合。
16.可選地,所述聚類結果包括聚類中心集合,所述聚類中心集合包括通過聚類得到的一個或多個類別的聚類中心;所述候選訓練文本包括第一候選訓練文本;
17.所述根據所述聚類結果從所述多個候選訓練文本中確定出所述目標訓練文本集合包括:
18.確定所述第一候選訓練文本的向量與所述聚類中心集合中與所述第一候選訓練文本的向量最接近的聚類中心之間的距離;
19.響應于所述距離小于或等于第一閾值,將所述第一候選訓練文本確定為所述目標訓練文本。
20.可選地,所述方法還包括:
21.獲取候選訓練文本集合,所述候選訓練文本集合包括標注的漏洞信息相同的一個或多個候選訓練文本,所述一個或多個候選訓練文本包括第一候選訓練文本;
22.確定所述候選訓練文本集合中包括的候選訓練文本的數目;
23.當所述數目小于或等于第二閾值時,將所述候選訓練文本集合中的第一候選訓練文本進行復制,得到一個或多個復制訓練文本;將所述一個或多個候選訓練文本以及所述一個或多個復制訓練文本加入所述目標訓練文本集合;或,
24.當所述數目小于或等于第三閾值時,根據所述候選訓練文本集合中的第一候選訓練文本生成一個或多個相似訓練文本,所述第一候選訓練文本的語義與所述相似訓練文本在語義上相似;將所述一個或多個候選訓練文本以及所述一個或多個相似訓練文本加入所述目標訓練文本集合。
25.可選地,當所述目標識別文本的識別結果指示所述目標識別文本描述有漏洞時,所述方法還包括:
26.當所述目標識別文本中包括預設類型詞時,將所述目標識別文本描述的漏洞的類型確定為所述預設類型詞標識的漏洞類型。
27.可選地,所述將所述目標識別文本描述的漏洞的類型確定為所述預設類型詞標識的漏洞類型包括:
28.根據所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞得到目標類型短語,所述臨近詞為所述目標識別文本中與所述預設類型詞相鄰近的詞;
29.將所述目標識別文本描述的漏洞的類型確定為所述目標類型短語標識的漏洞類型。
30.可選地,所述根據所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞得到目標類型短語包括:
31.將所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞進行組合,得到候選類型短語;當所述候選類型短語滿足預設詞性條件時,將所述候選類型短語確定為目標類型短語;或,
32.將所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞進行組合,得到候選類型短語;當所述候選類型短語的語義通順度大于或等于第四閾值時,將所述候選類型短語確定為目標類型短語。
33.可選地,所述將所述候選類型短語確定為目標類型短語包括:
34.當所述候選類型短語在所述目標識別文本中出現的次數大于或等于第五閾值時,將所述候選類型短語確定為目標類型短語。
35.可選地,所述識別結果用于指示所述目標識別文本描述有漏洞,在得到識別結果之后,所述方法還包括:
36.確定在得到所述目標識別文本的識別結果之前的預設時間段內,識別結果指示描述有漏洞的歷史識別文本的數目;
37.當所述數目大于或等于第六閾值時,進行告警。
38.可選地,在得到識別結果之后,所述方法還包括:
39.生成第一消息,所述第一消息中包括所述目標識別文本和所述識別結果;
40.發送所述第一消息至工單流轉系統。
41.可選地,所述第一消息中還包括以下其中一項或多項:
42.用戶標識和環節標識;
43.所述用戶標識用于指示所述目標識別文本來自的用戶;所述環節標識用于標識所述目標識別文本描述的漏洞產生的環節。
44.可選地,所述獲取目標識別文本包括:
45.獲取用戶輸入的目標識別對象,所述目標識別對象的類型為非文本類型;
46.將所述目標識別對象轉換為所述目標識別文本;
47.其中,所述目標識別對象的類型包括以下其中一種或多種:
48.圖片、音頻和視頻。
49.本申請實施例還提供一種漏洞識別裝置,所述裝置包括:
50.獲取單元,用于獲取目標識別文本;
51.識別單元,用于將所述目標識別文本輸入到漏洞識別模型,得到識別結果,所述識別結果用于指示所述目標識別文本中的漏洞信息,所述漏洞識別模型根據目標訓練文本集合訓練得到,所述目標訓練文本集合包括多個標注所述漏洞信息的目標訓練文本。
52.本申請實施例還提供一種漏洞識別設備,所述設備包括:處理器和存儲器;
53.所述存儲器,用于存儲指令;
54.所述處理器,用于執行所述存儲器中的所述指令,執行如上述實施例所述的方法。
55.本申請實施例還提供一種計算機可讀存儲介質,包括指令,當其在計算機上運行時,使得計算機執行如上述實施例所述的方法。
56.本申請實施例提供了一種漏洞識別方法,將目標識別文本輸入到漏洞識別模型,就能得到目標識別文本中的漏洞信息的識別結果,該漏洞識別模型是利用多個標注漏洞信息的目標訓練文本進行訓練得到的。由此可見,本申請實施例可以利用訓練得到的漏洞識別模型,快速的識別目標識別文本中的漏洞信息,相較于技術人員逐條查看目標識別文本的漏洞信息,利用漏洞識別模型識別目標識別文本的漏洞信息效率更高。
附圖說明
57.為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其它的附圖。
58.圖1為本申請實施例提供的一種漏洞識別模型的訓練方法的流程圖;
59.圖2為本申請實施例提供的一種漏洞識別方法的流程圖;
60.圖3為本申請實施例提供的一種漏洞識別裝置的結構框圖;
61.圖4為本申請實施例提供的一種漏洞識別設備的結構框圖。
具體實施方式
62.為了使本技術領域的人員更好地理解本申請方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅是本
申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
63.正如背景技術中所述,現在對于用戶的反饋都是通過技術人員逐條查看,尤其是有關程序漏洞的反饋,程序可以是系統級別,也可以是軟件級別。
64.從用戶反饋有關程序的漏洞,到技術人員通過逐條查看用戶反饋,獲得有關程序的漏洞信息,最后對程序的漏洞進行處理,這一過程需要的時間較長,可能會導致系統漏洞造成的影響進一步擴大。也就是說,技術人員逐條查看用戶反饋,獲得有關程序的漏洞信息的方式效率低,因此,如何提高識別用戶反饋的有關程序的漏洞的效率是目前亟待解決的問題。
65.基于此,本申請實施例提供了一種漏洞識別方法,將目標識別文本輸入到漏洞識別模型,就能得到目標識別文本中的漏洞信息的識別結果,該漏洞識別模型是利用多個標注漏洞信息的目標訓練文本進行訓練得到的。由此可見,本申請實施例可以利用訓練得到的漏洞識別模型,快速的識別目標識別文本中的漏洞信息,相較于技術人員逐條查看目標識別文本的漏洞信息,利用漏洞識別模型識別目標識別文本的漏洞信息效率更高。
66.為了更好地進行漏洞識別,首先要對漏洞識別模型進行訓練,因此本申請實施例首先介紹漏洞識別模型的訓練方法。參見圖1,該圖為本申請實施例提供的一種漏洞識別模型的訓練方法的流程圖。
67.本申請實施例提供的漏洞識別模型的訓練方法包括如下步驟:
68.s101,獲取目標訓練文本集合,所述目標訓練文本集合包括多個標注漏洞信息的目標訓練文本。
69.在本申請的實施例中,目標訓練文本是已經標注漏洞信息的文本,例如目標訓練文本可以是用戶反饋的有關程序漏洞的文本,或者是模擬生成的有關程序漏洞的文本等。目標訓練文本的數目為多個。
70.目標文本訓練集合包括多個標注漏洞信息的目標訓練文本。被標注漏洞信息的目標訓練文本可以用于漏洞識別模型的訓練。
71.對目標訓練文本標注漏洞信息,可以有以下三種實現方式:
72.第一種可能的實現方式:漏洞信息可以表示有無漏洞。比如說,標記為0的目標訓練文本代表該目標訓練文本中沒有描述漏洞,標記為1的目標訓練文本代表該目標訓練文本中描述有漏洞。
73.第二種可能的實現方式:漏洞信息可以表示漏洞的類型。例如漏洞的類型可以是業務類型,業務類型可以是審核、計劃或數據等。漏洞的類型也可以是技術特征類型,技術特征類型反映漏洞在技術領域的類別,技術特征類型可以是界面類、功能類或崩潰類等,例如界面類可以是界面文字錯誤,功能類可以是程序功能出現問題。
74.以漏洞的業務類型進行舉例說明對目標訓練文本進行表述漏洞信息,比如說,標記為1的目標訓練文本代表該目標訓練文本中描述漏洞的類型為審核類,標記為2的目標訓練文本代表該目標訓練文本中描述漏洞的類型為數據類,標記為3的目標訓練文本代表該目標訓練文本中描述漏洞的類型為計劃類。
75.第三種可能的實現方式:漏洞信息可以是上述兩種結合在一起。比如說,標記為0的目標訓練文本代表該目標訓練文本中沒有描述漏洞,標記為1的目標訓練文本代表該目
標訓練文本中描述有漏洞,并且該目標訓練文本中描述漏洞的類型為審核類,標記為2的目標訓練文本代表該目標訓練文本中描述有漏洞,并且該目標訓練文本中描述漏洞的類型為數據類,標記為3的目標訓練文本代表該目標訓練文本中描述有漏洞,并且該目標訓練文本中描述漏洞的類型為計劃類。
76.本申請實施例列舉的漏洞的類型和對漏洞信息進行的標記不構成對本申請的限定,本領域技術人員可以進行自由變型。
77.s102,根據目標訓練文本集合訓練所述漏洞識別模型。
78.在本申請的實施例中,可以利用目標訓練文本集合中的多個標注漏洞信息的目標訓練文本訓練漏洞識別模型,漏洞識別模型的輸入為目標訓練文本,漏洞識別模型的輸出為目標訓練文本的識別結果,該識別結果指示目標訓練文本的漏洞信息。
79.根據上述對目標訓練文本標注漏洞信息的不同,訓練時得到的漏洞識別模型也不同,相應的,漏洞識別模型的輸出也不相同。
80.在本申請的實施例中,漏洞識別模型可以是神經網絡模型,例如可以是深度雙向預訓練(bidirectional encoder representation from transformers,bert)模型。bert模型進行訓練可以分為兩個部分,第一部分是預訓練部分,利用通用的文本進行訓練,得到通用的語言模型,第二部分是微調部分,利用經過標注后的目標訓練文本對通用的語言模型進行微調,得到針對標注后的目標訓練文本的漏洞識別模型。
81.在本申請的實施例中,為了提升漏洞識別模型的訓練效果,目標訓練文本集合中的目標訓練文本可以是進行篩選過的文本,是從多個候選訓練文本中確定出的目標文本集合,候選訓練文本是已經標注漏洞信息的文本。
82.以下將對從多個候選訓練文本中確定出目標訓練文本集合的步驟進行介紹:
83.s1021,獲取多個候選訓練文本。
84.在本申請的實施例中,候選訓練文本是已經標注漏洞信息的文本,例如可以是用戶反饋的有關程序漏洞的文本,或者是模擬生成的有關程序漏洞的文本等。
85.對候選訓練文本進行漏洞信息的標注可以參考對目標訓練文本進行標注的步驟,在此不再贅述。
86.s1022,將所述多個候選訓練文本中的每個候選訓練文本分別轉換為對應的向量。
87.在進行漏洞識別模型的訓練時,將多個候選訓練文本中的每個候選訓練文本都分別轉換為對應的向量,例如可以利用自然語言處理模型將每個候選訓練文本轉換為對應的向量。
88.s1023,對所述多個候選訓練文本對應的向量進行聚類,得到聚類結果。
89.在本申請的實施例中,通過對多個候選訓練文本中每個候選訓練文本對應的向量進行聚類,得到聚類結果。聚類可以是對多個候選訓練文本的篩選,剔除與漏洞信息無關的文本。與漏洞信息無關的文本可以稱為臟樣本,例如可以是用戶反饋的無意義的文本。比如說,用戶反饋的文本為一串數字,這與漏洞信息毫無關系,為臟樣本。也就是說,可能不是全部的候選訓練文本都能夠確定為目標訓練文本,對于經過聚類后無法歸類的候選訓練文本,可能屬于對漏洞識別模型的訓練起到的效果較小的訓練文本,可以進行剔除,保留通過聚類后能夠歸類為某一類別的候選訓練文本,提高漏洞識別模型訓練的準確性。
90.聚類結果可以包括聚類中心集合,聚類中心集合包括一個或多個聚類中心,聚類
中心是通過對多個候選訓練文本的向量進行聚類得到的。
91.s1024,根據所述聚類結果從所述多個候選訓練文本中確定出目標訓練文本集合。
92.在本申請的實施例中,在得到一個或多個聚類中心的聚類結果之后,可以根據聚類結果從多個候選訓練文本中確定目標訓練文本。
93.下面以第一候選訓練文本為例介紹根據聚類結果從多個候選訓練文本中確定目標訓練文本集合的一種可能的實現方式,第一候選訓練文本為多個候選訓練文本中任意一個文本:
94.確定第一候選訓練文本的向量與聚類中心集合中與第一候選訓練文本的向量最接近的聚類中心之間的距離,響應于距離小于或等于第一閾值,將第一候選訓練文本確定為目標訓練文本,將第一候選訓練文本加入目標訓練文本集合中。其中,第一閾值可以根據實際情況進行確定,本申請實施例對此不進行具體確定。
95.也就是說,可以得到第一候選訓練文本的向量與聚類中心集合中每個聚類中心之間的距離,確定第一候選訓練文本的向量與聚類中心集合中與第一候選訓練文本的向量最接近的聚類中心之間的距離,若該距離小于或等于第一閾值,則說明第一候選訓練文本可以被歸類為某一類別,可以將第一候選訓練文本確定為目標訓練文本,并將第一候選訓練文本加入目標訓練文本集合中。若該距離大于第一閾值,則說明第一候選訓練文本無法被歸類為某一類別,第一候選訓練文本為與漏洞信息語義上無關的文本,為臟樣本,則第一候選訓練文本不被確定為目標訓練文本。
96.在本申請的實施例中,多個候選訓練文本可以分為多個候選訓練文本集合,每個候選訓練文本集合包括標注的漏洞信息相同的一個或多個候選訓練文本。
97.考慮到每個候選訓練文本集合包括的候選訓練文本的數目可能不同,為了提高漏洞識別模型的識別效果,可以對包括候選訓練文本的數目較少的某個候選訓練文本集合進行候選訓練文本的數目的增加,這樣可以使得候選訓練文本的數目較少的某個候選訓練文本集合經過候選訓練文本的數目的增加后,能夠與其他候選訓練文本集合包括的候選訓練文本的數目接近,進而多個候選訓練文本集合包括的候選訓練文本的數目較為均勻,提高漏洞識別模型訓練的效果。
98.下面以第一候選訓練文本為例,對兩種增加候選訓練文本集合中包括的候選訓練文本的數目的方式進行介紹,第一候選訓練文本為第一候選訓練文本集合包括的一個或多個候選訓練文本中任意一個文本,第一候選訓練文本集合為多個候選文本集合中候選訓練文本數目較少的集合:
99.第一種可能的實現方式為將第一候選訓練文本集合中的第一候選訓練文本進行復制,得到一個或多個復制訓練文本。
100.也就是說,在獲取到第一候選訓練文本集合之后,可以確定第一候選訓練文本集合中包括的候選訓練文本的數目,若該數目小于或等于第二閾值,則說明該第一候選訓練文本集合中包括的候選訓練文本的數目較少,可以通過將第一候選訓練文本集合中的第一候選訓練文本進行復制,得到一個或多個復制訓練文本,之后將一個或多個候選訓練文本以及一個或多個復制訓練文本共同加入目標訓練文本集合,作為目標訓練文本進行漏洞識別模型的訓練。
101.第二種可能的實現方式為根據第一候選訓練文本集合中的第一候選訓練文本生
成一個或多個相似訓練文本,第一候選訓練文本的語義與相似訓練文本在語義上相似。
102.也就是說,在獲取到第一候選訓練文本集合之后,可以確定第一候選訓練文本集合中包括的候選訓練文本的數目,若該數目小于或等于第三閾值,則說明該第一候選訓練文本集合中包括的候選訓練文本的數目較少,可以通過將第一候選訓練文本生成一個或多個相似訓練文本,之后將一個或多個候選訓練文本以及一個或多個相似訓練文本加入目標訓練文本集合,作為目標訓練文本進行漏洞識別模型的訓練。
103.其中,將第一候選訓練文本生成一個或多個相似訓練文本,可以是將第一候選訓練文本中的語句或詞匯利用同義詞替換得到一個或多個相似訓練文本,以達到第一候選訓練文本的語義與相似訓練文本在語義上相似的目的。
104.第二閾值和第三閾值可以根據實際情況進行確定,第二閾值和第三閾值可以相同,也可以不同,本申請實施例對此不進行具體確定。
105.在本申請的實施例中,第二候選訓練文本集合為多個候選文本集合中候選訓練文本數目較多的集合,第二候選訓練文本集合是不需要經過候選訓練文本數目變化的集合,可以直接將第二候選訓練文本集合包括的候選訓練文本加入目標訓練文本集合。
106.在本申請的實施例中,可以在對多個候選訓練文本對應的向量進行聚類之后,再增加第一候選訓練文本集合中候選訓練文本的數目,也就是說,可以在剔除臟樣本之后,再執行將多個候選訓練文本集合包括的候選訓練文本數目接近的步驟,這樣可以進一步增加漏洞識別模型的準確性。
107.如上文所述,在標注目標訓練文本的漏洞信息時,可以根據漏洞的類型進行標注,漏洞的類型可以根據目標訓練文本中包括的預設類型詞進行確定,即可以根據目標訓練文本包括的預設類型詞來標識目標訓練文本的漏洞類型。其中,預設類型詞可以是預先確定的有關漏洞的類型的詞匯,在本申請的實施例中,利用預設類型詞進行標識目標訓練文本的漏洞類型可以是基于業務類型進行分類的。
108.作為一種示例,漏洞的業務類型可以與數據有關,則預設類型詞可以是數據,若在目標訓練文本中包括數據這一預設類型詞,則說明該目標訓練文本描述的漏洞的類型為數據有關的類型。
109.經過上述介紹可以得知,本申請實施例提供的漏洞識別模型是利用多個標注漏洞信息的目標訓練文本進行訓練得到的。
110.基于上述實施例提供的訓練方法訓練的漏洞識別模型,本申請實施例還提供一種利用漏洞識別模型進行漏洞識別的方法。
111.參見圖2,該圖為本申請實施例提供的一種漏洞識別方法的流程圖。
112.本實施例提供的漏洞識別方法包括如下步驟:
113.s201,獲取目標識別文本。
114.在本申請的實施例中,目標識別文本為待識別的文本,是沒有經過標注漏洞信息的文本??蛇x的,所述待識別的文本來自用戶。在一些示例中,可以采集用戶輸入的信息,根據用戶輸入的信息形成待識別的文本。
115.在實際應用中,用戶輸入的信息可以是文本類型,也可能是非文本類型,非文本類型的信息可以是圖片、音頻或視頻等。
116.若用戶輸入的信息為文本類型,則直接獲取目標識別文本。
117.若用戶輸入的信息為非文本類型,則獲取用戶輸入的目標識別對象,目標識別對象為非文本類型的信息,例如圖片、音頻或視頻等,之后將目標識別對象轉換為目標識別文本。將非文本類型的目標識別對象轉換為目標識別文本可以利用語音轉換模型或圖像轉換模型。
118.s202,將所述目標識別文本輸入到漏洞識別模型,得到識別結果,所述識別結果用于指示所述目標識別文本中的漏洞信息,所述漏洞識別模型根據目標訓練文本集合訓練得到,所述目標訓練文本集合包括多個標注所述漏洞信息的目標訓練文本。
119.在本申請的實施例中,將目標識別文本輸入到漏洞識別模型,漏洞識別模型輸出目標識別文本的識別結果,識別結果指示目標識別文本中的漏洞信息。其中,漏洞識別模型采用本申請實施例提供的訓練方法進行訓練,具體訓練方法參考上述實施例,在此不再贅述。
120.如上述訓練方法中不同的漏洞信息訓練得到的漏洞識別模型不同,相應地,利用不同的漏洞識別模對目標識別文本進行識別時,輸出的識別結果也不相同,具體輸出的識別結果根據使用的漏洞識別模型進行確定。
121.在本申請的實施例中,在標注目標識別文本的漏洞的類型時,可以根據目標識別文本中包括的預設類型詞進行確定,即根據目標識別文本包括的預設類型詞來標識的目標識別文本的漏洞類型。其中,預設類型詞可以是預先確定的有關漏洞的類型的詞匯,漏洞的類型可以是業務類型,業務類型可以是審核、計劃或數據等。
122.作為一種示例,漏洞的業務類型可以與數據有關,則預設類型詞可以是數據,若在目標識別文本中包括數據這一預設類型詞,則說明該目標識別文本描述的漏洞的類型為數據有關的類型。
123.在本申請的實施例中,利用預設類型詞進行標識目標識別文本的漏洞類型是基于業務類型進行分類的,還可以對目標識別文本的漏洞類型在業務類型的基礎上進行細分,以得到更加詳細的目標識別文本的漏洞信息。
124.作為一種可能的實現方式,可以根據預設類型詞和目標識別文本中與預設類型詞對應的臨近詞得到目標類型短語,將目標識別文本描述的漏洞的類型確定為目標類型短語標識的漏洞類型。其中,臨近詞為目標識別文本中與預設類型詞相鄰近的詞,即臨近詞為預設類型詞前n個詞和后n個詞中的一種或多種,n為正整數。
125.作為一種示例,預設類型詞為數據,臨近詞為預設類型詞前2個詞,臨近詞為沒有,則目標類型短語為沒有數據。
126.作為另一種示例,預設類型詞為計劃,臨近詞為預設類型詞后2個詞,臨近詞為報表,則目標類型短語為計劃報表。
127.在實際應用中,不是全部的預設類型詞和臨近詞進行組合都能夠得到目標類型短語,在預設類型詞和臨近詞進行組合得到的候選類型短語不能滿足預設詞性條件或語義通順度不高,都不將候選類型短語確定為目標類型短語,這是由于候選類型短語不能滿足某些條件時不足以反映漏洞的類型。
128.能夠將預設類型詞和臨近詞進行組合得到的候選類型短語確定為目標類型短語有以下兩種可能的實現方式:
129.第一種可能的實現方式為當候選類型短語滿足預設詞性條件時,將候選類型短語
確定為目標類型短語。其中預設詞性條件可以是預先設定的目標類型短語的詞性條件,例如預設詞性條件可以為動詞加名詞的組合。
130.作為一種示例,預設詞性條件為動詞加名詞的組合,預設類型詞為計劃,臨近詞為預設類型詞前2個詞,臨近詞為復制,則候選類型短語為復制計劃,候選類型短語滿足預設詞性條件,可以將候選類型短語復制計劃確定為目標類型短語。
131.第二種可能的實現方式為當候選類型短語的語義通順度大于或等于第四閾值時,將候選類型短語確定為目標類型短語。其中,可以對候選類型短語輸入至生成式預訓練(generative pre
?
training2,gtp2)模型對語義通順度進行確定。gtp2模型的輸出為語義通順度的數值,該數值在0到1之間,數值越高代表語義通順度越高。
132.在實際應用中,當候選類型短語滿足上述任意一種實現方式之后,還可以繼續判斷候選類型短語在目標訓練文本集合中出現的次數是否大于或等于第五閾值時,當大于或等于第五閾值時,將候選類型短語確定為目標類型短語,以進一步增加候選類型短語反映漏洞的類型的準確性。
133.第四閾值和第五閾值可以根據實際情況進行確定,本申請實施例對此不進行具體確定。
134.在本申請的實施例中,若漏洞識別模型的識別結果指示目標識別文本描述有漏洞,在得到識別結果之后,還可以統計在得到目標識別文本的識別結果之前的預設時間段內,識別結果指示描述有漏洞的歷史識別文本的數目,若該數目大于或等于第六閾值,則進行告警處理。其中,歷史識別文本為利用漏洞識別模型進行識別過,得到識別結果的文本。
135.也就是說,若識別結果指示描述有漏洞的文本在預設時間段內的數目達到一定數量,則說明用戶反饋的漏洞發生的次數較為頻繁,可以進行告警處理,以便通知相關人員及時進行處理。
136.第六閾值和預設時間段可以根據實際情況進行設置,本申請實施例對此不進行具體限定。
137.在本申請的實施例中,在將目標識別文本輸入至漏洞識別模型,得到識別結果之后,還可以生成包括目標識別文本和識別結果的第一消息,并將該第一消息發送給提供工單流轉系統服務的服務器或相關人員。第一消息可以通過通訊軟件進行發送,例如飛書或微信等。工單流轉系統是產品或運營等人員使用的工作系統。
138.在本申請的實施例中,第一消息中還可以包括用戶標識或環節標識,其中,用戶標識用于標識目標識別文本來自的用戶,用戶標識可以是用戶的用戶名,環節標識用于標識目標識別文本描述的漏洞產生的環節,例如目標識別文本描述的漏洞來自用戶的登錄環節。
139.本申請實施例提供的漏洞識別方法,將目標識別文本輸入到漏洞識別模型,就能得到目標識別文本中的漏洞信息的識別結果,該漏洞識別模型是利用多個標注漏洞信息的目標訓練文本進行訓練得到的。由此可見,本申請實施例可以利用訓練得到的漏洞識別模型,快速的識別目標識別文本中的漏洞信息,相較于技術人員逐條查看目標識別文本的漏洞信息,利用漏洞識別模型識別目標識別文本的漏洞信息效率更高。
140.基于以上實施例提供的一種漏洞識別方法,本申請實施例還提供了一種漏洞識別裝置,下面結合附圖來詳細說明其工作原理。
141.參見圖3,該圖為本申請實施例提供的一種漏洞識別裝置的結構框圖。
142.本實施例提供的漏洞識別裝置300包括:
143.獲取單元310,用于獲取目標識別文本。
144.識別單元320,用于將所述目標識別文本輸入到漏洞識別模型,得到識別結果,所述識別結果用于指示所述目標識別文本中的漏洞信息,所述漏洞識別模型根據目標訓練文本集合訓練得到,所述目標訓練文本集合包括多個標注所述漏洞信息的目標訓練文本。
145.可選地,所述識別結果用于指示所述目標識別文本中的漏洞信息包括:
146.所述識別結果用于指示所述目標識別文本是否描述有漏洞,所述漏洞識別模型根據標注是否描述有漏洞的目標訓練文本訓練得到;或,
147.所述識別結果用于指示所述目標識別文本中描述的漏洞的類型,所述漏洞識別模型根據標注所述漏洞的類型的目標訓練文本訓練得到。
148.可選地,所述裝置還包括:
149.候選訓練文本獲取單元,用于獲取多個候選訓練文本;
150.轉換單元,用于將所述多個候選訓練文本中的每個候選訓練文本分別轉換為對應的向量;
151.聚類單元,用于對所述多個候選訓練文本對應的向量進行聚類,得到聚類結果;
152.第一確定單元,用于根據所述聚類結果從所述多個候選訓練文本中確定出所述目標訓練文本集合。
153.可選地,所述聚類結果包括聚類中心集合,所述聚類中心集合包括通過聚類得到的一個或多個類別的聚類中心;所述候選訓練文本包括第一候選訓練文本;
154.所述第一確定單元具體用于:
155.確定所述第一候選訓練文本的向量與所述聚類中心集合中與所述第一候選訓練文本的向量最接近的聚類中心之間的距離;
156.響應于所述距離小于或等于第一閾值,將所述第一候選訓練文本確定為所述目標訓練文本。
157.可選地,所述裝置還包括:
158.候選訓練文本集合獲取單元,用于獲取候選訓練文本集合,所述候選訓練文本集合包括標注的漏洞信息相同的一個或多個候選訓練文本,所述一個或多個候選訓練文本包括第一候選訓練文本;
159.第二確定單元,用于確定所述候選訓練文本集合中包括的候選訓練文本的數目;
160.加入單元,用于當所述數目小于或等于第二閾值時,將所述候選訓練文本集合中的第一候選訓練文本進行復制,得到一個或多個復制訓練文本;將所述一個或多個候選訓練文本以及所述一個或多個復制訓練文本加入所述目標訓練文本集合;或,用于當所述數目小于或等于第三閾值時,根據所述候選訓練文本集合中的第一候選訓練文本生成一個或多個相似訓練文本,所述第一候選訓練文本的語義與所述相似訓練文本在語義上相似;將所述一個或多個候選訓練文本以及所述一個或多個相似訓練文本加入所述目標訓練文本集合。
161.可選地,當所述目標識別文本的識別結果指示所述目標識別文本描述有漏洞時,所述裝置還包括:
162.第三確定單元,用于當所述目標識別文本中包括預設類型詞時,將所述目標識別文本描述的漏洞的類型確定為所述預設類型詞標識的漏洞類型。
163.可選地,所述第三確定單元具體用于:
164.根據所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞得到目標類型短語,所述臨近詞為所述目標識別文本中與所述預設類型詞相鄰近的詞;
165.將所述目標識別文本描述的漏洞的類型確定為所述目標類型短語標識的漏洞類型。
166.可選地,所述第三確定單元具體用于:
167.將所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞進行組合,得到候選類型短語;當所述候選類型短語滿足預設詞性條件時,將所述候選類型短語確定為目標類型短語;或,
168.將所述預設類型詞和所述目標識別文本中與所述預設類型詞對應的臨近詞進行組合,得到候選類型短語;當所述候選類型短語的語義通順度大于或等于第四閾值時,將所述候選類型短語確定為目標類型短語。
169.可選地,所述第三確定單元具體用于:
170.當所述候選類型短語在所述目標識別文本中出現的次數大于或等于第五閾值時,將所述候選類型短語確定為目標類型短語。
171.可選地,所述識別結果用于指示所述目標識別文本描述有漏洞,在得到識別結果之后,所述裝置還包括:
172.第四確定單元,用于確定在得到所述目標識別文本的識別結果之前的預設時間段內,識別結果指示描述有漏洞的歷史識別文本的數目;
173.告警單元,用于當所述數目大于或等于第六閾值時,進行告警。
174.可選地,在得到識別結果之后,所述裝置還包括:
175.生成單元,用于生成第一消息,所述第一消息中包括所述目標識別文本和所述識別結果;
176.發送單元,用于發送所述第一消息至工單流轉系統。
177.可選地,所述第一消息中還包括以下其中一項或多項:
178.用戶標識和環節標識;
179.所述用戶標識用于指示所述目標識別文本來自的用戶;所述環節標識用于標識所述目標識別文本描述的漏洞產生的環節。
180.可選地,所述獲取單元具體用于:
181.獲取用戶輸入的目標識別對象,所述目標識別對象的類型為非文本類型;
182.將所述目標識別對象轉換為所述目標識別文本;
183.其中,所述目標識別對象的類型包括以下其中一種或多種:
184.圖片、音頻和視頻。
185.基于以上實施例提供的一種漏洞識別方法,本申請實施例還提供了一種漏洞識別設備,漏洞識別設備400包括:
186.處理器410和存儲器420,處理器的數量可以一個或多個。在本申請的一些實施例中,處理器和存儲器可通過總線或其它方式連接。
187.存儲器可以包括只讀存儲器和隨機存取存儲器,并向處理器提供指令和數據。存儲器的一部分還可以包括nvram。存儲器存儲有操作系統和操作指令、可執行模塊或者數據結構,或者它們的子集,或者它們的擴展集,其中,操作指令可包括各種操作指令,用于實現各種操作。操作系統可包括各種系統程序,用于實現各種基礎業務以及處理基于硬件的任務。
188.處理器控制終端設備的操作,處理器還可以稱為cpu。
189.上述本申請實施例揭示的方法可以應用于處理器中,或者由處理器實現。處理器可以是一種集成電路芯片,具有信號的處理能力。在實現過程中,上述方法的各步驟可以通過處理器中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器可以是通用處理器、dsp、asic、fpga或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件??梢詫崿F或者執行本申請實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本申請實施例所公開的方法的步驟可以直接體現為硬件譯碼處理器執行完成,或者用譯碼處理器中的硬件及軟件模塊組合執行完成。軟件模塊可以位于隨機存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領域成熟的存儲介質中。該存儲介質位于存儲器,處理器讀取存儲器中的信息,結合其硬件完成上述方法的步驟。
190.本申請實施例還提供一種計算機可讀存儲介質,用于存儲程序代碼,該程序代碼用于執行前述各個實施例的方法中的任意一種實施方式。
191.當介紹本申請的各種實施例的元件時,冠詞“一”、“一個”、“這個”和“所述”都意圖表示有一個或多個元件。詞語“包括”、“包含”和“具有”都是包括性的并意味著除了列出的元件之外,還可以有其它元件。
192.需要說明的是,本領域普通技術人員可以理解實現上述方法實施例中的全部或部分流程,是可以通過計算機程序來指令相關的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質中,該程序在執行時,可包括如上述各方法實施例的流程。其中,所述存儲介質可為磁碟、光盤、只讀存儲記憶體(read
?
only memory,rom)或隨機存儲記憶體(random access memory,ram)等。
193.本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元及模塊可以是或者也可以不是物理上分開的。另外,還可以根據實際的需要選擇其中的部分或者全部單元和模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解并實施。
194.以上所述僅是本申請的具體實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本申請的保護范圍。
再多了解一些
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
日本无码免费一区二区三区,日韩免费视频一一二区,亚洲伊人成无码综合网,国产高清卡1卡2卡3,国产一卡二卡三卡四卡网站 皇上龙椅下和宫女H| 农民工简易窝棚嫖妓精彩对白| 大尺度无遮挡寂寞少妇自慰| 中文字幕在线不卡日本V二区| 男女色啪网站| 狠狠久久噜噜熟女| 美女的扒开尿口让男人桶| 黄页网站视频免费大全| 最近中文字幕完整免费视频| 一本高清一卡二卡三卡| 日本丰满熟妇有毛| 公息肉吊粗大爽| 国产欧美日韩在线观看一区二区| 学生被强奷到高潮喷水在线观看| 午夜伦4408私人影院| AV成长片在线观看免费| 国产精品亚洲二区在线看| 男女边摸边吃奶边做视频免费 | 免费国产污网站在线观看不要卡| 国产欧美VA欧美VA香蕉在线| 老外又粗又长一晚做五次| 首页 动漫 亚洲 欧美 日韩| 香蕉视频官方app入口| 2021年最新电视剧在线观看| 一卡二卡三卡四卡每日更新在线观看| 亚洲久久中文少妇| 国产厕所撒尿无码高清| 1000部做羞羞事禁片免费视频| 小草在线观看播放视频| 尤物亚洲久久东京热| 天天影视综合网网综合久久| 欧美大屁股XXXX| 一本到高清无码中文在线| 制服丝袜亚洲AV国产AV| 亚洲人成网站18禁止| 暖暖视频在线观看日本| 中文字幕日本中文无码| 亚洲妇女熟BBW| 女女互慰潮喷在线观看| 未成满18禁止免费网站福利| 护士被医生办公室狂玩| 国产成人AV片在线观看| 韩国电影三级中文字幕HD| 女人下面毛多水多视频| 女人下面毛多水多视频| 亚洲在AV极品无码天堂手机版| 97无码视频在线看视频| 日韩免费视频一区二区三区| 欧美人与动人物牲交| 国色天香中文字幕2019版| 毛1卡2卡3卡4卡免费无码| 看黄a大片真人大度尺视频| 高清一卡二卡三卡四卡免费| 十十岁宗整版在线观看免费| 午夜dj影院免费视频观看完整版下载| 8x8ⅹ永久免费视频| 欧美 大陆 偷拍 精品| 欧美国产日韩a欧美视频| 欧美人C交ZOOZ0OXX| 成年偏黄全免费网站| 无码AV在线不卡在线观看| 亚洲成年AV男人的天堂| 琪琪网最新伦永久观看2019| 两个人的视频全免费观看在线| 亚洲狠狠色综合图片区| 2020国内精品久久久久精品| 国模沙沙浓毛150P| 第九色区AV天堂| 一本到高清在线视频观看| 无遮挡男女一进一出视频真人| 国色天香社区在线看免费| 抖音在线视频有个绿点吗| FREE性欧美人与DOOG| 精品丝袜国产自在线拍高清| 亚州AV| 在办公室被弄到了高潮视频| 免费大黄网站在线观| 亚洲成在人线av| GAY男同GV视频播放免费| 韩国三级片大全| 日本免费影视AV| 欧美在线看片a免费观看| 24小时最新更新在线观看| 少妇挑战六个黑人惨叫| 黄 色 成 人网站APP| 学生 呦女| 国产女人叫床高潮视频| JK女高中制服白丝裤自慰| 欧美 卡通 另类 偷拍 在线| 午夜免费观看60秒试看| 亚洲日本欧美天堂在线| 2012免费观看完整版在线播放| 在线∨片免费观看视频| 天天躁日日躁狠狠躁欧美老妇| 50岁熟女狂高潮| 国产真实伦对白精彩视频| 欧美真人性做爰高清大片| 欧美大胆A级视频| 国产美女高潮流白浆视频| 毛1卡2卡3卡4卡免费无码| の友人在线播放| 欧美黑人巨大VIDEOS极品| 中国熟女粗暴普通话对白| 欧美BBWHD老太大| 特级欧美毛片免费观看| 2021亚洲精品1卡2卡3卡| 爆乳白丝护士自慰喷水| BAOYU118.免费视频入口| 白俄罗斯爆乳美女A片| 自在自线亚洲А∨天堂在线| 人妻人人做人碰人人添| 老司国产精品免费视频| 2012手机免费观看版国语| 日韩亚洲制服丝袜中文字幕| 久久青青草原精品国产| 一本追伊人大杳蕉视频| 亚洲熟伦熟女专区| 日本暧暧做免费高清视频| 国产性色强伦免费视频| JAPANESE丰满成熟MATU| JAPANESE乱子国产| 免费V片无码动漫在线观看网址| 新影音先锋男人色资源网|