本發(fā)明屬于自然語言處理中的中文仇恨言論檢測,特別是涉及一種融合多維情感特征的中文仇恨言論檢測方法。
背景技術(shù):
1、隨著社交媒體的蓬勃發(fā)展,人們交流的方式發(fā)生了改變,與此同時在網(wǎng)絡(luò)上發(fā)言的便利性和匿名性誘使人們不受現(xiàn)實的約束,致使仇恨言論傳播泛濫,給社會帶來了極大的不穩(wěn)定性。因此,研究出一種高效且準(zhǔn)確的仇恨言論檢測方法具有重要意義。
2、在早期的仇恨言論檢測方法中,主要是利用手工提取的特征,結(jié)合機器學(xué)習(xí)方法對仇恨言論進行分類。但是傳統(tǒng)的機器學(xué)習(xí)方法只能挖掘到仇恨言論的淺層特征,而且檢測效果過于依賴特征的選取。深度學(xué)習(xí)技術(shù)出現(xiàn)后,特別是bert、roberta等預(yù)訓(xùn)練模型憑借其出色的文本處理能力,在仇恨言論檢測中得到了廣泛的應(yīng)用。隨著網(wǎng)絡(luò)流行文化的興起,各類詞匯被賦予新的含義,一些常規(guī)詞在特定語境下也會成為攻擊、侮辱他人的手段,這對傳統(tǒng)的檢測方法提出了挑戰(zhàn)。
3、近期研究表明,仇恨言論通常包含對特定群體的負面情感,因此情感分析技術(shù)的引入為檢測這類隱晦的仇恨言論提供了新的視角。farha和magdy通過結(jié)合cnn與bilstm,并融入情緒信息,構(gòu)建了一個多任務(wù)學(xué)習(xí)模型,有效提升了阿拉伯語推文中仇恨言論的識別能力;rajamanickam等人也將情緒特征引入多任務(wù)學(xué)習(xí)模型,以獲得輔助知識來檢測英文推文中的辱罵性言論。雖然現(xiàn)有研究考慮了情感特征,但大多只考慮與情感分析任務(wù)相關(guān)的情感極性這單一特征,并未考慮情緒強度、否定詞和標(biāo)點符號等其他情感特征;而且大多數(shù)相關(guān)任務(wù)都是針對英文領(lǐng)域,針對中文文本的相關(guān)研究還很少,且中文與英文等語言在表達上有很大差異;同時,現(xiàn)有大部分仇恨言論數(shù)據(jù)集存在數(shù)據(jù)類別分布不平衡的問題。因此,需要提出一種融合多維情感特征的中文仇恨言論檢測方法來解決上述問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是提供一種融合多維情感特征的中文仇恨言論檢測方法,旨在解決現(xiàn)有技術(shù)缺乏針對中文社交媒體的仇恨言論檢測方法,套用外文的技術(shù)無法有效適配中文的特殊語法和語境導(dǎo)致識別效果不佳的問題;具有可通過將bilstm的輸出與roberta句子特征融合,增強檢測模型對局部與全局信息的理解能力的特點。
2、為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:
3、一種融合多維情感特征的中文仇恨言論檢測方法,包括以下步驟:
4、s1,進行社交媒體數(shù)據(jù)集的整理與構(gòu)建;
5、s2,對步驟s1的數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理,獲得仇恨言論檢測模型的輸入數(shù)據(jù);
6、s3,進行仇恨言論檢測模型的搭建、訓(xùn)練以及驗證;仇恨言論檢測模型的網(wǎng)絡(luò)結(jié)構(gòu)包括文本編碼層、情感特征層、bilstm層以及分類層;
7、s4,使用仇恨言論檢測模型對社交媒體中的評論進行測試與識別,包括:
8、s401,在公開數(shù)據(jù)集上,與現(xiàn)有的中文仇恨言論檢測模型進行對比實驗;
9、s402,對仇恨言論檢測模型進行消融實驗;
10、s403,對仇恨言論檢測模型進行參數(shù)分析。
11、優(yōu)選地,步驟s1中,進行社交媒體數(shù)據(jù)集的整理與構(gòu)建包括:
12、使用公開的toxicn和coldataset中文仇恨言論檢測數(shù)據(jù)集,并按8:2的比例隨機劃分訓(xùn)練集和測試集。
13、優(yōu)選地,步驟s2中數(shù)據(jù)預(yù)處理方法包括使用結(jié)巴分詞對文本內(nèi)容進行分詞,以適應(yīng)仇恨言論情感特征的提取。
14、優(yōu)選地,步驟s3中,使用roberta預(yù)訓(xùn)練模型作為基準(zhǔn)模塊來搭建仇恨言論檢測模型,預(yù)處理的仇恨言論文本作為情感特征模塊的輸入,原始文本作為文本編碼層的輸入,對仇恨言論檢測模型進行訓(xùn)練。
15、優(yōu)選地,步驟s4包括,將待檢測的內(nèi)容輸入到訓(xùn)練好的仇恨言論檢測模型中,以識別輸入內(nèi)容是否為仇恨言論。
16、優(yōu)選地,步驟s3中文本編碼層由roberta構(gòu)成,將文本輸入到roberta中,經(jīng)過處理得到文本的詞向量和句子嵌入向量。
17、優(yōu)選地,步驟s3包括:
18、對于給定的輸入文本,利用情感詞典提取情感詞匯、情感強度、情感極性以及其他輔助特征,將四類特征進行拼接獲得文本的情感特征。
19、優(yōu)選地,步驟s3中bilstm層由雙向長短期記憶網(wǎng)絡(luò)bilstm構(gòu)成,將文本的詞向量以及情感特征拼接后輸入到bilstm網(wǎng)絡(luò)中,經(jīng)過處理得到融合了前向和后向兩個方向的上下文依賴特征。
20、優(yōu)選地,步驟s3中,仇恨言論檢測模型的訓(xùn)練包括:
21、s301,提取仇恨言論的文本特征:
22、對于給定的句子s=,表示文本序列的第i個詞,n表示文本序列包含的詞數(shù);
23、通過n-gram和侮辱詞典來判斷是否為侮辱詞,如果是,則進一步劃分其攻擊的目標(biāo)群體;
24、將毒性嵌入與詞嵌入相加獲得詞嵌入的增強表示,的增強表示為;
25、結(jié)合文本的段嵌入和位置嵌入,通過roberta中的transformer模塊訓(xùn)練得到相應(yīng)的詞向量矩陣 v;
26、取roberta的pooler層輸出作為整個句子的特征表示;
27、s302,提取仇恨言論的情感特征:
28、對于給定的句子s=,表示文本序列的第i個詞,n表示文本序列包含的詞數(shù),匯總所有情感中每個單詞和整個文本的分?jǐn)?shù)來獲得豐富的表示;
29、根據(jù)情感詞典在計算其詞級分?jǐn)?shù)s(,e),結(jié)合情感詞典中情感強度和情感極性得分對詞級得分進行加權(quán)并求和,分別得到情感詞匯、情感強度、情感極性;
30、利用情感詞典對文本中的標(biāo)點符號、表情符號、情緒詞、程度詞、否定詞、人稱代詞以及主張詞的使用頻率進行統(tǒng)計得到其他輔助特征,將四類特征進行拼接獲得文本的情感特征;
31、s303,獲取深層上下文依賴特征:
32、將roberta輸出的詞向量矩陣 v與情感特征進行拼接得到向量,然后將輸入到bilstm中,通過在兩個不同方向的長短期記憶網(wǎng)絡(luò)進行計算,最后將兩個不同方向的計算結(jié)果進行合并輸出,對每一時刻的輸出進行保存,并將結(jié)果連接得到 h;
33、得到bilstm層模塊的輸出向量后,將其與句子特征進行拼接,然后使用mlp層組合特征并將輸出向量映射到樣本標(biāo)記空間,使用softmax進行歸一化處理,計算得到每個標(biāo)簽的近似概率值 y。
34、本發(fā)明的有益效果如下:
35、本發(fā)明提供一種融合多維情感特征的中文仇恨言論檢測方法,使用從社交網(wǎng)絡(luò)上收集的公開中文仇恨言論數(shù)據(jù)集對模型進行訓(xùn)練,利用roberta預(yù)訓(xùn)練模型結(jié)合情感詞典,提取文本的詞級、句子級特征及情感特征。通過將bilstm的輸出與roberta句子特征融合,增強模型對局部與全局信息的理解能力。同時為了解決數(shù)據(jù)類別不均衡問題,模型采用焦點損失函數(shù)進行優(yōu)化,通過減少易分類樣本的權(quán)重來增加難分類樣本的關(guān)注度,進而提高模型的魯棒性。