本發(fā)明是有關(guān)于一種計(jì)算機(jī)系統(tǒng)及其運(yùn)作方法,且特別是有關(guān)于一種多重流形嵌入學(xué)習(xí)方法及系統(tǒng)。
背景技術(shù):
1、機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的一個(gè)途徑之一,即以機(jī)器學(xué)習(xí)為手段,解決人工智能中的部分問題。
2、在數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)中,分布外(out-of-distribution,ood)樣本是指未見過的實(shí)例,它們不屬于機(jī)器學(xué)習(xí)模型在訓(xùn)練時(shí)使用的分布。人工智能模型的部署經(jīng)常會面臨ood挑戰(zhàn),這是因?yàn)榕c原始訓(xùn)練數(shù)據(jù)相比,測試數(shù)據(jù)存在域偏移(domain?shift)。這種偏移可能會使訓(xùn)練好的模型對錯誤決策過于自信,從而導(dǎo)致可信度和可靠性問題。然而,由于ood樣本空間比id數(shù)據(jù)更廣闊的特性,從id數(shù)據(jù)中檢測ood樣本一直是一項(xiàng)困難的任務(wù)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提出一種多重流形嵌入學(xué)習(xí)方法及系統(tǒng),改善先前技術(shù)的問題。
2、在本發(fā)明的一實(shí)施例中,本發(fā)明所提出的多重流形嵌入學(xué)習(xí)方法包含以下步驟:將使用識別(id)訓(xùn)練數(shù)據(jù)以訓(xùn)練多重流形嵌入學(xué)習(xí)模型,進(jìn)而凍結(jié)多重流形嵌入學(xué)習(xí)模型的參數(shù)以得出已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型;將測試數(shù)據(jù)輸入到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中,進(jìn)而使用閾值將分布外(ood)樣本與id樣本區(qū)分開來。
3、在本發(fā)明的一實(shí)施例中,多重流形嵌入學(xué)習(xí)方法還包含:初始化多重流形嵌入學(xué)習(xí)模型的復(fù)數(shù)個(gè)分支,以編碼不同的復(fù)數(shù)個(gè)流形。
4、在本發(fā)明的一實(shí)施例中,復(fù)數(shù)個(gè)分支包含一超球分支與一雙曲分支,不同的復(fù)數(shù)個(gè)流形包含一超球流形與一雙曲流形。
5、在本發(fā)明的一實(shí)施例中,將使用id訓(xùn)練數(shù)據(jù)以訓(xùn)練多重流形嵌入學(xué)習(xí)模型,進(jìn)而凍結(jié)多重流形嵌入學(xué)習(xí)模型的參數(shù)以得出已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型的步驟包含:于每個(gè)訓(xùn)練迭代,提取不同的復(fù)數(shù)個(gè)流形中每一個(gè)的嵌入并計(jì)算相應(yīng)的損失,進(jìn)而依據(jù)損失,更新多重流形嵌入學(xué)習(xí)模型;在多重流形嵌入學(xué)習(xí)模型訓(xùn)練完成以后,凍結(jié)多重流形嵌入學(xué)習(xí)模型的參數(shù)以得出已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型;將id訓(xùn)練數(shù)據(jù)饋送到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中,以提取id參考嵌入。
6、在本發(fā)明的一實(shí)施例中,損失包含不同的復(fù)數(shù)個(gè)流形的損失以及交叉熵分類損失。
7、在本發(fā)明的一實(shí)施例中,將測試數(shù)據(jù)輸入到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中,進(jìn)而使用閾值將ood樣本與id樣本區(qū)分開來的步驟包含:將測試數(shù)據(jù)輸入到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中以提取潛在嵌入;基于潛在嵌入與id參考嵌入之間的距離,計(jì)算ood分?jǐn)?shù);比較ood分?jǐn)?shù)與閾值以進(jìn)行ood偵測,ood偵測將測試數(shù)據(jù)中的ood樣本與id樣本區(qū)分開來。
8、在本發(fā)明的一實(shí)施例中,本發(fā)明所提出的多重流形嵌入學(xué)習(xí)系統(tǒng)包含儲存裝置以及處理器,處理器電性連接儲存裝置。儲存裝置儲存至少一指令,處理器用以存取并執(zhí)行至少一指令以:初始化多重流形嵌入學(xué)習(xí)模型的復(fù)數(shù)個(gè)分支,以編碼不同的復(fù)數(shù)個(gè)流形;將使用id訓(xùn)練數(shù)據(jù)以訓(xùn)練多重流形嵌入學(xué)習(xí)模型,進(jìn)而凍結(jié)多重流形嵌入學(xué)習(xí)模型的參數(shù)以得出已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型;將測試數(shù)據(jù)輸入到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中,進(jìn)而使用閾值將ood樣本與id樣本區(qū)分開來。
9、在本發(fā)明的一實(shí)施例中,處理器用以存取并執(zhí)行至少一指令以:于每個(gè)訓(xùn)練迭代,提取不同的復(fù)數(shù)個(gè)流形中每一個(gè)的嵌入并計(jì)算相應(yīng)的損失,進(jìn)而依據(jù)損失,更新多重流形嵌入學(xué)習(xí)模型;在多重流形嵌入學(xué)習(xí)模型訓(xùn)練完成以后,凍結(jié)多重流形嵌入學(xué)習(xí)模型的參數(shù)以得出已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型;將id訓(xùn)練數(shù)據(jù)饋送到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中,以提取id參考嵌入。
10、在本發(fā)明的一實(shí)施例中,處理器用以存取并執(zhí)行至少一指令以:將測試數(shù)據(jù)輸入到已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中以提取潛在嵌入;基于潛在嵌入與id參考嵌入之間的距離,計(jì)算ood分?jǐn)?shù);比較ood分?jǐn)?shù)與閾值以進(jìn)行ood偵測,ood偵測將測試數(shù)據(jù)中的ood樣本與id樣本區(qū)分開來。
11、在本發(fā)明的一實(shí)施例中,復(fù)數(shù)個(gè)分支包含超球分支與雙曲分支,不同的復(fù)數(shù)個(gè)流形包含超球流形與雙曲流形,損失包含超球損失、雙曲損失以及交叉熵分類損失。
12、綜上所述,本發(fā)明的技術(shù)方案與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。本發(fā)明的多重流形嵌入學(xué)習(xí)方法及多重流形嵌入學(xué)習(xí)系統(tǒng)的目的是檢測ood樣本,以避免模型的不可靠預(yù)測結(jié)果,因此本發(fā)明引入了一種新穎的多重流形嵌入學(xué)習(xí)模型,將具有正曲率和負(fù)曲率的兩種流形納入其中,以增強(qiáng)ood樣本的潛在表示。通過使用多種損失聯(lián)合學(xué)習(xí)多個(gè)流形,本發(fā)明的架構(gòu)旨在增加嵌入空間的異質(zhì)性,從而在處理未知的ood樣本時(shí)避免扭曲的表示關(guān)系。
13、以下將以實(shí)施方式對上述的說明作詳細(xì)的描述,并對本發(fā)明的技術(shù)方案提供更進(jìn)一步的解釋。
1.一種多重流形嵌入學(xué)習(xí)方法,其特征在于,包含以下步驟:
2.根據(jù)權(quán)利要求1所述的多重流形嵌入學(xué)習(xí)方法,其特征在于,還包含:
3.根據(jù)權(quán)利要求2所述的多重流形嵌入學(xué)習(xí)方法,其特征在于,所述復(fù)數(shù)個(gè)分支包含一超球分支與一雙曲分支,所述不同的復(fù)數(shù)個(gè)流形包含一超球流形與一雙曲流形。
4.根據(jù)權(quán)利要求2所述的多重流形嵌入學(xué)習(xí)方法,其特征在于,使用一識別訓(xùn)練數(shù)據(jù)以訓(xùn)練一多重流形嵌入學(xué)習(xí)模型,進(jìn)而凍結(jié)所述多重流形嵌入學(xué)習(xí)模型的參數(shù)以得出一已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型的步驟包含:
5.根據(jù)權(quán)利要求4所述的多重流形嵌入學(xué)習(xí)方法,其特征在于,所述損失包含所述不同的復(fù)數(shù)個(gè)流形的損失以及交叉熵分類損失。
6.根據(jù)權(quán)利要求4所述的多重流形嵌入學(xué)習(xí)方法,其特征在于,將一測試數(shù)據(jù)輸入到所述已訓(xùn)練的多重流形嵌入學(xué)習(xí)模型中,進(jìn)而使用一閾值將分布外樣本與id樣本區(qū)分開來的步驟包含:
7.一種多重流形嵌入學(xué)習(xí)系統(tǒng),其特征在于,包含:
8.根據(jù)權(quán)利要求7所述的多重流形嵌入學(xué)習(xí)系統(tǒng),其特征在于,所述處理器用以存取并執(zhí)行所述至少一指令以:
9.根據(jù)權(quán)利要求8所述的多重流形嵌入學(xué)習(xí)系統(tǒng),其特征在于,所述處理器用以存取并執(zhí)行所述至少一指令以:
10.根據(jù)權(quán)利要求8所述的多重流形嵌入學(xué)習(xí)系統(tǒng),其特征在于,所述復(fù)數(shù)個(gè)分支包含一超球分支與一雙曲分支,所述不同的復(fù)數(shù)個(gè)流形包含一超球流形與一雙曲流形,所述損失包含一超球損失、一雙曲損失以及一交叉熵分類損失。