本發明屬于量子計算領域,尤其涉及一種用于抗量子密碼算法的快速gpu實現方法、系統、設備、介質。
背景技術:
1、量子計算的迅速發展對傳統密碼體系構成了前所未有的威脅。尤其是公鑰密碼算法(如rsa和ecc),在量子計算環境下被認為是不安全的。這是因為shor算法表明,量子計算機能夠在多項式時間內破解這些基于難解數學問題的加密方法。因此,研究者們開始關注抗量子密碼算法的開發,以確保信息在量子計算時代的安全性。
2、許多抗量子密碼算法,如基于格的算法和哈希基的簽名方案,通常涉及復雜的數學運算和數據處理,這使得其在cpu上的執行速度受到限制。為了實現抗量子密碼算法的有效執行,gpu(圖形處理單元)作為一種強大的并行計算平臺,正受到越來越多的關注。gpu具有極高的計算并行能力,適合處理大量相同類型的計算任務,利用gpu加速抗量子密碼算法已經成為一種通用加速方法。
3、盡管gpu能夠提供強大的計算能力,但在抗量子密碼算法的實現過程中仍面臨諸多挑戰。gpu加速一般分為四種:并行計算優化、內存優化、算法設計和重構優化、硬件選型和配置優化。其中,算法設計和重構優化需要對抗量子密碼算法有深入的理解,抗量子密碼算法由于其固有的復雜性,入門成本較高,且每個算法由于其原理不同,改造方案也不同,優化時間成本較高。硬件選型和配置優化需要特定的適配固件,且不同的算法可能有不同的適配硬件,優化費用成本較高。算法設計和重構優化和硬件選型和配置優化更適用于特定抗量子算法的針對性優化改造,以獲取最佳性能。并行計算優化通過將計算任務分解為多個可并行執行的子任務從而減少整體耗時,但對于不同的gpu或者不同的算法子模塊,并行計算的并行度不同性能也會有較大差別,如何確定合適的并行數以達到最佳性能是一個挑戰。內存優化中由于不同算法的內存數據布局不同,如何尋找共同點做普適性優化是第二個挑戰。
4、綜上,在實際應用中,如何有效利用gpu的優勢而不引入過多的復雜性和實際成本且不需要對抗量子密碼算法有深入理解是一個亟待解決的問題。
技術實現思路
1、針對現有技術不足,本發明提供了一種用于抗量子密碼算法的快速gpu實現方法、系統、設備、介質。
2、第一方面,本發明實施例提供了一種用于抗量子密碼算法的快速gpu實現方法,所述方法包括:
3、獲取用戶配置的抗量子密碼算法;
4、分析抗量子密碼算法中子模塊的并行性,確定抗量子密碼算法中子模塊的并行參數;
5、設置抗量子密碼算法異步傳輸方式;配置任務級內存池機制,通過設置元素的存儲順序和對齊方式,從而實現抗量子密碼算法在gpu上的內存布局。
6、第二方面,本發明實施例提供了一種用于抗量子密碼算法的快速gpu實現系統,所述系統包括:
7、算法接口層,用于獲取用戶配置的抗量子密碼算法;
8、并行化處理模塊,用于分析抗量子密碼算法中子模塊的并行性,確定抗量子密碼算法中子模塊的并行參數;
9、內存管理模塊,用于設置抗量子密碼算法異步傳輸方式;配置任務級內存池機制,通過設置元素的存儲順序和對齊方式,從而實現抗量子密碼算法在gpu上的內存布局。
10、第三方面,本發明實施例提供了一種電子設備,包括存儲器和處理器,所述存儲器與所述處理器耦接;其中,所述存儲器用于存儲程序數據,所述處理器用于執行所述程序數據以實現上述的用于抗量子密碼算法的快速gpu實現方法。
11、第四方面,本發明實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執行時實現上述的用于抗量子密碼算法的快速gpu實現方法。
12、第五方面,本發明實施例提供了一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執行時實現上述的用于抗量子密碼算法的快速gpu實現方法。
13、與現有技術相比,本發明的有益效果為:
14、本發明提供了一種用于抗量子密碼算法的快速gpu實現方法,通過確定最優并行參數最大限度地提升了不同gpu上算法的執行效率,并且本發明提供了通用的內存優化策略,適用于多種抗量子密碼算法,減少了因內存布局差異導致的優化難度。
1.一種用于抗量子密碼算法的快速gpu實現方法,其特征在于,所述方法包括:
2.根據權利要求1所述的一種用于抗量子密碼算法的快速gpu實現方法,其特征在于,所述抗量子密碼算法包括抗量子密鑰封裝算法、抗量子數字簽名算法;
3.根據權利要求2所述的一種用于抗量子密碼算法的快速gpu實現方法,其特征在于,所述密鑰封裝子模塊包括:數論變換模塊、隨機數矩陣生成模塊。
4.根據權利要求1所述的一種用于抗量子密碼算法的快速gpu實現方法,其特征在于,分析抗量子密碼算法中子模塊的并行性,確定抗量子密碼算法中子模塊的并行參數的過程包括:
5.根據權利要求1所述的一種用于抗量子密碼算法的快速gpu實現方法,其特征在于,設置抗量子密碼算法異步傳輸方式包括:
6.根據權利要求1所述的一種用于抗量子密碼算法的快速gpu實現方法,其特征在于,配置任務級內存池機制,通過設置元素的存儲順序和對齊方式,從而實現抗量子密碼算法在gpu上的內存布局的過程包括:
7.一種用于抗量子密碼算法的快速gpu實現系統,其特征在于,所述系統包括:
8.一種電子設備,包括存儲器和處理器,其特征在于,所述存儲器與所述處理器耦接;其中,所述存儲器用于存儲程序數據,所述處理器用于執行所述程序數據以實現上述權利要求1-6任一項所述的用于抗量子密碼算法的快速gpu實現方法。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現如權利要求1-6中任一所述的用于抗量子密碼算法的快速gpu實現方法。
10.一種計算機程序產品,包括計算機程序/指令,其特征在于,該計算機程序/指令被處理器執行時實現權利要求1-6中任一所述的用于抗量子密碼算法的快速gpu實現方法。