本申請實施例涉及服務器領域,具體而言,涉及一種服務器的故障處理方法、存儲介質、電子設備。
背景技術:
1、相關技術中,ddr5(double?data?rate?5第五代雙倍數據率隨機存取存儲器(sdram)技術)之前,內存的電是由主板上的單獨的內存供電電路來提供的,從ddr5開始內存將供電模塊(pmic芯片)集成到了內存中,ddr5內存上的pmic芯片是指用于管理和控制ddr5內存供電的功率管理集成電路。
2、當前的服務器對內存故障的處理只有在開機過程中由cpu訪問內存的pmic,在系統下,可以通過peci訪問cpu,讓cpu去訪問pmic,但是peci是單線,速率低,沒有辦法實現實時監控。
3、針對上述的問題,目前尚未提出有效的解決方案。
技術實現思路
1、本申請實施例提供了一種服務器的故障處理方法、存儲介質、電子設備,以至少解決相關技術中服務器故障檢測的實時性較差的問題。
2、根據本申請的一個實施例,提供了一種服務器的故障處理方法,包括:獲取第一檢測結果,第一檢測結果包括由處理器在開機自檢階段對電源管理集成芯片的寄存器狀態檢測到的故障,處理器用于執行bios固件,電源管理集成芯片用于對內存的電源供應進行管理;響應于第一檢測結果為具有故障時,對發生故障的內存執行第一目標操作,第一目標操作包括對發生故障的內存所在的數據通道進行禁用;響應于第一檢測結果為無故障或第一目標操作執行完畢,繼續執行服務器開機至開機完成;響應于服務器開機完成,獲取第二檢測結果,第二檢測結果包括基板控制器在操作系統運行階段對電源管理集成芯片的寄存器狀態檢測到的故障;基于第二檢測結果對內存執行第二目標操作,第二目標操作包括生成提醒信息,提醒信息用于向目標用戶展示故障信息,故障信息包括如下至少之一:故障位置、故障類型、故障等級、建議故障處理操作。
3、在一個示例性實施例中,在獲取第一檢測結果之前,方法包括:向多路復用器輸入第一控制信息,第一控制信息用于控制多路復用器建立處理器與電源管理集成芯片的通信組件的通信。
4、在一個示例性實施例中,在獲取第二檢測結果之前,方法包括:向多路復用器輸入第二控制信息,第二控制信息用于控制多路復用器建立基板控制器與電源管理集成芯片的通信組件的通信。
5、在一個示例性實施例中,方法還包括:響應于第一檢測結果為具有故障時,生成具有故障的內存的位置信息;基于位置信息生成故障日志,故障日志用于向目標用戶展示,故障日志由基板控制器生成。
6、在一個示例性實施例中,在對發生故障的內存執行第一目標操作之后,方法還包括:對發生故障的內存所對應的故障寄存器產生的故障異常信號進行消除。
7、在一個示例性實施例中,響應于服務器開機完成,獲取第二檢測結果,包括:檢測到服務器的通用輸入輸出引腳為高電平信號時,服務器開機完成。
8、在一個示例性實施例中,對發生故障的內存執行第一目標操作之后,方法還包括:對狀態正常的內存進行上電;對上電后的內存進行初始化;將所有內存的電源管理集成芯片設置為寫保護模式;控制處理器輪詢初始化完成后的內存的電源管理集成芯片的寄存器;響應于處理器檢測到寄存器存在故障,將寄存器的故障信息傳輸給基板控制器以及對服務器執行重啟上電操作;響應于處理器未檢測到寄存器存在故障,繼續執行服務器開機至開機完成;響應于確定服務器開機完成,獲取第二檢測結果、第三檢測結果中的至少一個,其中,第三檢測結果由處理器對內存模塊上的溫度傳感器進行輪詢得到,溫度傳感器的溫度信號用于確定內存的溫度;響應于第二檢測結果為具有故障,對服務器執行第二目標操作;響應于基于第三檢測結果確定內存的溫度超過溫度限值,對服務器執行第二目標操作。
9、根據本申請的又一個實施例,還提供了一種計算機可讀存儲介質,計算機可讀存儲介質中存儲有計算機程序,其中,計算機程序被設置為運行時執行上述任一項方法實施例中的步驟。
10、根據本申請的又一個實施例,還提供了一種電子設備,包括存儲器和處理器,存儲器中存儲有計算機程序,處理器被設置為運行計算機程序以執行上述任一項方法實施例中的步驟。
11、根據本申請的又一個實施例,還提供了一種計算機程序產品,包括計算機程序,計算機程序被處理器執行時實現上述任一項方法實施例中的步驟。
12、在本發明實施例中,采用在分兩次檢測并且兩次檢測分別由處理器和基板控制器進行檢測的方式,通過將處理器在開機自檢階段和將基板控制器在操作系統運行階段分別故障檢測,達到了在服務器開機前期通過處理器檢測而在開機完成后由基板可能控制器檢測故障的目的,從而實現了避免處理器和基板控制器搶奪電源管理集成芯片通信組件的控制權的技術效果,并且在開機自檢階段處理器可以精確定位故障,在操作系統運行階段,由基板控制器檢測故障因此不需要頻繁執行服務器的重新上電,進而解決了服務器故障檢測的實時性較差的技術問題。
1.一種服務器的故障處理方法,其特征在于,
2.根據權利要求1所述的方法,其特征在于,
3.根據權利要求1或2所述的方法,其特征在于,
4.根據權利要求1所述的方法,其特征在于,
5.根據權利要求1所述的方法,其特征在于,
6.根據權利要求1所述的方法,其特征在于,
7.根據權利要求1所述的方法,其特征在于,
8.一種計算機可讀存儲介質,其特征在于,
9.一種電子設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,
10.一種計算機程序產品,包括計算機程序,其特征在于,