本申請涉及遺傳學及強化學習,尤其涉及一種排產計劃生成方法、裝置、設備及介質。
背景技術:
1、隨著信息技術的飛速發展,制造業企業越來越傾向于采用先進的生產排產技術來提高生產效率、降低成本并提升產品質量。生產排產,即生產計劃與排程,是制造業中的關鍵環節,它直接關系到生產效率、成本控制和產品質量。傳統的排產方式主要是:依賴生產管理人員的經驗和直覺確定排產計劃以及通過預設的規則和算法確定排產計劃,然而現有技術中的兩種方法已難以滿足現代制造業的更加龐大復雜的生產工藝流程需求,且存在生產效率較低等問題。
技術實現思路
1、本申請實施例提供了一種排產計劃生成方法、裝置、設備及介質,用于解決相關技術中的難以應對復雜多變的生產環境,且存在生產效率較低等問題。
2、第一方面,本申請實施例提供了一種排產計劃生成方法,所述方法包括:
3、獲取接收到的排產請求中攜帶的每個任務;獲取所述每個任務中包含的每個工序;
4、針對所述每個工序,在執行該工序的每個機器中隨機確定目標機器,并隨機確定所述目標機器執行該工序,在所述目標機器執行的每個工序中的次序;
5、將執行所述每個工序的目標機器的標識以及目標機器執行對應工序的次序,輸入預先訓練完成的強化學習模型中,基于所述強化學習模型獲取執行所述每個工序的標準機器的標識以及標準機器執行對應工序的標準次序。
6、第二方面,本申請實施例還提供了一種排產計劃生成裝置,所述裝置包括:
7、獲取模塊,用于獲取接收到的排產請求中攜帶的每個任務;獲取所述每個任務中包含的每個工序;
8、確定模塊,用于針對所述每個工序,在執行該工序的每個機器中隨機確定目標機器,并隨機確定所述目標機器執行該工序,在所述目標機器執行的每個工序中的次序;
9、處理模塊,用于將執行所述每個工序的目標機器的標識以及目標機器執行對應工序的次序,輸入預先訓練完成的強化學習模型中,基于所述強化學習模型獲取執行所述每個工序的標準機器的標識以及標準機器執行對應工序的標準次序。
10、第三方面,本申請實施例還提供了一種電子設備,包括:
11、存儲器,用于存儲程序指令;
12、處理器,用于調用所述存儲器中存儲的程序指令,按照獲得的程序指令執行上述任一項所述排產計劃生成的方法包括的步驟。
13、第四方面,本申請實施例還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當被計算機執行時,使所述計算機執行如上述任一項所述排產計劃生成的方法。
14、由于在本申請實施例中,電子設備針對每個工序,在執行該工序的每個機器中隨機確定目標機器,并隨機確定目標機器執行該工序的次序,將執行每個工序的目標機器的標識以及目標機器執行對應工序的次序,輸入預先訓練完成的強化學習模型中,獲取強化學習模型輸出的執行每個工序的標準機器的標識以及標準機器執行對應工序的標準次序,通過強化學習模型,可以確定每個工序的最優的標準執行機器和次序,能夠更合理地分配生產任務給各個機器,確保資源得到最優利用,減少等待時間和生產瓶頸。可以準確有效地進行排產計劃的確定,從而可以有效地應對復雜多變的生產環境,并提高生產效率。
1.一種排產計劃生成方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述隨機確定所述目標機器執行該工序,在所述目標機器執行的每個工序中的次序之后,所述將執行所述每個工序的目標機器的標識以及目標機器執行對應工序的次序,輸入預先訓練完成的強化學習模型中之前,所述方法還包括:
3.根據權利要求2所述的方法,其特征在于,所述基于所述強化學習模型獲取執行所述每個工序的標準機器的標識以及標準機器執行對應工序在所述每個任務中的標準次序,包括:
4.根據權利要求1所述的方法,其特征在于,所述強化學習模型通過以下方式訓練:
5.根據權利要求4所述的方法,其特征在于,所述根據確定的所述每個樣本對的獎勵值,確定該樣本組的目標獎勵值,包括:
6.根據權利要求4所述的方法,其特征在于,所述根據所述輸出子代矩陣和該樣本對中的樣本子代矩陣的相似度,確定獎勵值,包括:
7.根據權利要求4所述的方法,其特征在于,所述樣本集中的樣本組通過以下方式獲取:
8.一種排產計劃生成裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當被計算機執行時,使所述計算機執行如權利要求1-7中任一項所述排產計劃生成的方法包括的步驟。