麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種加氫裂化生產過程數據預處理方法及系統

文檔序號:41774029發布日期:2025-04-29 18:46閱讀:5來源:國知局
一種加氫裂化生產過程數據預處理方法及系統

本發明屬于但不限于數據預處理,尤其涉及一種加氫裂化生產過程數據預處理方法及系統。


背景技術:

1、在工業生產中,數據預處理的可靠性和準確性對工廠的高效、盈利和安全運行至關重要。加氫裂化過程作為一種連續的復雜工業生產過程,其受到入口原料品味和流量的波動、產品規格需求變化、設備運行性能退化等影響,生產過程通常包括多種工況;復雜工況下,在工業數據的收集過程中,由于硬件或網絡相關問題,可能導致采集數據缺失。輸入數據的缺失對于后期進行加氫裂化數據建模以及優化調整具有較大的影響,此時便需要開發管理技術來對采集到的缺失數據進行補全,并使其適用于加氫裂化工藝流程中的復雜工況。

2、國內外學者對工業采集數據的數據預處理進行了廣泛的研究。現有的缺失數據補全技術有歷史平均值(ha)方法和線性插值(li)方法。歷史平均值(ha)方法通過觀測高度相關的時隙進行平均值的計算來對缺失值進行補全。該方法對于聚合的能源數據是有效的,但是在高波動性模式下,其性能較差;線性插值(li)方法通過對于缺失數據的前后兩個測量值之間的連線來估算輸入數據的缺失值。該方法對于短期缺失值效果良好,但是,當缺失值延長時其效果將顯著降低。同時國內外學界針對工業生產過程中數據的預處理的準確性設計了多種方法,如相關系數、互信息、歐氏距離和貝葉斯推理等常見數據預處理方法。但是這些方法大都適用于簡單過程而不是復雜的工業生產流程。

3、針對ha和li的不足,學界提出了自注意力機制(self-attention)、掩碼自編碼器(mae)和多重插補法(mi)進行缺失數據的補全。自注意力機制(self-attention)通過計算序列數據中每個元素和其他所有元素之間的權重,目的在通過權重反映元素之間的相互關系,從而顯示具有類似性的相關數據,為后續對于缺失數據的相關處理提供便利,然而存在自注意力機制進行數據補全將導致數據趨于一致化,數據擬合效果差的問題;掩碼自編碼器(mae)的基本思想是訓練原始缺失數據值從其余類似輸入數據中進行恢復,通過對于采集到的其余數據的類似結構進行學習來訓練原始缺失數據的補全,然而存在掩碼自編碼器(mae)在進行數據補全存在部分數據遺漏的問題。采用多重插補法(mi)對數據進行補全能夠對所有缺失值進行填補,然而存在補全精確度較低以及計算難度大的問題。

4、因此,需要一種結合自注意力機制(self-attention)、掩碼自編碼器(mae)以及多重插補法(mi)優點的缺失數據補全技術,在具有限制性的設置中也能夠改善對于缺失數據的處理。


技術實現思路

1、針對現有技術存在的問題,本發明提供了一種加氫裂化生產過程數據預處理方法及系統,先通過對輸入數據中類似數據進行篩選再學習類似數據來進行部分缺失數據的準確補全,降低了后續進行整體數據補全的計算難度同時提高了缺失數據補全的準確性。

2、本發明是這樣實現的,一種加氫裂化生產過程數據預處理方法,包括以下步驟:

3、步驟一,采集加氫裂化生產過程中具有缺失數據的生產數據;

4、步驟二,使用基于自注意力機制的掩碼去噪自編碼器多重插補(mi-samae)的缺失數據補全方法對生產數據中關鍵缺失數據進行補全;

5、所述基于自注意力機制的掩碼去噪自編碼器多重插補(mi-samae)的缺失數據補全方法通過基于自注意力機制的掩碼自編碼器對部分缺失數據進行精確填補,再通過多重插補法進行整體完善;通過基于自注意力機制的掩碼去噪自編碼器多重插補(mi-samae)估計缺失值可以表示為:

6、

7、其中,zin表示不完整的樣本集合;

8、所述基于自注意力機制的掩碼自編碼器的缺失數據補全技術通過自注意力機制對類似數據進行篩選,再通過掩碼自編碼器對具有類似數據的缺失數據進行補全;基于自注意力機制的掩碼自編碼器缺失數據補全技術(samae)的最小化總目標函數可以表示為:

9、

10、進一步,所述生產數據包括加氫裂化生產過程中每個控制器輸出的具有缺失數據的生產數據。

11、進一步,所述自注意力機制(self-attention)通過計算序列數據中各元素之間的權重,理解序列中上下文信息,標記變化趨勢類似數據;

12、所述自注意力機制(self-attention)通過softmax函數計算序列中元素的注意力權重為:

13、wij=softmax(score(qi,kj))

14、其中,score(qi,kj)表示注意力分數,qi表示查詢向量,ki表示鍵向量。

15、進一步,所述掩碼自編碼器(mae)通過對原始數據額外設置掩碼,從變化趨勢相似的輸入數據中恢復原始數據缺失值;

16、掩碼自編碼器(maes)在高缺失率環境下,輸入向量可以是部分觀測向量,通過對類似輸入數據中進行學習,對輸入數據缺失值進行補全。

17、進一步,在mae學習過程中,掩碼自編碼器(maes)定義新的誤差項并只考慮觀測值的貢獻,如下:

18、

19、其中,οi表示第i天觀測值的集合,1表示指標函數,當xij≠0時等同于1否則為0。

20、進一步,所述多重插補法(mi)利用均值填補、線性回歸填補、演繹填補、最近距離填補、熱卡填補以及冷卡填補的單一填補方法重復展開若干輪填補得到多個不同完整數據集,對高缺失率環境下掩碼去噪自編碼器無法補全的不存在類似數據的缺失數據進行補全,最后進行整合得到完整數據。

21、本發明的另一目的在于提供一種加氫裂化生產過程數據預處理方法的加氫裂化生產過程數據預處理系統,包括:

22、生產數據采集模塊,采集加氫裂化生產過程中具有缺失數據的生產數據;

23、缺失數據補全模塊,使用基于自注意力機制的掩碼去噪自編碼器多重插補(mi-samae)的缺失數據補全方法對生產數據中關鍵缺失數據進行補全;

24、所述基于自注意力機制的掩碼去噪自編碼器多重插補(mi-samae)的缺失數據補全方法通過基于自注意力機制的掩碼自編碼器對部分缺失數據進行精確填補,再通過多重插補法進行整體完善;通過基于自注意力機制的掩碼去噪自編碼器多重插補(mi-samae)估計缺失值可以表示為:

25、

26、其中,zin表示不完整的樣本集合;

27、所述基于自注意力機制的掩碼自編碼器的缺失數據補全技術通過自注意力機制對類似數據進行篩選,再通過掩碼自編碼器對具有類似數據的缺失數據進行補全;基于自注意力機制的掩碼自編碼器缺失數據補全技術(samae)的最小化總目標函數可以表示為:

28、

29、本發明的另一目的在于提供一種計算機設備,計算機設備包括存儲器和處理器,存儲器存儲有計算機程序,計算機程序被處理器執行時,使得處理器執行所述的加氫裂化生產過程數據預處理方法的步驟。

30、本發明的另一目的在于提供一種計算機可讀存儲介質,存儲有計算機程序,計算機程序被處理器執行時,使得處理器執行所述的加氫裂化生產過程數據預處理方法的步驟。

31、本發明的另一目的在于提供一種信息數據處理終端,信息數據處理終端包括所述的加氫裂化生產過程數據預處理系統。

32、結合上述的技術方案和解決的技術問題,本發明所要保護的技術方案所具備的優點及積極效果為:

33、第一、本發明通過采集一組包括加氫裂化生產過程中每個控制器輸出的具有缺失值的工業生產數據;對所述工業生產數據生成額外缺失值,以原始數據作為輸出,通過自注意力機制(self-attention),計算原始序列各元素之間的關聯度,理解數據上下文之間關系,幫助模型更準確地處理序列缺失數據;再采用掩碼自編碼器(mae)方法,訓練原始缺失數據值從其余類似輸入數據中進行恢復;將兩種方法結合形成基于自注意力機制的掩碼去噪自編碼器(samae)進行工業過程中缺失數據的初步填補;多重插補法(mi)利用單一填補方法對初步補全中遺漏的缺失值進行進一步補全,得到較完整的工業溫度輸入數據;基于自注意力機制的掩碼自編碼器多重插補法(mi-samae)運用于加氫裂化工業過程的數據預處理,保證數據補全能夠在缺失率高的數據情況下進行準確完整的缺失數據補全。與現有技術相比,通過mi-samae方法將自注意力機制、mae和多重插補兩三種方法的優點相結合,在具有限制性的設置中也能夠改善對于缺失數據的處理,能夠適用于相對簡單過程而言更加復雜的加氫裂化工藝流程。

34、第二,本發明技術方案轉化后對于提高加氫裂化工業生產效率有一定的貢獻,通過本發明技術方案對加氫裂化工業生產流程傳感器采集的工業生產數據進行數據預處理,對缺失的工業生產數據進行精確補全,有利于后續數據的建模優化流程的平穩推進,提高對工業數據的精確分析,加強了對于加氫裂化工業流程的線上控制,有利于后續進行工業上的人工干預,提高加氫裂化工業生產標準并且有利于實現工業生產過程的綠色化。

35、另外,本發明的技術方案在傳統掩碼自編碼器(mae)的數據補全方法的基礎上利用自注意力機制(sa)對其補全能力進行提高的同時對其無法的補全的生產數據通過多重插補法(mi)進行完善補全。本發明技術方案能夠在傳統方法的基礎上進一步對數據補全過程進行完善和提高,對于生產數據中的缺失數據也能夠實現更加完善精確的補全,為后續工業生產提供便利。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 宿迁市| 胶州市| 武强县| 邯郸县| 合水县| 临夏市| 任丘市| 德庆县| 宜春市| 白朗县| 和林格尔县| 莫力| 休宁县| 中方县| 图木舒克市| 东兰县| 房山区| 九台市| 平顶山市| 张家川| 乌什县| 天津市| 竹北市| 海口市| 永年县| 台中县| 鹤庆县| 荔波县| 资中县| 丰台区| 治多县| 正宁县| 武平县| 延寿县| 塘沽区| 日土县| 桐柏县| 公安县| 桑植县| 正阳县| 牙克石市|