本發(fā)明涉及數(shù)據(jù)處理,具體涉及一種基于大數(shù)據(jù)的酶制劑生產(chǎn)數(shù)據(jù)分析方法及系統(tǒng)。
背景技術(shù):
1、由于微生物發(fā)酵生產(chǎn)酶制劑的方法具有效率高、易于控制、產(chǎn)品多樣、產(chǎn)品質(zhì)量高等優(yōu)點,因此該方法的使用較為普遍。利用微生物發(fā)酵生產(chǎn)酶制劑的過程中,需要在發(fā)酵罐內(nèi)注入培養(yǎng)液,并接種產(chǎn)酶的微生物,然后在一定的條件下發(fā)酵,即可得到所需的酶制劑。發(fā)酵過程中對于溫度的控制尤為重要,因為溫度會影響微生物的發(fā)酵速度和酶制劑的活性,進而影響酶制劑的產(chǎn)率和質(zhì)量。因此,需要實時監(jiān)測生產(chǎn)溫度,防止生產(chǎn)溫度出現(xiàn)異常,影響酶制劑的生產(chǎn)。現(xiàn)有技術(shù)中,監(jiān)測生產(chǎn)溫度是在發(fā)酵罐的不同位置處設(shè)置大量測溫點,測量不同測溫點處的溫度數(shù)據(jù),這些溫度數(shù)據(jù)具有規(guī)模大,處理速度要求高的特點,以實現(xiàn)實時監(jiān)測。具體地,當各測溫點處溫度的均值位于預(yù)設(shè)溫度范圍時,判定生產(chǎn)溫度正常,即酶制劑生產(chǎn)過程正常,否則,判定生產(chǎn)溫度異常,即酶制劑生產(chǎn)過程異常。
2、然而,在酶制劑生產(chǎn)過程中,微生物的代謝會產(chǎn)生熱量,且發(fā)酵罐不同高度區(qū)域的含氧量不同,微生物的代謝速度也不同,代謝產(chǎn)生的熱量也不同,使得各高度區(qū)域的溫度變化也不同。因此,不同高度區(qū)域的溫度對于判定生產(chǎn)溫度是否異常的影響程度是不同的。而現(xiàn)有技術(shù)中,不同高度區(qū)域的溫度均采用相同的權(quán)重,會使得一些異常溫度和正常溫度求取平均值后,得到的平均溫度在正常溫度范圍內(nèi)。然而這種方法計算得到的平均溫度并不能準確、真實地反映生產(chǎn)溫度,會影響酶制劑的生產(chǎn)過程,降低酶制劑的產(chǎn)率和質(zhì)量,影響經(jīng)濟效益。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種基于大數(shù)據(jù)的酶制劑生產(chǎn)數(shù)據(jù)分析方法及系統(tǒng),旨在解決現(xiàn)有技術(shù)中由于發(fā)酵罐各高度區(qū)域的溫度的權(quán)重相同,導(dǎo)致異常檢測結(jié)果不準確,影響酶制劑的生產(chǎn)效率和質(zhì)量的技術(shù)問題。
2、本發(fā)明的一種基于大數(shù)據(jù)的酶制劑生產(chǎn)數(shù)據(jù)分析方法,包括如下步驟:
3、獲取發(fā)酵罐所有高度區(qū)域中各測溫點的當前溫度序列、歷史異常溫度序列和歷史正常溫度序列;
4、其中,歷史異常溫度序列和歷史正常溫度序列為與當前溫度序列所處相同生產(chǎn)階段的各時刻溫度;
5、計算酶制劑生產(chǎn)的異常分數(shù),當異常分數(shù)大于閾值時,判定酶制劑生產(chǎn)存在異常,并控制發(fā)酵罐停止運行;
6、其中,異常分數(shù)為所有高度區(qū)域的異常均值與高度區(qū)域總數(shù)的比值;所述異常均值利用各高度區(qū)域的權(quán)重對對應(yīng)的異常程度進行加權(quán)得到;所述異常程度與各測溫點的當前溫度序列和歷史異常溫度序列的相似性正相關(guān),與各測溫點的當前溫度序列和歷史正常溫度序列的相似性反相關(guān);所述權(quán)重為對應(yīng)高度區(qū)域的溫度顯著程度與所有高度區(qū)域的溫度顯著程度之和的比值;溫度顯著程度與測溫點的歷史異常溫度序列和歷史正常溫度序列中對應(yīng)時刻溫度的差異程度正相關(guān),與所有時刻溫度的差異程度的標準差反相關(guān);差異程度為歷史異常溫度序列和歷史正常溫度序列中對應(yīng)時刻溫度的差值的絕對值與歷史正常溫度序列中對應(yīng)時刻溫度的比值。
7、上述方案中,通過各高度區(qū)域的權(quán)重對對應(yīng)的異常程度進行加權(quán)得到異常分數(shù),由于考慮到不同高度區(qū)域的溫度對異常檢測的影響,因此使得異常分數(shù)的計算結(jié)果更加準確,異常檢測結(jié)果也更加準確。
8、優(yōu)選地,第個高度區(qū)域的異常程度為:
9、;
10、式中,為第個高度區(qū)域中第個測溫點的當前溫度序列和歷史異常溫度序列的相似性,為第個高度區(qū)域中第個測溫點的當前溫度序列和歷史正常溫度序列的相似性,為第個高度區(qū)域中測溫點總數(shù),為標準歸一化函數(shù)。
11、上述方案中,通過比較當前溫度序列和歷史異常溫度序列的相似性與當前溫度序列和歷史正常溫度序列的相似性,可直觀反映該高度區(qū)域的異常程度。
12、優(yōu)選地,第個高度區(qū)域的溫度顯著程度為:
13、;
14、式中,為第個高度區(qū)域中第個測溫點中歷史異常溫度序列和歷史正常溫度序列中第個時刻溫度的差異程度,為第個高度區(qū)域中第個測溫點中歷史異常溫度序列和歷史正常溫度序列中所有時刻溫度的差異程度的標準差,為第個高度區(qū)域中測溫點總數(shù),為第個高度區(qū)域中測溫點的歷史異常溫度序列和歷史正常溫度序列的長度,為預(yù)設(shè)參數(shù),的取值范圍為[0.01,0.02],為標準歸一化函數(shù)。
15、上述方案中,通過比較歷史異常溫度序列和歷史正常溫度序列對應(yīng)時刻溫度的差異程度以及各時刻溫度的差異程度的標準差,使得計算結(jié)果的可信度越高,避免了偶然誤差導(dǎo)致計算結(jié)果出錯。
16、優(yōu)選地,所述相似性的計算包括如下步驟:
17、將歷史異常溫度序列或歷史正常溫度序列設(shè)為目標溫度序列,將目標溫度序列對應(yīng)當前溫度序列等長截取的序列作為目標溫度子序列;
18、獲取當前溫度序列和目標溫度子序列的所有周期;
19、以各周期為滑動窗口長度以步長為1分別在當前溫度序列和目標溫度子序列上滑動,得到當前窗口序列和目標窗口序列;
20、任一測溫點的當前溫度序列和目標溫度序列的相似性與各當前窗口序列和對應(yīng)目標窗口序列均值的差值的絕對值反相關(guān)。
21、上述方案中,由于利用當前窗口序列和目標窗口序列在更小的長度上進行比較,更容易捕捉到當前窗口序列和目標窗口序列中的相似子序列,使得計算結(jié)果更加準確。
22、優(yōu)選地,任一測溫點的當前溫度序列與目標溫度序列的相似性為:
23、;
24、式中,為對應(yīng)測溫點中以第個周期為滑動窗口長度得到的第個當前窗口序列的均值,為對應(yīng)測溫點中以第個周期為滑動窗口長度得到的第個目標窗口序列的均值,為對應(yīng)測溫點中當前溫度序列和目標溫度子序列的周期的總數(shù),為對應(yīng)測溫點中以第個周期為滑動窗口長度得到的當前窗口序列的總數(shù),為以自然常數(shù)為底數(shù)的指數(shù)函數(shù)。
25、上述方案中,利用自然常數(shù)為底數(shù)的指數(shù)函數(shù)使得相似性的取值范圍為0至1,便于后續(xù)的異常程度的計算。
26、優(yōu)選地,任一測溫點的當前溫度序列與目標溫度序列的相似性為:
27、;
28、式中,為對應(yīng)測溫點中以第個周期為滑動窗口長度得到的第個當前窗口序列的均值,為對應(yīng)測溫點中以第個周期為滑動窗口長度得到的第個目標窗口序列的均值,為對應(yīng)測溫點中當前溫度序列和目標溫度子序列的周期的最大值,為對應(yīng)測溫點中當前溫度序列和目標溫度子序列的周期的總數(shù),為對應(yīng)測溫點中以第個周期為滑動窗口長度得到的當前窗口序列的總數(shù),為以自然常數(shù)為底數(shù)的對數(shù)函數(shù)。
29、優(yōu)選地,當前溫度序列和目標溫度子序列的周期通過傅里葉級數(shù)得到。
30、上述方案中,通過傅里葉級數(shù)得到當前溫度序列和目標溫度子序列的周期,計算簡單、便于理解。
31、優(yōu)選地,所述高度區(qū)域由所述發(fā)酵罐沿其高度方向均分得到。
32、上述方案中,對發(fā)酵罐的高度區(qū)域的劃分較簡單,便于計算。
33、優(yōu)選地,所述當前溫度序列為當前時刻與其所處生產(chǎn)階段的開始時刻之間的各時刻溫度。
34、上述方案中,通過比較當前溫度序列和與當前溫度序列處于相同生產(chǎn)階段的歷史異常溫度序列和歷史正常溫度序列,可減少計算量,加快計算速度。
35、本發(fā)明還提供了一種基于大數(shù)據(jù)的酶制劑生產(chǎn)數(shù)據(jù)分析系統(tǒng),包括存儲器和處理器,所述處理器執(zhí)行所述存儲器存儲的計算機程序,以實現(xiàn)上述任一項所述的基于大數(shù)據(jù)的酶制劑生產(chǎn)數(shù)據(jù)分析方法。
36、有益效果是:
37、本發(fā)明的方案通過發(fā)酵罐各高度區(qū)域的溫度顯著程度得到發(fā)酵罐各高度區(qū)域的權(quán)重,充分考慮到不同高度區(qū)域的溫度對異常檢測的影響程度。而且,還通過計算當前溫度序列分別與歷史異常溫度序列和歷史正常溫度序列的相似性,得到各高度區(qū)域的異常程度,最后利用各高度區(qū)域的權(quán)重對對應(yīng)的異常程度進行加權(quán)得到異常分數(shù),使得計算結(jié)果更加準確,進而對酶制劑生產(chǎn)的異常檢測更加準確。