背景技術:
1、計算機視覺是人工智能(ai)領域,其使得諸如計算機和系統等機器能夠從圖像、視頻和其他視覺輸入中提取信息。機器可以使用該信息來采取動作或提出建議。計算機視覺訓練機器如何區分視覺輸入中的對象,確定對象之間的距離,確定對象是否正在移動,以及確定視覺輸入中是否有問題。
2、計算機視覺通常利用機器學習(ml)技術(諸如深度學習、用于圖像的卷積神經網絡(cnn)和用于視頻的遞歸神經網絡(rnn))來訓練機器實現上述功能。這些ml技術體現為算法模型。視覺數據被應用于算法模型以向機器傳授視覺數據的上下文。一旦足夠的數據通過算法模型被提供,機器就可以利用該模型來區分視覺輸入。在圖像輸入的情況下,cnn和具有cnn的rnn在視頻輸入的情況下通過將視覺輸入分解為像素(即,給定標記或標簽)來教導機器。它使用標簽執行卷積(用于產生第三函數的對兩個函數的數學運算)并且預測視覺輸入中的內容。cnn或cnn-rnn運行卷積,并且在一系列迭代中檢查其預測的準確性,直到預測與基礎真值匹配。
技術實現思路
1.一種用于從圖像中進行特征提取的方法,包括:
2.根據權利要求1所述的方法,其中所述多個聚類中的每個聚類表示所述圖像中的特征。
3.根據權利要求1所述的方法,還包括:
4.根據權利要求3所述的方法,還包括:
5.根據權利要求4所述的方法,其中選擇所述熵值包括選擇所計算的所述熵值中的最大熵值。
6.根據權利要求4所述的方法,其中計算所述超參數包括:
7.根據權利要求1所述的方法,其中所述聚類算法基于均值偏移聚類算法。
8.根據權利要求7所述的方法,其中所述超參數是內核帶寬。
9.根據權利要求1所述的方法,其中所述熵信息基于針對所述多個區域中的每個區域的香農熵值。
10.一種用于特征提取的系統,包括:
11.根據權利要求10所述的系統,其中所述多個聚類中的每個聚類表示所述圖像中的特征。
12.根據權利要求10所述的系統,其中所述至少一個處理器還被配置為:
13.根據權利要求10所述的系統,還包括:
14.根據權利要求13所述的方法,其中計算所述超參數包括:
15.根據權利要求10所述的系統,其中所述聚類算法基于均值偏移聚類算法。
16.根據權利要求15所述的方法,其中所述超參數是內核帶寬。
17.根據權利要求10所述的系統,其中所述熵信息基于所述多個區域中的每個區域的香農熵值。
18.一種非暫態機器可讀介質,在由計算系統的至少一個處理器執行時使得所述計算系統執行方法,所述方法包括:
19.根據權利要求18所述的非暫態介質,其中所述多個熵掃描包括第一熵掃描和第二熵掃描,其中所述第一熵掃描和所述第二熵掃描并行地被執行。
20.根據權利要求18所述的非暫態介質,其中所述方法還包括通過定義所述圖像的第一區域并且將所述第一區域迭代地擴展到所述多個區域的子集來生成所述圖像的所述多個區域,其中所述多個區域包括所述第一區域和所述多個區域的所述子集。