麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

嬰兒哭聲的辯識方法及其系統與流程

文檔序號:11097706閱讀:來源:國知局

技術特征:

1.一種嬰兒哭聲的辯識方法,其特征在于,包括以下步驟:

a獲取嬰兒哭聲音頻的多段訓練數據,每個訓練數據對應一個已知啼哭原因;

b對每一段訓練數據進行特征提取,得到每一段訓練數據的特征參數向量;

c對所述多段訓練數據的特征參數向量進行主成分分析,得到多個主成分;

d計算每一種啼哭原因對應的訓練數據在各主成分上投影分值的均值和方差,根據該方差在所述多個主成分中選擇P個主成分,P為大于1的整數;

e獲取嬰兒哭聲音頻的待辯識數據,并在所述P個主成分上計算該待辯識數據的投影分值;

f根據該待辯識數據的投影分值和所述均值和方差計算該待辯識數據對應于各個原因的概率。

2.根據權利要求1所述的嬰兒哭聲的辯識方法,其特征在于,所述步驟c包括以下子步驟:

所述多段訓練數據包括N個哭聲信號樣本,對該N個哭聲信號樣本分別提取K個特征參數,其中,第n個哭聲信號提取出的K個特征參數記為特征參數向量sn=[sn1,sn2,…,snK]T;

對所述N個哭聲信號樣本,計算所述K個特征參數所對應的協方差矩陣,記為C,其中,C為K乘K的矩陣;

對所述協方差陣進行特征值分解,得到K個特征值和相應于該K個特征值的特征向量。

3.根據權利要求2所述的嬰兒哭聲的辯識方法,其特征在于,所述步驟d包括以下子步驟:

對所述協方差矩陣C進行特征值分解,把特征值按從大到小進行排列,得到{λ12,…,λK},從中取特征值最大的Q個特征值及其對應的特征向量,構成一個Q維的特征子空間,其中Q的值取的解,g為0.9至0.99之間的一個預設置;

在這Q個主成分中,取其中的第k個主成分,該主成分的特征值記為λk,λk對應的特征向量記為uk,計算第n個哭聲信號的特征參數向量sn在第k個特征向量上的投影分值;

求N個哭聲信號中屬于第j類哭聲原因的哭聲信號,記為Nj,的K個特征參數向量在第k個特征向量上投影分值的均值

和方差σjk

然后計算

<mrow> <msub> <mi>L</mi> <mi>k</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>X</mi> <mi>k</mi> </msub> <msub> <mi>Y</mi> <mi>k</mi> </msub> </mfrac> <mo>,</mo> </mrow>

其中

<mrow> <msub> <mi>X</mi> <mi>k</mi> </msub> <mo>=</mo> <msubsup> <mi>C</mi> <mi>J</mi> <mn>2</mn> </msubsup> <msqrt> <mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>J</mi> </msubsup> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> <mi>J</mi> </msubsup> <msup> <mrow> <mo>|</mo> <mrow> <msub> <mi>&mu;</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>j</mi> <mi>k</mi> </mrow> </msub> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>,</mo> </mrow>

<mrow> <msub> <mi>Y</mi> <mi>k</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>J</mi> </mfrac> <mrow> <mo>|</mo> <mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>J</mi> </msubsup> <msub> <mi>&sigma;</mi> <mrow> <mi>j</mi> <mi>k</mi> </mrow> </msub> </mrow> <mo>|</mo> </mrow> <mo>.</mo> </mrow>

上述各式中,J表示哭聲原因的總類型個數,Xk表示哭聲信號的特征參數向量在第k個主成分的投影分值的分離度,而Yk表示哭聲信號的特征參數向量在第k個主成分的投影分值的集中度,Lk代表各個主成分在對哭聲原因的辨別能力,Lk越大意味著其辨別能力越強;

按順序對Q個主成分進行排列,選取Lk值最大的P個主成分用于后續的哭聲原因辨識,其中P取Q和M中較小的值,而h為取值在2%-0.5%之間的一個預設值。

4.根據權利要求3所述的嬰兒哭聲的辯識方法,其特征在于,所述步驟f中,通過以下方式計算

第j種原因的概率

5.根據權利要求1所述的嬰兒哭聲的辯識方法,其特征在于,還包括以下步驟:

對選定的一組訓練數據執行所述步驟a、b、c和d,得到P個主成分;

根據所得的P個主成分,對該組訓練數據中的每一個訓練數據,分別執行所述步驟e和f以得到該訓練數據對應于各個原因的概率,并計算該訓練數據所對應的概率最大原因,并將該概率最大原因與該訓練數據所對應的已知啼哭原因進行比較;

將概率最大原因與已知啼哭原因不相同的訓練數據從所述選定的一組訓練數據中剔除,將剩余的訓練數據作為新選定的一組訓練數據再次執行上述各步驟,如此循環直至滿足預定的退出條件。

6.根據權利要求1至5中任一項所述的嬰兒哭聲的辯識方法,其特征在于,在所述步驟f之后還包括以下步驟:

在移動終端上顯示概率最大的至少兩個原因。

7.根據權利要求1至5中任一項所述的嬰兒哭聲的辯識方法,其特征在于,所述啼哭原因包括以下原因中的任意兩種或更多種:

饑餓,想睡覺,不適,尿布濕。

8.根據權利要求1至5中任一項所述的嬰兒哭聲的辯識方法,其特征在于,所述特征提取的步驟中提取的特征包括以下特征的任意兩種或更多種:

平均哭聲持續時間、哭聲持續時間方差、平均哭聲能量、哭聲能量方差、基音頻率、基音頻率的平均值、基音頻率的最大值、基音頻率的最小值、基音頻率的動態范圍、基音頻率的平均變化率、第一共振峰頻率、第一共振峰頻率平均變化率、第一共振峰頻率平均值、第一共振峰頻率的最大值、第一共振峰頻率的最小值、第一共振峰頻率的動態范圍、第二共振峰頻率、第二共振峰頻率平均變化率、第二共振峰頻率平均值、第二共振峰頻率的最大值、第二共振峰頻率的最小值、第二共振峰頻率的動態范圍、Mel頻率倒譜參數、翻轉的Mel頻率倒譜參數。

9.根據權利要求1至5中任一項所述的嬰兒哭聲的辯識方法,其特征在于,在所述步驟b之前,還包括以下步驟:

對所述訓練數據中的哭聲信號進行降噪,檢測并剔取噪聲大于預定門限的數據段。

10.一種嬰兒哭聲的辯識系統,其特征在于,包括:

訓練數據獲取單元,用于獲取嬰兒哭聲音頻的多段訓練數據,每個訓練數據對應一個已知啼哭原因;

特征提取單元,用于對每一段訓練數據進行特征提取,得到每一段訓練數據的特征參數向量;

主成分分析單元,用于對所述多段訓練數據的特征參數向量進行主成分分析,得到多個主成分;

主成分選擇單元,用于計算每一種啼哭原因對應的訓練數據在各主成分上投影分值的均值和方差,根據該方差在所述多個主成分中選擇P個主成分,P為大于1的整數;

待辯識數據獲取單元,用于獲取嬰兒哭聲音頻的待辯識數據;

投影計算單元,用于在所述P個主成分上計算該待辯識數據的投影分值;

原因辯識單元,用于根據該待辯識數據的投影分值和所述均值和方差計算該待辯識數據對應于各個原因的概率。

當前第2頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 宜兴市| 涡阳县| 牟定县| 六盘水市| 织金县| 禹城市| 侯马市| 马山县| 郎溪县| 都兰县| 永川市| 大宁县| 新昌县| 普安县| 沙雅县| 漠河县| 邳州市| 余干县| 甘洛县| 平遥县| 五河县| 东源县| 斗六市| 葫芦岛市| 京山县| 镇远县| 开江县| 精河县| 任丘市| 日照市| 巫山县| 云浮市| 会东县| 罗田县| 永胜县| 香格里拉县| 葫芦岛市| 云林县| 景洪市| 合江县| 崇左市|