最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

語(yǔ)音識(shí)別方法、裝置、介質(zhì)及設(shè)備與流程

文檔序號(hào):41949110發(fā)布日期:2025-05-16 14:06閱讀:22來(lái)源:國(guó)知局

本申請(qǐng)涉及音頻處理,尤其涉及一種語(yǔ)音識(shí)別,特別涉及一種語(yǔ)音識(shí)別方法、裝置、介質(zhì)及設(shè)備。


背景技術(shù):

1、隨著智能家居和語(yǔ)音控制技術(shù)的發(fā)展,目前市場(chǎng)上的大多數(shù)音頻設(shè)備具備語(yǔ)音控制功能。如通過(guò)在電視機(jī)上集成語(yǔ)音識(shí)別功能模塊,能夠讓用戶使用語(yǔ)音指令來(lái)控制電視機(jī)進(jìn)行音量調(diào)節(jié)等操作。然而,現(xiàn)有的語(yǔ)音識(shí)別技術(shù)在實(shí)際應(yīng)用中面臨著一些挑戰(zhàn)。例如,當(dāng)音頻采集裝置(如麥克風(fēng))采集到的音頻數(shù)據(jù)混合了用戶發(fā)出的語(yǔ)音以及音頻設(shè)備當(dāng)前輸出的音頻時(shí),將可能降低對(duì)用戶發(fā)出的語(yǔ)音的識(shí)別準(zhǔn)確度。

2、為了解決上述問(wèn)題,現(xiàn)有技術(shù)中通常采用降噪算法,如“倒譜均值減”對(duì)音頻采集裝置采集到的音頻數(shù)據(jù)進(jìn)行減噪處理,以減少干擾因素對(duì)識(shí)別用戶意圖時(shí)造成的影響。但是常見的降噪算法要么會(huì)導(dǎo)致用戶發(fā)出的語(yǔ)音經(jīng)處理后出現(xiàn)失真,導(dǎo)致用戶意圖的識(shí)別準(zhǔn)確度下降;要么只能針對(duì)持續(xù)時(shí)長(zhǎng)較短的噪音進(jìn)行消除,當(dāng)針對(duì)長(zhǎng)時(shí)間持續(xù)的噪聲,如音頻設(shè)備當(dāng)前輸出的音頻時(shí),使用常規(guī)的降噪方式所達(dá)到的降噪效果并不理想。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例提供一種語(yǔ)音識(shí)別方法、裝置、介質(zhì)及設(shè)備。利用本申請(qǐng)實(shí)施例提供的語(yǔ)音識(shí)別方法,以提升對(duì)用戶意圖的識(shí)別準(zhǔn)確度。

2、本申請(qǐng)實(shí)施例一方面提供了一種語(yǔ)音識(shí)別方法,所述方法包括:

3、獲取對(duì)應(yīng)同一時(shí)刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),其中,所述第一音頻數(shù)據(jù)包含用戶語(yǔ)音數(shù)據(jù)及通過(guò)音頻輸出裝置輸出、并由外部音頻采集裝置采集得到的第一設(shè)備輸出音頻數(shù)據(jù),所述第二音頻數(shù)據(jù)為送往所述音頻輸出裝置待輸出的第二設(shè)備輸出音頻數(shù)據(jù);

4、根據(jù)所述第一音頻數(shù)據(jù)及所述第二音頻數(shù)據(jù),對(duì)所述第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除所述第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),得到所述用戶語(yǔ)音數(shù)據(jù);

5、對(duì)所述用戶語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別操作,得到與所述用戶語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音控制指令。

6、相應(yīng)的,本申請(qǐng)實(shí)施例另一方面還提供了一種語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置包括:

7、數(shù)據(jù)獲取模塊,用于獲取對(duì)應(yīng)同一時(shí)刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),其中,所述第一音頻數(shù)據(jù)包含用戶語(yǔ)音數(shù)據(jù)及通過(guò)音頻輸出裝置輸出、并由外部音頻采集裝置采集得到的第一設(shè)備輸出音頻數(shù)據(jù),所述第二音頻數(shù)據(jù)為送往所述音頻輸出裝置待輸出的第二設(shè)備輸出音頻數(shù)據(jù);

8、降噪處理模塊,用于根據(jù)所述第一音頻數(shù)據(jù)及所述第二音頻數(shù)據(jù),對(duì)所述第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除所述第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),得到所述用戶語(yǔ)音數(shù)據(jù);

9、指令識(shí)別模塊,用于對(duì)所述用戶語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別操作,得到與所述用戶語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音控制指令。

10、相應(yīng)的,本申請(qǐng)實(shí)施例另一方面還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行如上所述的語(yǔ)音識(shí)別方法。

11、相應(yīng)的,本申請(qǐng)實(shí)施例另一方面還提供了一種電子設(shè)備,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有多條指令,所述處理器加載所述指令以執(zhí)行如上所述的語(yǔ)音識(shí)別方法。

12、本申請(qǐng)實(shí)施例提供了一種語(yǔ)音識(shí)別方法、裝置、介質(zhì)及設(shè)備,該方法通過(guò)獲取對(duì)應(yīng)同一時(shí)刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),其中,第一音頻數(shù)據(jù)包含用戶語(yǔ)音數(shù)據(jù)及通過(guò)音頻輸出裝置輸出、并由外部音頻采集裝置采集得到的第一設(shè)備輸出音頻數(shù)據(jù),第二音頻數(shù)據(jù)為送往音頻輸出裝置待輸出的第二設(shè)備輸出音頻數(shù)據(jù);根據(jù)第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),對(duì)第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),得到用戶語(yǔ)音數(shù)據(jù);對(duì)用戶語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別操作,得到與用戶語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音控制指令。利用本申請(qǐng)實(shí)施例提供的語(yǔ)音識(shí)別方法,通過(guò)獲取對(duì)應(yīng)同一時(shí)刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),并基于第二音頻數(shù)據(jù)對(duì)第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),從而得到用于語(yǔ)音識(shí)別操作的用戶語(yǔ)音數(shù)據(jù),根據(jù)得到的用戶語(yǔ)音數(shù)據(jù)能夠提升對(duì)用戶意圖的識(shí)別準(zhǔn)確度。



技術(shù)特征:

1.一種語(yǔ)音識(shí)別方法,其特征在于,包括:

2.如權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于,在所述對(duì)所述第一音頻數(shù)據(jù)進(jìn)行降噪處理之前,所述方法還包括:

3.如權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于,所述對(duì)所述第二音頻數(shù)據(jù)進(jìn)行校準(zhǔn)處理,得到校準(zhǔn)處理后的第三音頻數(shù)據(jù),以使所述第三音頻數(shù)據(jù)與所述第一音頻數(shù)據(jù)在時(shí)域上的誤差值小于或等于預(yù)設(shè)閾值,包括:

4.如權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于,在所述對(duì)所述第一音頻數(shù)據(jù)進(jìn)行降噪處理之前,所述方法還包括:

5.如權(quán)利要求4所述的語(yǔ)音識(shí)別方法,其特征在于,所述基于預(yù)設(shè)的選擇算法,從多組所述數(shù)據(jù)傳輸時(shí)延集合中選擇用于確定預(yù)設(shè)的時(shí)延基準(zhǔn)值的目標(biāo)數(shù)據(jù)傳輸時(shí)延集合,包括:

6.如權(quán)利要求5所述的語(yǔ)音識(shí)別方法,其特征在于,所述根據(jù)所述目標(biāo)數(shù)據(jù)傳輸時(shí)延集合確定出預(yù)設(shè)的時(shí)延基準(zhǔn)值,包括:

7.如權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于,所述對(duì)所述第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除所述第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),得到所述用戶語(yǔ)音數(shù)據(jù),包括:

8.一種語(yǔ)音識(shí)別裝置,其特征在于,所述語(yǔ)音識(shí)別裝置包括:

9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的語(yǔ)音識(shí)別方法。

10.一種電子設(shè)備,其特征在于,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有多條指令,所述處理器加載所述指令以執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的語(yǔ)音識(shí)別方法。


技術(shù)總結(jié)
本申請(qǐng)實(shí)施例提供一種語(yǔ)音識(shí)別方法、裝置、介質(zhì)及設(shè)備,該方法通過(guò)獲取對(duì)應(yīng)同一時(shí)刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù);根據(jù)第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),對(duì)第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),得到用戶語(yǔ)音數(shù)據(jù);對(duì)用戶語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別操作,得到與用戶語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音控制指令。利用本申請(qǐng)實(shí)施例提供的語(yǔ)音識(shí)別方法,通過(guò)獲取對(duì)應(yīng)同一時(shí)刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù),并基于第二音頻數(shù)據(jù)對(duì)第一音頻數(shù)據(jù)進(jìn)行降噪處理,以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù),從而得到用于語(yǔ)音識(shí)別操作的用戶語(yǔ)音數(shù)據(jù),根據(jù)得到的用戶語(yǔ)音數(shù)據(jù)能夠提升對(duì)用戶意圖的識(shí)別準(zhǔn)確度。

技術(shù)研發(fā)人員:陳琳,白文星
受保護(hù)的技術(shù)使用者:深圳TCL數(shù)字技術(shù)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1