最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于交互型人工智能數字人系統的制作方法

文檔序號:41944534發(fā)布日期:2025-05-16 14:01閱讀:10來源:國知局

本發(fā)明涉及人工智能,具體為一種基于交互型人工智能數字人系統。


背景技術:

1、數字人是指基于人工智能技術、計算機圖形學和自然語言處理的虛擬人物角色,通常具有人類的外觀和行為,能夠與用戶進行交互,它們可以模擬人類的情感、語言和行為,常用于各種應用場景中,數字人可以用作教學助手,通過互動來幫助學生學習,提供個性化的學習體驗,它們能夠模擬不同的場景,以增強學習效果,在視頻游戲和影視制作中,數字人可以作為角色參與情節(jié),提升用戶的沉浸感和體驗,數字人作為未來技術發(fā)展的一個重要方向,在各個領域展現出巨大的潛力和應用價值。

2、盡管現代數字人可以合成語言和模擬情感,但它們對復雜情感的理解不足,難以準確識別用戶的潛在情感狀態(tài),導致降低了用戶與數字人交互過程中的體驗感。


技術實現思路

1、(一)解決的技術問題

2、針對現有技術的不足,本發(fā)明提供了一種基于交互型人工智能數字人系統,具備通過用戶接口模塊采集由用戶通過文本框輸入的文字信息與通過麥克風進行語音輸入的信息,并計算輸入延遲sryc與語音持續(xù)時間ycsj,用于評估輸入信息的復雜性,自然語言處理模塊分析捕捉的文本信息,識別用戶的意圖、關鍵信息、實體及上下文,計算意圖識別準確度sbzq、實體解析的成功率sjcg以及上下文保持率sxbc,語音識別合成模塊將語音輸入的信息通過語音識別轉化為文本,計算語音識別的詞錯誤率sccw與語音合成的自然度評分hcpf,用于評估輸出語音的流暢性和自然度,情感分析理解模塊根據用戶輸入的文本與語音數據進行關鍵字詞分析,提取用戶的情感特征并做出情感分類,計算情感識別準確率qgsb與情感強度評分qqpf,響應生成模塊根據情感分析理解模塊做出的用戶情感分類與情感強度評分,生成對應的文本回復,響應輸出模塊將系統作出的文本回復通過用戶接口模塊傳遞給用戶,完成交互,通過對用戶輸入的語音及文本信息進行綜合分析,準確識別用戶的潛在情感狀態(tài),提高了用戶與數字人交互過程中的體驗感等優(yōu)點,解決了上述問題。

3、(二)技術方案

4、為實現上述目的,本發(fā)明提供如下技術方案:一種基于交互型人工智能數字人系統,包括用戶接口模塊、自然語言處理模塊、語音識別合成模塊、情感分析理解模塊、響應生成模塊以及響應輸出模塊;

5、所述用戶接口模塊采集由用戶通過文本框輸入的文字信息與通過麥克風進行語音輸入的信息,并計算輸入延遲sryc與語音持續(xù)時間ycsj,用于評估輸入信息的復雜性,上述采集的文本與語音信息被傳輸至自然語言處理模塊;

6、所述自然語言處理模塊分析捕捉的文本信息,識別用戶的意圖、關鍵信息、實體及上下文,計算意圖識別準確度sbzq、實體解析的成功率sjcg以及上下文保持率sxbc;

7、所述語音識別合成模塊將語音輸入的信息通過語音識別轉化為文本,計算語音識別的詞錯誤率sccw與語音合成的自然度評分hcpf,用于評估輸出語音的流暢性和自然度;

8、所述情感分析理解模塊根據用戶輸入的文本與語音數據進行關鍵字詞分析,提取用戶的情感特征并做出情感分類,計算情感識別準確率qgsb與情感強度評分qqpf;

9、所述響應生成模塊根據情感分析理解模塊做出的用戶情感分類與情感強度評分,生成對應的文本回復;

10、所述響應輸出模塊將系統作出的文本回復通過用戶接口模塊傳遞給用戶,完成交互。

11、優(yōu)選的,所述用戶接口模塊計算輸入延遲sryc的公式如下所示:

12、sryc=kssr-srsj+clsj

13、公式中,sryc表示輸入延遲,kssr表示用戶開始輸入的時間,srsj表示系統接收到輸入的時間,clsj表示系統處理輸入所需的時間,上述數值通過系統時間戳獲取。

14、優(yōu)選的,所述用戶接口模塊計算語音持續(xù)時間ycsj的公式如下所示:

15、ycsj=yh?js-yh?ks

16、公式中,ycsj表示語音持續(xù)時間,yh?js表示用戶停止說話的時間,yhks表示用戶開始說話的時間,上述數值通過系統時間戳獲取。

17、優(yōu)選的,所述自然語言處理模塊計算意圖識別準確度sbzq的公式如下所示:

18、

19、公式中,sbzq表示意圖識別準確度,zqsb表示正確識別的意圖數,zyts表示總意圖數,包括正確和錯誤的意圖。

20、優(yōu)選的,所述自然語言處理模塊計算實體解析的成功率sjcg的公式如下所示:

21、

22、公式中,sjcg表示實體解析的成功率,cgjx表示成功解析的實體數量,wbzl表示輸入文本中總的實體數量。

23、優(yōu)選的,所述自然語言處理模塊計算上下文保持率sxbc的公式如下所示:

24、

25、公式中,sxbc表示上下文保持率,cgbc表示成功保持的上下文信息數量,zsxw表示對話中的總上下文信息數量。

26、優(yōu)選的,所述語音識別合成模塊計算語音識別的詞錯誤率sccw的公式如下所示:

27、

28、公式中,sccw表示語音識別的詞錯誤率,cwsb表示錯誤識別的單詞數量,ldsb表示原始文本中存在但沒有被識別的單詞,ccwr表示識別結果中存在但原始文本中并沒有的單詞,yszc表示原始音頻中的總單詞數量。

29、優(yōu)選的,所述語音識別合成模塊計算語音合成的自然度評分hcpf的公式如下所示:

30、

31、公式中,hcpf表示語音合成的自然度評分,n表示評分的總用戶數,rki表示第i個用戶給予的評分,i表示計數下標。

32、優(yōu)選的,所述情感分析理解模塊計算情感識別準確率qgsb的公式如下所示:

33、

34、公式中,qgsb表示情感識別準確率,qdsz表示正確識別的情感數量,zqsl表示總情感數量。

35、優(yōu)選的,所述情感分析理解模塊計算情感強度評分qqpf的公式如下所示:

36、

37、公式中,qqpf表示情感強度評分,m表示用于計算強度評分的樣本總數,qmi表示第i個樣本的情感強度分數。

38、與現有技術相比,本發(fā)明提供了一種基于交互型人工智能數字人系統,具備以下有益效果:

39、本發(fā)明通過用戶接口模塊采集由用戶通過文本框輸入的文字信息與通過麥克風進行語音輸入的信息,并計算輸入延遲sryc與語音持續(xù)時間ycsj,用于評估輸入信息的復雜性,自然語言處理模塊分析捕捉的文本信息,識別用戶的意圖、關鍵信息、實體及上下文,計算意圖識別準確度sbzq、實體解析的成功率sjcg以及上下文保持率sxbc,語音識別合成模塊將語音輸入的信息通過語音識別轉化為文本,計算語音識別的詞錯誤率sccw與語音合成的自然度評分hcpf,用于評估輸出語音的流暢性和自然度,情感分析理解模塊根據用戶輸入的文本與語音數據進行關鍵字詞分析,提取用戶的情感特征并做出情感分類,計算情感識別準確率qgsb與情感強度評分qqpf,響應生成模塊根據情感分析理解模塊做出的用戶情感分類與情感強度評分,生成對應的文本回復,響應輸出模塊將系統作出的文本回復通過用戶接口模塊傳遞給用戶,完成交互,通過對用戶輸入的語音及文本信息進行綜合分析,準確識別用戶的潛在情感狀態(tài),提高了用戶與數字人交互過程中的體驗感。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1