1. <tt id="5hhch"><source id="5hhch"></source></tt>
    1. <xmp id="5hhch"></xmp>

  2. <xmp id="5hhch"><rt id="5hhch"></rt></xmp>

    <rp id="5hhch"></rp>
        <dfn id="5hhch"></dfn>

      1. 淺談語音識別中計算機仿真的運用論文

        時間:2024-10-15 08:54:24 計算機 我要投稿

        淺談語音識別中計算機仿真的運用論文

          摘要:文章闡述了一種改進的基于自適應模型的語音識別方法。概括歸納了實現這種方法的三大模塊:語音數據采集模塊,基于自適應模型的語音識別模塊和體現應用的結果顯示模塊。

        淺談語音識別中計算機仿真的運用論文

          關鍵詞:計算機仿真;語音識別;算法

          引言:當下對于語音識別技術的研究處于初期階段,但現在市面上出現的大量語音識別的產品例如DragonDictation,Siri等表明語音識別技術還擁有巨大的發展與應用空間。

          1 提出背景

          目前大多數的語音識別設備在算法上都是基于傳統的GMM方式,傳統的GMM方式的核心思想是利用多個高斯分布的概率密度函數組合來描述特征矢量在概率空間的分布狀況。傳統的GMM方法需要先計算所有說話人模型的識別概率p,然后取識別概率最大的說話人模型作為識別結果。而人類在進行說話人識別時,是一邊聽取語音,一邊做出判斷,同時排除掉絕對不可能的說話人,在若干相似說話人之間選擇,當有很大的把握性時,做出最終判定。這不同于目前的機器識別方法,總是取固定時長的語音數據,且對所有的說話人均同等對待。傳統的GMM模型在說話人集合很大時需要大量的數據收集和較長的處理時間,會影響到分辨說話人身份的準確性。所以我們需要一種更加高效,高可靠性的方式來改進當前主流的語音識別算法,更好的服務于當前信息化社會。

          2 自適應模型

          自適應[1]是指處理和分析過程中,根據處理數據的數據特征自動調整處理方法、處理順序、處理參數、邊界條件或約束條件,使其與所處理數據的統計分布特征、結構特征相適應,以取得最佳的處理效果。在特征提取階段,根據不同的說話人,選取不同長度的語音提取特征,對于易于區分的說話人,只選取少量語音就可以正確識別,對于難于區分的說話人,提取大量語音進行識別,從而在整體上減少了提取特征的時間;在識別階段,只選取少量語音進行總體說話人識別模型的識別概率計算,而選取較多的語音,對前期選取的識別概率較高的說話人模型計算識別概率,從而一方面保證不降低識別率,一方面大幅度減少識別時間。

          3 研究目標及主要內容

          3.1研究目標。我們研究的主要目標是通過MATLAB模型仿真功能,實現基于自適應的語音識別技術來確定說話人身份。在收集到語音信號的后,完成對信號的處理,主要是基于MFCC的特征提取實現語音庫的搭建,之后使用自適應的語音識別技術,將原先采集到的信息和后續說話人所說的語音在自適應的模型下進行比對,來確定說話人是否為本人,并且借助外圍設別對結果進行顯示,最終實現一個輸入-處理--輸出的語音識別平臺搭建。

          3.2研究內容。以MATLAB軟件為主要工具,配合外圍所搭建的輸入設備,顯示設備完成一個可以應用的說話人身份識別系統的搭建。(1)深入研究語音信號的采集方式,能夠將通過外圍設備將采集到的語音信號進行處理,并在MATLAB中實現編程,為后續的語音識別提供素材。(2)通過研究自適應模型的原理,設計基于其原理的算法,將(1)中經過處理后的語音信號與應用時輸入的語音信號進行識別,通過MATLAB完成計算,這一步是整個研究中最重要的部分,運算完成將給出處理結果。(3)搭建外圍顯示設備,我們將MATLAB和單片機進行通信,MATLAB將識別結果傳輸給單片機,我們通過單片機來提供一個顯示說話人身份識別信息并與用戶交互的平臺。

          4 技術路線

          4.1語音數據采集模塊。目前所有的語音識別方式都需要一個語音庫來進行匹配;谧赃m應的語音識別也要在語音庫的搭建上進行如下操作。4.1.1采集說話人語音。使用錄音筆在消音室中采集到說話人的聲音,我們會將模擬信號轉成數字信號,并且進行處理。為了得到高質量的聲音信號,確保語音庫的精確性,我們選擇在消音室完成聲音采集工作。4.1.2特征提取及語音庫搭建。模擬信號進行A/D轉換后,我們要對數字信號進行處理,這里我們使用MFCC這種主流的語音信號特征提取方式來進行提取。MFCC[2]是基于了Mel頻率的倒譜系數,我們輸入樣本音頻,對樣本音頻預加重,分幀,加窗,再做傅里葉變換,進行Mel頻率濾波,進行Log對數能量提取等操作從而完成采集的語音的特征提取。這一步的核心還是將采集到的模擬信號按照A/D轉換使其成為可以通過MATLAB調用的數據。

          4.2基于自適應模型的語音識別模塊設計。這個模塊是我們的研究最核心的部分,我們基于這個模型來實現主要功能。4.2.1當說話人為陌生人,先排除。傳統的語音識別主要是將采集到的信號和原來收集的所有信號進行比對從而確定說話人身份,但這樣做有時會浪費時間,也可能出現誤差。而自適應模型首先去做的就是特征抽取,將已經采集到的語音數據進行處理,尋找到他們的共同特征,當需要識別的信號不符合這種特性的時候,我們首先要將其排除,這樣,在排除陌生人說話時會更加簡便。在我們對說話人識別前先把陌生人給排除,在說話者不是陌生人的情況下,我們會減少很多干擾因素,能夠節約識別時間,提高識別精度。4.2.2當說話人已經在語音庫中,確定其身份。我們的算法主要是研究的對象是已經將語音信息導入到語音庫中的人群,這里我們要用到SVM[3]技術,SVM是一個可以把低維下線性不可分的問題變成一個高維線性可分問題的技術。在我們自適應語音識別說話人身份時,我們需要對收集到的語音數據進行分類。例如我們收集到1000組語音,按照收集到的語音特征分成250組,每組4個人。當說話人開始識別,我們先去找到這個說話人屬于哪個組,然后在這個4人小組里面在進行區分,這樣,我們把原先需要一一匹配的說話人識別僅僅需要幾步就可以實現。

          4.3體現應用的結果顯示模塊。使用一塊單片機與一塊顯示屏,通過Matlab中的設備控制箱將識別結果傳送到單片機,單片機依據識別結果在顯示屏進行顯示。

          5 結語

          和當前主流的傳統高斯混合模型相比,我們設計出的基于自適應的模型結構,可以很大程度上減少在聲音識別前所需要收集的數據量,節約空間,同時由于自適應算法的優越性我們也能夠在提高語音識別的可靠性,很大程度上減少在識別過程中由于外部因素所造成的誤差。

          引用:

          [1]丁博,王懷民,史殿習.構造具備自適應能力的軟件[J].軟件學報.2013(07)

          [2]李澤,崔宣,馬雨廷等.MFCC和LPCC特征參數在說話人識別中的研究[J].河南工程學院學報.2010(06).

          [3]李書玲,劉蓉,張鎏欽等.基于改進型SVM算法的語音情感識別[J].計算機應用.2013(07).

        【淺談語音識別中計算機仿真的運用論文】相關文章:

        淺談小學英語語音教學的策略的論文11-07

        YY語音在網絡教育中的運用研究論文12-04

        圖書館工作中計算機管理系統的有效運用論文12-17

        淺談本土教育資源的合理運用論文01-08

        淺談異化與歸化方法在翻譯中的運用論文12-01

        淺談運用賞識教育應注意的問題論文02-25

        淺談體育游戲在小學體育教學中的運用論文06-08

        計算機教育中計算機科學技術的應用論文11-07

        淺談計算機在網絡技術教學中的運用12-03

        計算機論文:初中計算機教學加強德育滲透探析03-08

        • 相關推薦
        国产高潮无套免费视频_久久九九兔免费精品6_99精品热6080YY久久_国产91久久久久久无码

        1. <tt id="5hhch"><source id="5hhch"></source></tt>
          1. <xmp id="5hhch"></xmp>

        2. <xmp id="5hhch"><rt id="5hhch"></rt></xmp>

          <rp id="5hhch"></rp>
              <dfn id="5hhch"></dfn>