- 相關(guān)推薦
基于LD3320的語音識別系統(tǒng)在家庭電路中的模擬應用
摘 要:本研究旨在為行動不便的殘障人士或者老年人的家居生活提供便利和幫助,使他們能夠通過語音識別系統(tǒng)對家用電器、照明系統(tǒng)、門窗開關(guān)等實現(xiàn)智能控制。通過查找資料,對比參數(shù)、價格、識別率等方面的信息,最終采用了基于LD3320的語音識別系統(tǒng)進行家庭電路控制模擬應用。系統(tǒng)由四部分構(gòu)成,即:YS-LD語音識別模塊、STM32單片機控制單元、LED顯示單元、繼電器輸出單元。LD3320語音識別芯片感應語音――通過STM32單片機運算分析――發(fā)出信號――控制繼電器――電器工作。經(jīng)過測試,本套系統(tǒng)的語音辨識率高達90%,造價僅155元,并且無需用戶自行建立語音模型及開發(fā)語音識別算法,降低了應用開發(fā)的技術(shù)門檻,有利于推廣應用。
關(guān)鍵詞:語音控制;單片機;語音識別芯片;
一、課題背景
學校常會組織我們到貴陽市盲聾啞學校送愛心,與殘障孩子親密互動,今年也不例外。那些殘章的孩子來到這個世界,只能用他們僅存的方式去感知世界萬物,在他們的世界里只有一種顏色,那就是黑色。我不禁想,在學校還有老師的照拂,可他們總有一日要長大,要開啟自己的人生旅程。要是我能為他們做哪怕一點點事,就算只是為他們的家庭生活提供一些幫助也是好的。我想,如果能利用我在機器人社中學到的傳感器、電子電路、單片機等專業(yè)知識,對家庭電路進行智能化改造,讓家庭的電路“聰明”起來,使他們能夠聽得懂主人的指令而進行相應的操作,那就可以對有殘障的人和對一些不良于行的病人或老人的家庭生活都能提供很大的便利。于是,有了我的這個設(shè)計――基于LD3320的語音識別系統(tǒng)在家庭電路中的模擬應用。
二、模型設(shè)計
(一)模塊功能
(二)模型組成
(三)主要電子元件工作原理與功能說明
1、LD3320語音識別芯片
LD3320語音識別芯片采用的是ASR(Auto Speech Recognitio)技術(shù),是YS-LD語音識別模塊的核心。它是對大量的語音數(shù)據(jù)經(jīng)語言學家語音模型分析,建立數(shù)學模型,并經(jīng)過反復訓練提取基元語音的細節(jié)特征,以及提取各基元間的特征差異,得到在統(tǒng)計概率最優(yōu)化意義上的各個基元語音特征,最后才由資深工程師將算法以及語音模型轉(zhuǎn)換成硬件芯片并應用在嵌入式系統(tǒng)中。
LD3320有兩種使用模式,即“觸發(fā)識別模式”和“循環(huán)識別模式”?梢酝ㄟ^編程,設(shè)置兩種不同的使用模式。
觸發(fā)識別模式:系統(tǒng)的主控MCU在接收到外界一個觸發(fā)后,啟動LD3320芯片的一個定時識別過程,在這個定時過程中說出要識別的語音關(guān)鍵詞語。這個過程結(jié)束后,需要再次觸發(fā)才能再次啟動一個識別過程。
循環(huán)識別模式:系統(tǒng)的主控MCU反復啟動識別過程。如果沒有人說話就沒有識別結(jié)果,則每次識別過程的定時到時后再啟動一個識別過程;如果有識別結(jié)果,則根據(jù)識別作相應處理后再啟動一個識別過程。
根據(jù)本案模型的設(shè)計特點,采用語音觸發(fā)識別模式。LD3320芯片最多支持50個識別條目,每個識別條目是標準普通話的漢語拼音(小寫),每2個字(漢語拼音)之間用1個空格間隔。例如表1,只需要把識別的關(guān)鍵詞語以漢語拼音字符串的形式傳送進芯片,該芯片已封裝了基于標準普通話的語音模型數(shù)據(jù)和語音識別算法,無需進行任何語音訓練即可投入開發(fā)應用。
2、STM32單片機控制單元
本案模擬系統(tǒng)主控單元采用意法半導體ARM-Cortex架構(gòu)的STM32F1系列超低功耗單片機作為控制核心。
該單元完成幾大功能:
向LD3320模塊提供時鐘振蕩信號,以驅(qū)動片上DSP(數(shù)字信號處理器 )工作;
通過SPI(串行外設(shè)接口)串行通信方式向LD3320模塊寫入預定義的控制命令拼音串,并讀取語音模塊返回的識別結(jié)果編碼;
根據(jù)識別結(jié)果驅(qū)動負載電路(LED單元(發(fā)光二極管)、繼電器單元)的動作。
當LD3320模塊完成一次識別過程后,通過中斷請求方式通知主控單元處理,主控單元獲知中斷請求后會暫時中止當前的任務執(zhí)行,轉(zhuǎn)而跳轉(zhuǎn)到中斷服務例程(ISR Route),在該例程中通過SPI總線從LD3320模塊讀取識別編碼,根據(jù)識別編碼的不同執(zhí)行對應控制功能。通過點亮、熄滅指令對應發(fā)光二極管或驅(qū)動繼電器接通主回路得到運行結(jié)果。
3、LED顯示單元
本案模擬系統(tǒng)用六個共陽極發(fā)光二極管(LED)來模擬家庭中廚房、工作間、臥室、走廊、衛(wèi)生間、陽臺的燈泡開關(guān)狀況,工作時主控單片機則根據(jù)語音命令,采用輸出低電平方式進行驅(qū)動點亮。
4、繼電器輸出單元
繼電器輸出單元可接收主控單片機的高低電平控制信號以接通或斷開主回路。主回路根據(jù)實際需求可以用于大電壓,交、直流供電的負載驅(qū)動。本案模擬系統(tǒng)用繼電器單元實現(xiàn)家庭電扇的通斷控制。
(四)系統(tǒng)軟件開發(fā)環(huán)境
本案模擬系統(tǒng)的軟件開發(fā)只針對STM32F103主控單元進行,軟件代碼完成以下功能:
LD3320底層驅(qū)動(對其內(nèi)部寄存器的讀寫、時序的控制);
STM32F103硬件單元和用戶變量的初始化;
用戶語音命令拼音串的寫入;
中斷服務ISR(完成負載電路的驅(qū)動控制)。
軟件開發(fā)基于ARM公司的Keil開發(fā)環(huán)境,完成從代碼編輯到編譯、調(diào)試、燒寫一系列過程。
(五)設(shè)備成本
三、設(shè)備實測
(一)控制命令
LD3320語音識別芯片中最多可以寫入50條語音控制指令,可以根據(jù)用戶需要定制個性化的語音控制功能。本案設(shè)備的設(shè)計初衷是為了探索LD3320語音識別芯片在家庭電路中的模擬應用,故只寫入了比較基本的18條指令。
(二)設(shè)備測試
在寫入程序,完成硬件連線并加電復位后,系統(tǒng)即進入運行狀態(tài)。向系統(tǒng)說出控制命令(盡可能用普通話, 不過實測時對貴陽本地方言還是有較高識別率),比如說“廚房打開”、“走廊關(guān)閉”、“電扇啟動”、“運行流水燈”等命令后,系統(tǒng)會根據(jù)識別結(jié)果執(zhí)行對應動作,點亮/熄滅LED或者通/斷電扇運行。
為了更好的檢測語音識別效果,實驗中選擇多個不同音色的人在家庭(比較安靜)環(huán)境下分別進行測試,每個詞語測試50遍。部分非特定人的語音命令測試的正確識別數(shù)據(jù)比例見表4:由上表可知,在家庭(比較安靜)環(huán)境下,對于語音命令的平均識別率可達到90%以上。
四、設(shè)備優(yōu)勢與應用展望
(一)設(shè)備優(yōu)勢
1、本案設(shè)備成本低、語音辨識率高、響應快速,可以直接安裝于家庭電路中實現(xiàn)語音智能控制。
2、由于LD3320 可以動態(tài)編輯的識別關(guān)鍵詞語列表,因此其可以應用的范圍大大超過了那些不可以改變識別列表的芯片。
3、可以根據(jù)用戶的需求進行控制命令寫入,實現(xiàn)可定制、個性化的智能控制。
(二)應用展望
1、應對家庭生活突發(fā)狀況
在本語音識別系統(tǒng)中只是初步嘗試了對用電器通、斷電控制,而在現(xiàn)在社會中有很多的空巢老人,他們獨自生活,如果在家中出現(xiàn)意外或突發(fā)疾病,隨時都有可能危及生命。如果在本案系統(tǒng)中可以添加“緊急呼叫”的語音控制,當出現(xiàn)突發(fā)狀況時可以使用該功能觸發(fā)電話自動撥打物管、救護車、親屬等重要聯(lián)系人。或者該控制與小區(qū)物管相連,每當有人有緊急呼叫時,物管的終端緊急呼叫燈亮起,并觸發(fā)揚聲器發(fā)出警報聲,使物管人員迅速到場解決問題。
2、實現(xiàn)家用電器的語音控制
(1)電磁爐/微波爐/智能家電操作
在現(xiàn)在的家電中,各種各樣的設(shè)置越來越繁復。用戶在使用過程中,還要不斷地對家電進行功能切換。在引入LD3320 芯片后,可以用語音直接控制這些家電。比如用語音來控制電磁爐把火力調(diào)整到“煎炸”或者是“慢燉”。
(2)數(shù)碼像框
數(shù)碼像框中存放了許多的照片和視頻,同時又具有多種播放的方式。一般是通過按鍵或者遙控器的方式來對其進行操作,但是這樣的操作并不方便。在引入了LD3320 提供的語音識別功能后,用戶可以最自然地用語音去點播想要顯示的照片,或者改變數(shù)碼像框的顯示方式。使得這樣的數(shù)碼產(chǎn)品更加具有人性化的操作界面。
3、機頂盒/彩電遙控器
隨著數(shù)字電視的普及,家庭中可以收看到的電視節(jié)目也越來越豐富。大家也就苦于在眾多的頻道中迅速選擇到自己想要看的頻道。在把LD3320 語音識別芯片集成進機頂盒/彩電遙控器后,用戶只需要對著遙控器說出想要看的電視頻道的名字,就可以快速地選擇。比如用戶可以說出“奧運體育”,就可以轉(zhuǎn)到體育頻道來觀看精彩的體育比賽了。
4、智能玩具/對話玩具
在電視購物中曾經(jīng)出現(xiàn)過可以人機對話的玩具,比如金福豬,金福狗等。這些玩具采用的語音識別只能支持固定的10 條左右的語音命令,比如“你好”,“我想聽歌”等等。采用LD3320 芯片,可以利用其動態(tài)編輯識別關(guān)鍵詞語列表的性能,讓玩具實現(xiàn)及其復雜的對話腳本。避免了玩具的嚴重同質(zhì)化。
(三)公共服務設(shè)施的語音控制
1、自動售貨機、地鐵自動售票機等銷售型服務設(shè)施
在自動售貨機、地鐵自動售票機等銷售型服務設(shè)施中安裝語音操作模塊。人們可以對著售貨機說出要買的商品,比如“可口可樂”或者“面巾紙”投幣后商品就自動售出。在北京、上海等大都市中,外地旅客較多,對地鐵線路不熟悉導致買票時不知道票價也不知道如何購買。有了語音操作界面后,只需要對著售票機說出要去的地方或者想要到達的站點,根據(jù)屏幕提示放入紙幣,就可以方便地買到車票。
2、公共照明系統(tǒng)、輔助設(shè)施的語音控制
在公共場合幫助殘疾人士、行動不便的老人或小孩非接觸地去控制公共照明系統(tǒng)或輔助設(shè)施(地下通道輪椅臺等)的運行。
3、樓宇電視的廣告點播
目前分眾傳媒等公司的樓宇廣告設(shè)施,遍布幾乎所有的寫字樓,也在廣告投放上取得了良好的效果。但是目前用戶在接受廣告時,都是被動地去接受信息。對于其中感興趣的廣告,只能是等待下次再看到時進行仔細地了解,沒有辦法進行主動式地廣告查詢。
引入LD3320 語音識別芯片后,用戶可以用語音去方便地查詢想要了解的廣告信息。比如操作樓宇廣告“重新播放”“上一條”來重新觀看一條廣告。或者“汽車”來點播想要看的汽車廣告。
這樣的語音操作,不需要增加額外的鍵盤輸入和觸摸屏輸入,又可以讓用戶與廣告充分互動,取得更佳的效果。
五、結(jié)語
使用LD3320 芯片可以在一定程度上完成這樣的語音控制系統(tǒng),給人們的生活帶來更便利的語音交互界面。作為一種新的人機交互界面,會逐步地走入人們的日常生活,在適合用語音控制的地方給人們提供更多的便利。
參考文獻:
[1]陳喜春.基于LD3320語音識別專用芯片實現(xiàn)的語音控制,[J]. 電子技術(shù)設(shè)計與應用. 2011年11月
[2]金鑫,田犇,闕大順. 基于的LD3320語音控制系統(tǒng)設(shè)計實現(xiàn).[J].電腦與信息技術(shù).2011年12月.第19卷第6期
[3]洪家平.LD3320的嵌入式語音識別系統(tǒng)的應用.[J].單片機與嵌入式系統(tǒng)應用.2012年.第2期
【基于LD3320的語音識別系統(tǒng)在家庭電路中的模擬應用】相關(guān)文章:
蒙特卡洛模擬技術(shù)在隨機交通分配中的應用分析05-11
氣管插管在院前急救中的應用05-29
Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應用06-04
物理教學中多媒體的應用論文11-02
探析Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應用05-29
幼兒文學在幼兒教育中的應用論文04-28