国产在线中文字幕亚洲,一区视频国产精品观看,欧美日韩国产高清片,久久久久久AV无码免费网站,亚洲无码一二三四五区,日韩无码www.,sese444

您好,歡迎來到維庫電子市場網(wǎng) 登錄 | 免費(fèi)注冊

語音識別
閱讀�11606時間�2011-09-26 10:59:08

  語音識別其目�(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算�(jī)可讀的輸�,例如按�、二�(jìn)制編碼或者字符序�。與說話人識別及說話人確�(rèn)不同,后者嘗試識別或確認(rèn)�(fā)出語音的說話人而非其中所包含的詞匯內(nèi)��

�(fā)展史

  早在計算�(jī)�(fā)明之前,自動語音識別的設(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識別及合成的雛彀�1920年代生產(chǎn)�"Radio Rex"玩具狗可能是最早的語音識別�,當(dāng)這只狗的名字被呼喚的時�,它能夠從底座上彈出來。最早的基于電子計算�(jī)的語音識別系�(tǒng)是由AT&T貝爾�(shí)�(yàn)室開�(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)�。其識別方法是跟蹤語音中的共振峰。該系統(tǒng)得到�98%的正確率。到1950年代�,倫敦�(xué)院(Colledge of London)的Denes已經(jīng)將語法概率加入語音識別中�

  1960年代,人工神�(jīng)�(wǎng)�(luò)被引入了語音識別。這一時代的兩大突破是線性預(yù)測編碼Linear Predictive Coding (LPC�� 及動�(tài)時間彎折Dynamic Time Warp技�(shù)�

  語音識別技�(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)�(shù)�(xué)推理,經(jīng)過Labiner等人的研�,卡�(nèi)基梅隆大�(xué)的李開復(fù)最終實(shí)�(xiàn)了個基于隱馬爾科夫模型的大詞匯量語音識別系�(tǒng)Sphinx。此后嚴(yán)格來說語音識別技�(shù)并沒有脫離HMM框架�

  盡管多年來研究人員一直嘗試將“聽寫機(jī)”推�,語音識別技�(shù)在目前還無法支持無限�(lǐng)�,無限說話人的聽寫機(jī)�(yīng)��

�(xiàn)狀

  作為一種軟件產(chǎn)品,Microsoft已圍繞語音識別技�(shù)�(jìn)行了長達(dá)�(shù)年之久的研發(fā)工作。如需了解更多�(guān)于語言識別�(chǎn)品當(dāng)前�(jìn)展情況的信息,請訪問Microsoft .NET語音技�(shù)Web站點(diǎn)�

  與此同時,Microsoft將繼�(xù)在語音識別研究領(lǐng)域�(jìn)行投�。位于雷蒙德和中國的研發(fā)�(tuán)�(duì)正致力于解決困擾語音識別�(lǐng)域的某些技�(shù)缺陷。其�,一個稱作Dr. Who的研究項(xiàng)目旨在解決噪音問題,力求確保您的計算�(jī)能夠在辦公場所以外的嘈雜環(huán)境(例如汽車或人流較多的餐館�(nèi))中識別語音信息�

�(yīng)�

  語音識別技�(shù)的應(yīng)用包括語音撥�、語音導(dǎo)航、室�(nèi)�(shè)備控�、語音文檔檢�、簡單的聽寫�(shù)�(jù)錄入�。語音識別技�(shù)與其他自然語言處理技�(shù)如機(jī)器翻譯及語音合成技�(shù)相結(jié)合,可以�(gòu)建出更加�(fù)雜的�(yīng)�,例如語音到語音的翻��

  語音識別技�(shù)所涉及的領(lǐng)域包括:信號處理、模式識�、概率論和信息論、發(fā)聲機(jī)理和聽覺�(jī)理、人工智能等��

目標(biāo)

  語音-文本�(zhuǎn)換(voice-to-text)軟件和自動電話服務(wù)等應(yīng)用背后的�(guān)鍵技�(shù)是語音識�。在這些�(yīng)用中語音識別�(zhǔn)確率是至�(guān)重要�,而為了做到這一�(diǎn),語�-文本�(zhuǎn)換軟件通常要求用戶在安裝過程中對軟件�(jìn)行“訓(xùn)練�,軟件本身也要隨著時間的推移慢慢適應(yīng)用戶的語音模式。需要與多個說話者互動的自動語音服務(wù)則不允許存在使用者對軟件�(jìn)行訓(xùn)練的�(huán)節(jié),因?yàn)樗鼈儽仨毮軌蛟跁r間為任何用戶服務(wù)。為了解決識別準(zhǔn)確率較低的問�,這些系統(tǒng)要么只能處理很小的詞匯量,要么嚴(yán)格限制用戶可以使用的字句或模��

  自動語音識別的最終目�(biāo)是提供即買即�、可以自動快速適�(yīng)任何說話者的語音識別服務(wù),這個系�(tǒng)不需要用戶訓(xùn)練就可以針對所有用戶和各種條件,良好地�(fā)揮功��

  “這個目�(biāo)在移動互�(lián)�(wǎng)時代顯得尤為重要,”俞棟博士表�,“因?yàn)檎Z音是智能手機(jī)和其他移動設(shè)備必不可缺的接口模式。雖然個人移動�(shè)備是采集和學(xué)�(xí)用戶語音的理想設(shè)備,但用戶只有在初始體驗(yàn),也就是在針對該用戶的模型建立之前的體驗(yàn)非常良好�,才會繼�(xù)使用語音功能。�

  非特定人語音識別技�(shù)對于沒有�(jī)會或辦法適應(yīng)用戶的語音識別系�(tǒng)也非常重�,例如在呼叫中心,來電者身份是未知�,而且通話時間只有幾秒鐘;又例如用戶可能會�?yàn)�?dān)心隱私問題而不愿意在提供“語�-語音(speech-to-speech)”翻譯的�(wǎng)�(luò)服務(wù)中留存語音樣��

更多精彩�(nèi)�,請登入維庫電子通(www.06jpkg.cn�

維庫電子通,電子知識,一查百��

已收錄詞�168426