智能語(yǔ)音簡(jiǎn)史:這場(chǎng)技術(shù)革命從哪開(kāi)始?

1952年,貝爾實(shí)驗(yàn)室(Bell Labs)制造一臺(tái)6英尺高自動(dòng)數(shù)字識(shí)別機(jī)“Audrey”,它可以識(shí)別數(shù)字0~9的發(fā)音,且準(zhǔn)確度高達(dá)90%以上。并且它對(duì)熟人的精準(zhǔn)度高,而對(duì)陌生人則偏低。

智能語(yǔ)音科技簡(jiǎn)史(2018版),這場(chǎng)技術(shù)革命從哪開(kāi)始?

1956年,普林斯頓大學(xué)RCA實(shí)驗(yàn)室開(kāi)發(fā)了單音節(jié)詞識(shí)別系統(tǒng),能夠識(shí)別特定人的十個(gè)單音節(jié)詞中所包含的不同音節(jié)。

1959年,MIT的林肯實(shí)驗(yàn)室開(kāi)發(fā)了針對(duì)十個(gè)元音的非特定人語(yǔ)音識(shí)別系統(tǒng)。

智能語(yǔ)音科技簡(jiǎn)史(2018版),這場(chǎng)技術(shù)革命從哪開(kāi)始?

二十世紀(jì)六十年代初,東京無(wú)線電實(shí)驗(yàn)室、京都大學(xué)和NEC實(shí)驗(yàn)室在語(yǔ)音識(shí)別領(lǐng)域取得了開(kāi)拓性的進(jìn)展,各自先后制作了能夠進(jìn)行語(yǔ)音識(shí)別的專(zhuān)用硬件。

1964年的世界博覽會(huì)上,IBM向世人展示了數(shù)字語(yǔ)音識(shí)別的“shoe box recognizer”。

二十世紀(jì)七十年代,語(yǔ)音識(shí)別的研究取得了突破性的進(jìn)展,研究重心仍然是孤立詞語(yǔ)語(yǔ)音識(shí)別。

1971年,美國(guó)國(guó)防部研究所(Darpa)贊助了五年期限的語(yǔ)音理解研究項(xiàng)目,希望將識(shí)別的單詞量提升到1000以上。參與該項(xiàng)目的公司和學(xué)術(shù)機(jī)構(gòu)包括IBM、卡內(nèi)基梅隆大學(xué)(CMU)、斯坦福研究院。就這樣,Harpy在CMU誕生了。不像之前的識(shí)別器,Harpy可以識(shí)別整句話。

二十世紀(jì)八十年代,NEC提出了二階動(dòng)態(tài)規(guī)劃算法,Bell實(shí)驗(yàn)室提出了分層構(gòu)造算法,以及幀同步分層構(gòu)造算法等。同時(shí),連接詞和大詞匯量連續(xù)語(yǔ)音的識(shí)別得到了較大發(fā)展,統(tǒng)計(jì)模型逐步取代模板匹配的方法,隱馬爾科夫模型(HMM)成為語(yǔ)音識(shí)別系統(tǒng)的基礎(chǔ)模型。

八十年代中期,IBM創(chuàng)造了一個(gè)語(yǔ)音控制的打字機(jī)—Tangora,能夠處理大約20000單詞。IBM的研究就是基于隱形馬爾科夫鏈模型(hidden Markov model),在信號(hào)處理技術(shù)中加入統(tǒng)計(jì)信息。這種方法使得在給定音素情況下,很有可能預(yù)測(cè)下一個(gè)因素。

1984年,IBM發(fā)布的語(yǔ)音識(shí)別系統(tǒng)在5000個(gè)詞匯量級(jí)上達(dá)到了95%的識(shí)別率。

1985年AT&T貝爾實(shí)驗(yàn)室建造了第一個(gè)智能麥克風(fēng)系統(tǒng),用來(lái)研究大室內(nèi)空間的聲源位置追蹤問(wèn)題。

1987年開(kāi)始,國(guó)家開(kāi)始執(zhí)行963計(jì)劃后,國(guó)家863智能計(jì)算機(jī)主題專(zhuān)家組為語(yǔ)音識(shí)別研究立項(xiàng),每?jī)赡暌淮巍?/p>

1987年12月,李開(kāi)復(fù)開(kāi)發(fā)出世界上第一個(gè)“非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng)”。

智能語(yǔ)音科技簡(jiǎn)史(2018版),這場(chǎng)技術(shù)革命從哪開(kāi)始?

1988年,卡耐基梅隆大學(xué)結(jié)合矢量量化技術(shù)(VQ),用VQ/HMM方法開(kāi)發(fā)了世界上第一個(gè)非特定人大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)SPHINX,能夠識(shí)別包括997個(gè)詞匯的4200個(gè)連續(xù)語(yǔ)句。

12下一頁(yè)>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2018-04-19
智能語(yǔ)音簡(jiǎn)史:這場(chǎng)技術(shù)革命從哪開(kāi)始?
1952年,貝爾實(shí)驗(yàn)室(Bell Labs)制造一臺(tái)6英尺高自動(dòng)數(shù)字識(shí)別機(jī)“Audrey”,它可以識(shí)別數(shù)字0~9的發(fā)音,且準(zhǔn)確度高達(dá)90%以上。并且它對(duì)熟人的精準(zhǔn)度高,而對(duì)陌生人則偏低。

長(zhǎng)按掃碼 閱讀全文