嵌入式TTS漢語語音系統(tǒng)的解決方案

相關專題: 芯片

使計算機、帶有人機交互的電器、儀表等能像人一樣開口“說話”是科技工作者多年的研究目標。語言是人與人交流信息的一種手段,文語轉(zhuǎn)換TTS(Text To Speech)是自動將輸入文字轉(zhuǎn)換成語音輸出,并盡量使輸出的語音效率流暢、自然的一類技術。

TTS系統(tǒng)主要需解決兩個問題:

①文本分析,即語言學分析。該任務是將以文本廣度輸入的字符串轉(zhuǎn)換成語言學的表述;

②語音合成。即根據(jù)語言學的內(nèi)在表述信息合成語音。

TTS系統(tǒng)中的語音合成方法分為時域和頻域兩大類:頻域方法主要有LPC參數(shù)合成及其振峰合成兩種,其實質(zhì)是在工程上實現(xiàn)語音生成模型,進而在終端特性上模擬發(fā)音器官。在目前階段,頻域方法形成的發(fā)音尚不自然,且需要的計算量很大,不適宜在低端的嵌入式芯片上使用。波形編輯法是將較短的數(shù)字音頻段(即合成基元)拼接并進行段音平滑后生成連續(xù)語流的方法。這種方法占用的存儲空間大,但計算量小、計算速度快,而且合成語音自然度較高,顯然比較適合于芯片性能較弱的嵌入式系統(tǒng)方面的應用。

采用波形編輯法的嵌入式TTS系統(tǒng)由于成本低、性能完善、自然度高,隨著波形修改算法的不斷提出以及微處理器和非易失性存儲介質(zhì)功能的不斷增強,正日益受到人們的關注。本系統(tǒng)即采用時域波形編輯技術,采集GB2312漢字編碼字符集中所有字符發(fā)音作為原始材料,通過使用改進的游程編碼算法壓縮生成可適用于當前FLASH存儲器的語音庫,并采用多重查找表設計及預存儲命令字技術有效地加快語音庫的尋址速度,在基于Atmel公司的AT89S52單片機上成功實現(xiàn)了一個TTS語音系統(tǒng),經(jīng)測試取得了令人滿意的效果。該系統(tǒng)應用簡便,具有很小的尺寸和很低的功耗及通用的串行接口,可以廣泛用于有關的漢語語音應用系統(tǒng)中。

來源:維庫開發(fā)網(wǎng)


微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網(wǎng)絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復“LTBPS”免費領取《《中國聯(lián)通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網(wǎng)白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統(tǒng)架構1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息