實驗語音學(漢文部分)

發(fā)布時間:2023-05-23 16:28:31 | 來源:中國藏學研究中心 | 作者: | 責任編輯:

三、實驗語音學

近些年來,實驗語音學研究已從過去的音素、音節(jié)分析擴展到句子和語音篇章的分析。除音色之外,超音段特征包括音高、音強和音長成為實驗語音學的重要研究對象。語音規(guī)則的合成和識別、人工智能等,都是實驗語音學關注的重點。

基于神經網絡理論的研究越來越被學界關注,神經網絡技術被應用于語音合成與識別,相關研究有:黃曉輝、李京《基于循環(huán)神經網絡的藏語語音識別聲學模型》(《中文信息學報》第5期)一文,將循環(huán)神經網絡和連接時序分類算法應用于藏語語音識別聲學建模,實現端到端的訓練;實驗結果顯示,與傳統(tǒng)基于隱馬爾可夫模型的聲學建模方法相比,循環(huán)神經網絡模型在藏語拉薩話音素識別上性能優(yōu)越。

相關研究還有:梁寧娜、鄧彥松《基于DTW的藏語語音識別系統(tǒng)設計》(《電子技術與軟件工程》10期)一文指出,語音識別技術是讓計算機識別人類的語音,并將人類的語音轉換為與之對應的命令或操作。基于藏語的語音系統(tǒng)的識別研究現在還不成熟,文章將語音識別技術和藏語的聲學特征結合起來,用DTW算法實現對藏語語音進行了識別設計。趙悅、李要嬙等《臨近最優(yōu)主動學習的藏語語音識別方法研究》(《計算機工程與應用》第22期)一文,基于主動學習的藏語拉薩話語音語料標注及選擇,該研究提出了一種臨近最優(yōu)的批量樣本選擇目標函數,并驗證了其具有submodular函數性質。通過實驗驗證,該方法能夠使用較少的訓練數據保證語音識別模型的精度,從而減少了人工標注語料的工作量。

語音特征參數是語音信號分析的重要依據,藏語語音特征參數的精確度直接影響藏語語音合成、語音識別及語音壓縮、降噪等處理的效果。涉及藏語的相關研究有:卓嘎、姜軍、董志誠《藏語語音時域參數提取關鍵技術研究》(《電腦知識與技術》第8期)一文,介紹了藏語時域語音信號處理過程中的語音特征參數及其提取關鍵技術和算法,分析了語音的時域特征參數在藏語語音分析中的實際應用。都格草、才讓卓瑪、南措吉《基于譜減法的藏語語音減噪研究》(《廣西科學院學報》第1期)一文指出,譜減法是語音減噪中最常用的方法,文章通過統(tǒng)計分析譜減法的增益補償因子和過減因子參數,研究基于譜減法的藏語語音減噪處理,并取得較為理想的實驗結果。

版權所有 中國藏學研究中心。 保留所有權利。 京ICP備06045333號-1

京公網安備 11010502035580號