實(shí)驗(yàn)語音學(xué)與計(jì)算語言學(xué)(漢文部分)

發(fā)布時(shí)間:2021-11-19 17:53:49 | 來源: | 作者: | 責(zé)任編輯:

二、實(shí)驗(yàn)語音學(xué)與計(jì)算語言學(xué)

2010年藏語實(shí)驗(yàn)語音學(xué)的成果在整個(gè)藏語文研究成果中占據(jù)很大比例,具不完全統(tǒng)計(jì)有近30篇相關(guān)論文。鑒于藏語實(shí)驗(yàn)語音學(xué)與計(jì)算語言學(xué)在研究方法和研究對(duì)象上各有偏重,在實(shí)踐過程中又互有交叉,本文將這兩個(gè)學(xué)科的研究成果放在一起進(jìn)行梳理。代表性的研究成果有:楊陽蕊、周一心、于洪志《藏語音素音位系統(tǒng)的功能負(fù)擔(dān)計(jì)算》(《蘭州學(xué)刊》第1期),楊陽蕊、于洪志、李永宏《基于呼吸信號(hào)的藏語詩歌韻律研究》(《微計(jì)算機(jī)信息》第28期),王雙成、陳忠敏的《安多藏語送氣擦音的實(shí)驗(yàn)研究》(《民族語文》第2期),李亮、于洪志、楊陽蕊、李永宏等的《現(xiàn)代藏語聲調(diào)研究現(xiàn)狀及方法》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第1期),陳小瑩、陳晨、胡妍茹、李永宏、華侃的《基于EGG信號(hào)的安多藏語元音嗓音特征研究》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第1期),陳晨、陳琪、李永宏、于洪志的《藏語語音合成語料庫的韻律標(biāo)注規(guī)則設(shè)計(jì)》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第1期),李永宏、于洪志、孔江平的《藏語連續(xù)語音語料庫設(shè)計(jì)與實(shí)現(xiàn)》(《計(jì)算機(jī)工程與應(yīng)用》第13期),達(dá)哇彭措的《基于優(yōu)化Apriori算法的藏語音韻律規(guī)則研究》(《微計(jì)算機(jī)信息》第18期),李永宏、張金爽、王姝文、于洪志的《藏語新聞朗讀的呼吸信號(hào)聲學(xué)分析》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第2期),高璐、陳琪、李永宏、于洪志的《藏語語音合成中文本分析的若干問題研究》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第2期),韓清華、于洪志的《基于HMM的安多藏語非特定人孤立詞語音識(shí)別研究》(《軟件導(dǎo)刊》第7期),多杰卓瑪?shù)摹冬F(xiàn)代藏語詞語信息庫構(gòu)建研究》(《電腦開發(fā)與應(yīng)用》第7期),才讓卓瑪、才智杰的《基于語料庫的藏語TTS技術(shù)研究》(《青海師范大學(xué)學(xué)報(bào)》自然科學(xué)版第2期),陳小瑩、華侃、于洪志的《藏語拉薩話元音單音節(jié)嗓音聲學(xué)參數(shù)分析》(《語文學(xué)刊》第15期),廖艷莎、安亞彬、楊陽蕊、何向真的《藏語單音節(jié)聲學(xué)參數(shù)數(shù)據(jù)庫結(jié)構(gòu)設(shè)計(jì)》(《隴東學(xué)院學(xué)報(bào)》第4期),劉澤國、張會(huì)慶、張環(huán)、張兆基的《結(jié)合語音學(xué)知識(shí)的藏語語音端點(diǎn)檢測(cè)方法研究》(《福建電腦》第8期),扎西加、頓珠次仁的《自然語言處理用藏語格助詞的語法信息研究》(《中文信息學(xué)報(bào)》第5期)等。上述成果中,對(duì)于藏語語音相關(guān)參數(shù)的實(shí)驗(yàn)研究、分析和藏語聲學(xué)數(shù)據(jù)庫的建設(shè)是藏語實(shí)驗(yàn)語音學(xué)界關(guān)注的重點(diǎn)。楊陽蕊、周一心、于洪志的《藏語音素音位系統(tǒng)的功能負(fù)擔(dān)計(jì)算》一文,以藏語的音素音位系統(tǒng)為研究對(duì)象,對(duì)拉薩話和夏河話的元音、輔音及聲調(diào)的音位功能負(fù)擔(dān)進(jìn)行了量化研究,該項(xiàng)研究的意義在于為歷史語言中關(guān)于方言分化和聲調(diào)產(chǎn)生理論提供了參考基礎(chǔ)。韓清華、于洪志的《基于HMM的安多藏語非特定人孤立詞語音識(shí)別研究》以VC++6.0為開發(fā)平臺(tái),實(shí)現(xiàn)一個(gè)基于隱馬爾可夫模型(Hidden Markov Model,簡稱HMM)非特定人的安多藏語孤立詞語音識(shí)別系統(tǒng)。對(duì)有聲段語音進(jìn)行MFCC參數(shù)的提取,對(duì)提取后的MFCC參數(shù)進(jìn)行矢量量化后訓(xùn)練HMM模型,形成特征模板庫,最后進(jìn)行識(shí)別。根據(jù)安多藏語的特點(diǎn),改進(jìn)端點(diǎn)檢測(cè)的方法,提高了孤立詞語音信號(hào)檢測(cè)的準(zhǔn)確性,并進(jìn)一步提高了識(shí)別率。

端點(diǎn)檢測(cè)是語音識(shí)別中的一項(xiàng)關(guān)鍵技術(shù),端點(diǎn)檢測(cè)的準(zhǔn)確性對(duì)語音識(shí)別的性能有很大影響。劉澤國、張會(huì)慶、張環(huán)、張兆基的《結(jié)合語音學(xué)知識(shí)的藏語語音端點(diǎn)檢測(cè)方法研究》一文,將藏語語音學(xué)知識(shí)融入端點(diǎn)檢測(cè)過程中,同時(shí)綜合時(shí)域頻域特征,根據(jù)短時(shí)能頻值和語音能量集中區(qū)的頻域譜幅采取自適應(yīng)門限方法,改進(jìn)端點(diǎn)檢測(cè)的方法。實(shí)驗(yàn)表明該方法提高了端點(diǎn)檢測(cè)的識(shí)別率,對(duì)于藏語語音識(shí)別起到了很好的輔助作用。

韻律是語音的一個(gè)重要特征。對(duì)韻律規(guī)則進(jìn)行研究和韻律標(biāo)注是藏語語音合成語料庫建設(shè)的重要環(huán)節(jié)。楊陽蕊、于洪志、李永宏等的《基于呼吸信號(hào)的藏語詩歌韻律研究》、達(dá)哇彭措的《基于優(yōu)化Apriori算法的藏語音韻律規(guī)則研究》和陳晨、陳琪、李永宏、于洪志等的《藏語語音合成語料庫的韻律標(biāo)注規(guī)則設(shè)計(jì)》就是這方面的研究成果。上述研究成果為建立藏語語音合成語料庫提供了直觀的、科學(xué)的方法。

運(yùn)用實(shí)驗(yàn)設(shè)備和手段對(duì)藏語具體語音現(xiàn)象進(jìn)行研究是實(shí)驗(yàn)語音學(xué)的重要特征之一。相關(guān)的成果有王雙成、陳忠敏的《安多藏語送氣擦音的實(shí)驗(yàn)研究》,陳小瑩、陳晨、胡妍茹、李永宏、華侃的《基于EGG信號(hào)的安多藏語元音嗓音特征研究》和陳小瑩、華侃、于洪志的《藏語拉薩話元音單音節(jié)嗓音聲學(xué)參數(shù)分析》?!栋捕嗖卣Z送氣擦音的實(shí)驗(yàn)研究》一文的作者根據(jù)送氣擦音的發(fā)音機(jī)制,對(duì)安多藏語許多土語有清擦音送氣和不送氣的對(duì)立進(jìn)行研究,提出在安多方言里可以用三個(gè)聲學(xué)特征來區(qū)別一般清擦音和送氣清擦音?!痘贓GG信號(hào)的安多藏語元音嗓音特征研究》和《藏語拉薩話元音單音節(jié)嗓音聲學(xué)參數(shù)分析》二文,就是通過提取元音的參數(shù)基頻,就元音之間、元音與輔音之間的組合對(duì)嗓音參數(shù)的影響進(jìn)行研究,得出基頻、開商和速度商之間有很強(qiáng)的關(guān)聯(lián)性,各種組合方式下前置輔音對(duì)嗓音參數(shù)的影響不及輔音韻尾的影響程度、各元音由于組合方式變化對(duì)于參數(shù)影響的趨勢(shì)基本一致。

聲調(diào)研究是現(xiàn)代藏語語音研究的一個(gè)基礎(chǔ)部分,同時(shí)也為漢藏語系其他語言的研究奠定了基礎(chǔ)。李亮、于洪志、楊陽蕊、李永宏等的《現(xiàn)代藏語聲調(diào)研究現(xiàn)狀及方法》一文,分別從起源時(shí)間和形成條件兩方面說明藏語聲調(diào)的產(chǎn)生和發(fā)展,縱向闡述了藏語聲調(diào)研究及研究結(jié)果,并從聲學(xué)角度分析、論述了藏語聲調(diào)的現(xiàn)代語音學(xué)研究方法。

計(jì)算語言學(xué)為藏語文的信息化處理提供技術(shù)思路和技術(shù)支持保障。藏漢雙語語料庫建設(shè)對(duì)計(jì)算語言學(xué)的發(fā)展具有重要意義。語料庫的建設(shè)涉及對(duì)語料的描述、標(biāo)記,數(shù)據(jù)庫的總體結(jié)構(gòu)、設(shè)計(jì)與實(shí)現(xiàn)等多個(gè)方面。多杰卓瑪?shù)摹冬F(xiàn)代藏語詞語信息庫構(gòu)建研究》一文,以語言學(xué)的理論和方法為主導(dǎo),在藏文信息處理中引入了藏語詞語的信息化和形式化,并對(duì)構(gòu)建的信息庫進(jìn)行了結(jié)構(gòu)上的總體設(shè)計(jì),從而制定了信息處理用藏語詞語信息庫的構(gòu)建原則及收詞規(guī)則,即一形一項(xiàng)、一時(shí)(式)一項(xiàng)、一義一項(xiàng)。為此構(gòu)建了以藏文詞匯為主的音、形、義等的信息庫。

才讓卓瑪、才智杰的《基于語料庫的藏語TTS技術(shù)研究》通過比較分析國內(nèi)外TTS技術(shù)的發(fā)展,提出基于語料庫的藏語TTS技術(shù)的可行性,研究了藏語TTS的文本分析模塊、語音合成模塊及語音數(shù)據(jù)庫的關(guān)鍵技術(shù),并設(shè)計(jì)了一個(gè)完整的基于語料庫的藏語TTS系統(tǒng)。廖艷莎、安亞彬、楊陽蕊、何向真的《藏語單音節(jié)聲學(xué)參數(shù)數(shù)據(jù)庫結(jié)構(gòu)設(shè)計(jì)》一文,在分析藏語三大方言音節(jié)結(jié)構(gòu)基礎(chǔ)上設(shè)計(jì)了藏語單音節(jié)聲學(xué)參數(shù)數(shù)據(jù)庫,其中包括39項(xiàng)聲學(xué)參數(shù)。這些聲學(xué)參數(shù)在表征語音現(xiàn)象的同時(shí),最終服務(wù)于工程語音學(xué)。李永宏、于洪志、孔江平等在《藏語連續(xù)語音語料庫設(shè)計(jì)與實(shí)現(xiàn)》一文中,以藏語夏河話為研究對(duì)象,建立了基于三音子的藏語連續(xù)語音語料庫,實(shí)現(xiàn)了語料自動(dòng)選取。李永宏、張金爽、王姝文、于洪志的《藏語新聞朗讀的呼吸信號(hào)聲學(xué)分析》一文從言語生理的角度研究藏語新聞朗讀時(shí)的呼吸生理特性。主要利用統(tǒng)計(jì)學(xué)的方法研究新聞?wù)Z料的男女發(fā)音人的呼吸信號(hào)的聲學(xué)表現(xiàn),包括:1.選取20篇250字左右的新聞?wù)Z料,進(jìn)行呼吸信號(hào)的錄制;2.利用已建好的呼吸信號(hào)處理平臺(tái),進(jìn)行呼吸重置的標(biāo)注,提取新聞呼吸信號(hào)的重置時(shí)長和幅度參數(shù);3.統(tǒng)計(jì)分析新聞朗讀的三級(jí)呼吸特性,并對(duì)男女呼吸特征進(jìn)行對(duì)比分析,得出呼吸重置時(shí)長和重置幅度的正相關(guān)和呼吸節(jié)奏特點(diǎn)。

文本分析是文語轉(zhuǎn)換系統(tǒng)的前端,是制約語音合成自然度的一個(gè)重要因素。高璐、陳琪、李永宏、于洪志的《藏語語音合成中文本分析的若干問題研究》一文在考察漢語文本分析方案的基礎(chǔ)上,分析藏語的特點(diǎn),提出了一套適合于藏語語音合成的文本分析模塊的實(shí)現(xiàn)方案。文中采用最大匹配法和分詞詞庫相結(jié)合的方法實(shí)現(xiàn)文本的自動(dòng)分詞,建立一套層次化的規(guī)則體系對(duì)文本進(jìn)行規(guī)范化處理,字音轉(zhuǎn)換則通過SAMPA-ST的藏語機(jī)讀音標(biāo)系統(tǒng)來實(shí)現(xiàn)。本研究的完成為藏語的語音合成打下了良好的基礎(chǔ)。扎西加、頓珠次仁的《自然語言處理用藏語格助詞的語法信息研究》一文主要探討了藏語格助詞的語法信息、語義信息、功能結(jié)構(gòu)等內(nèi)容,從而為建立藏語格助詞的語法屬性庫提供翔實(shí)的參數(shù)。這對(duì)句子進(jìn)行分析與描述,觀察句子歧義都有著重要的意義。

版權(quán)所有 中國藏學(xué)研究中心。 保留所有權(quán)利。 京ICP備06045333號(hào)-1

京公網(wǎng)安備 11010502035580號(hào)