首页    期刊浏览 2024年10月06日 星期日
登录注册

文章基本信息

  • 标题:Consistency Analysis of the Duration Parameter Within a Syllable for Mandarin Speech
  • 其他标题:Consistency Analysis of the Duration Parameter Within a Syllable for Mandarin Speech
  • 作者:Yeh, Cheng-Yu ; Chen, Kuan-Lin ; Hwang, Shaw-Hwa
  • 期刊名称:Engineering Economics
  • 印刷版ISSN:2029-5839
  • 出版年度:2013
  • 卷号:42
  • 期号:2
  • 页码:170-177
  • DOI:10.5755/j01.itc.42.2.1745
  • 语种:English
  • 出版社:Kaunas University of Technology
  • 摘要:Straipsnyje pristatomas mandarinų kalbos tyrimas, kuriame daugiausia dėmesio skiriama skiemenų trukmės parametro pastovumo analizei tirti. Šis pastovumas, nustatytas kaip žmogaus tarimo proceso tyrimo rezultatas, gali būti interpretuojamas kaip turintis labai stiprią sąsają tarp deformavimo kreivių spektro ir prozodijos vidinio skiemens. Per tris pastovumo analizės žingsnius, pirma, HMM algoritmas naudojamas HMM-būsena sekoms skiemens viduje iššifruoti tam, kad jos būtų suskirstytos į tris segmentus. Antra, remiantis pažymėtu skiemeniu, naudojamas vektoriaus kvantavimas (VQ) su „Linde-Buzo-Gray“ algoritmu siekiant pateikti kiekvieno segmento VQ codebooks. Trečia, kiekvieno segmento vektoriaus trukmė yra VQ codebooks užkoduota kaip indeksas, tada kiekvieno galimo kelio tikimybė yra vertinama kaip būtina sąlyga siekiant išanalizuoti pastovumą. Eksperimentiškai parodyta, kad pastovumas įgyjamas tuo atveju, jei skiemuo yra tiksliai tame pačiame žodyje. Aptarus šiuos rezultatus siūloma mokslinių tyrimų kryptis, kad siekiant pagerinti sintetintos kalbos kokybę laiko deformavimo procesas skiemens viduje turi būti TTS sistemoje.DOI: http://dx.doi.org/10.5755/j01.itc.42.2.1745
  • 其他摘要:This work presents a study of Mandarin speech focusing on consistency analysis of the duration parameter within syllables. Identified as a result of inspection of the human pronunciation process, this consistency can be interpreted as a high correlation between the warping curves of the spectrum and the prosody intra a syllable. Through three steps in the procedure of the consistency analysis, the HMM algorithm is used firstly to decode HMM-state sequences within a syllable at the same time as to divide them into three segments. Secondly, based on a designated syllable, the vector quantization (VQ) with the Linde-Buzo-Gray algorithm is employed to train the VQ codebooks of each segment. Thirdly, the duration vector of each segment is encoded as an index by VQ codebooks, and then the probability of each possible path is evaluated as a prerequisite to analyze the consistency. It is demonstrated experimentally that a consistency is definitely acquired in case the syllable is located exactly in the same word. These results offer a research direction that the time warping process intra a syllable must be considered in a TTS system to improve the synthesized speech quality.DOI: http://dx.doi.org/10.5755/j01.itc.42.2.1745
  • 关键词:Consistency analysis; hidden Markov model (HMM); vector quantization (VQ); text-to-speech (TTS); speech synthesis
Loading...
联系我们|关于我们|网站声明
国家哲学社会科学文献中心版权所有