文章基本信息
- 标题:Phoneme Positioning Using Wavelet Analysis and SIFT Features
- 其他标题:Phoneme Positioning Using Wavelet Analysis and SIFT Features
- 本地全文:下载
- 作者:Shinya MATSUSHITA ; Toshiaki TAKANO ; Katsuko TOMOTSUGU 等
- 期刊名称:知能と情報
- 印刷版ISSN:1347-7986
- 电子版ISSN:1881-7203
- 出版年度:2020
- 卷号:32
- 期号:5
- 页码:873-876
- DOI:10.3156/jsoft.32.5_873
- 出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
- 摘要:「少数言語の耳を頼りにした書き起こし」という手作業が,言語学者らによって行われている.この手作業は,膨大な時間と複雑な音声表記を必要とする.そこで本研究ではこの作業をサポートするようなシステムの構築を目指す.これまでの実験では,MFCCを使用して「異なる言語間における音のマッチング」を調査したが,精度は低く,精度向上のために前処理が必要と考えられた.そこで本論では,Wavelet解析とSIFT特徴量を用いた前処理に取り組んだ.
- 关键词:音声処理;音韻情報;audio processing;voice recognition