首页    期刊浏览 2024年09月21日 星期六
登录注册

文章基本信息

  • 标题:可変長階層 Pitman-Yor 言語モデルを用いたメロディー生成手法の提案
  • 本地全文:下载
  • 作者:白井 亨 ; 谷口 忠大
  • 期刊名称:知能と情報
  • 印刷版ISSN:1347-7986
  • 电子版ISSN:1881-7203
  • 出版年度:2013
  • 卷号:25
  • 期号:6
  • 页码:901-913
  • DOI:10.3156/jsoft.25.901
  • 出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
  • 摘要:

    本稿ではノンパラメトリックベイズモデルに基づく言語モデルである可変長階層 Pitman-Yor 言語モデルを用いたメロディー生成手法を提案する.従来の n-gram モデルを用いたメロディー生成手法ではスパースネスの問題から短い n-gram 文脈長しか扱う事ができず,不自然なメロディーが多く生成されるという問題があった.そこで,本研究では学習データに応じて各単語の n-gram 文脈長を適切に推定する事のできる可変長階層 Pitman-Yor 言語モデルを用いたメロディー生成手法を提案する.本提案手法は柔軟に制約やバイアスを加えながらも,ギブスサンプリングを用いる事で少ない計算量でメロディーを生成する事が可能である.また,ギブスサンプリングを用いる事でインタラクティブ性を容易に確保できる.また,モデルの性質からスパースネスの問題が緩和され,従来のモデルよりも長いフレーズを学習する事が可能であり,さらにメモリ使用量も大幅に減らす事ができる.本稿では提案手法を用いてメロディーの生成を行い,学習データ内の様々な長さのフレーズがつなぎ合わさったようなメロディーが生成される事を示した.また,感性評価実験によって短い n-gram 文脈長しか扱う事のできなかった従来モデルから生成したものよりも自然で滑らかなメロディーが生成されることを示した.

  • 关键词:自動作曲; 確率モデル; ノンパラメトリックベイズ; ギブスサンプリング; 機械学習
国家哲学社会科学文献中心版权所有