Computer Vision :)

  • 홈
  • 태그
  • 방명록

WaveGlow 1

[정리] Neural Vocoder에 대해 알아보자

이전 글에서는 Text-to-Speech(TTS)의 연구 동향에 대해 알아보았다. 이번 글에서는 TTS에서 Vocoder 부분에 대해 좀 더 자세히 알아보고자 한다. (HiFi-GAN [1] 논문의 introduction 내용을 주로 참고하였음) Vocoder의 역할 Neural Speech Synthesis는 크게 2-stage pipeline으로 이루어져 있다. Text로부터 Mel-spectrogram이나 linguistic feature와 같은 low resolution intermediate representation을 예측 Low resolution representation으로부터 raw waveform audio를 예측 여기서 Vocoder의 역할은 2번째 stage를 수행하는 것이다. 위..

Deep Learning/Speech Synthesis 2021.03.03
1
더보기
  • 분류 전체보기 (27)
    • Deep Learning (21)
      • Object Detection (4)
      • Pytorch (7)
      • Speech Synthesis (4)
      • OCR (6)
    • Algorithm (1)
      • 자료구조 (1)
    • Programming (2)
      • Go (2)
    • Machine Learning (3)
      • Theory (3)

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바