Advertisement

The Algorithms of Automation of the Process of Creating Acoustic Units Databases in the Polish Speech Synthesis

  • Janusz RafałkoEmail author
Conference paper
Part of the Advances in Intelligent Systems and Computing book series (AISC, volume 401)

Abstract

This paper presents the new approach of creating the database of acoustic units in concatenative TTS synthesis. Nowadays databases like this are created manually, which is very time-consuming and takes at least several months of work. Creation such base in automatic way shortens this time to hours. One of the next problem in the concatenative synthesis is the problem of reproduction any text using a voice and a way of speaking of particular man. Presented algorithms allow to create the allophone units database of particular man after receiving a sample of his voice and as a result synthesizer speaking with exactly this voice.

Keywords

Speech Signal Speech Synthesis Natural Speech Basic Tone Signal Frame 
These keywords were added by machine and not by the authors. This process is experimental and the keywords may be updated as the learning algorithm improves.

References

  1. 1.
    Dutoit, T.: An Introduction to text-to-speech synthesis. Kluwer Academic Publishers, Dordrecht (1997)Google Scholar
  2. 2.
    Taylor, P.: Text-to-speech synthesis. Cambridge University Press, Cambridge (2009)Google Scholar
  3. 3.
    Van Santen, J., Sproat, R., Olive, J., Hirshberg, J.: Progress in speech synthesis. Springer, New York (1997)Google Scholar
  4. 4.
    Szpilewski, E., Piórkowska, B., Rafałko, J., Lobanov, B., Kiselov, V., Tsirulnik, L.: Polish TTS in multi-voice slavonic languages speech synthesis system. In: SPECOM’2004 Proceedings, 9th International Conference Speech and Computer, pp. 565–570. Saint-Petersburg, Russia (2004)Google Scholar
  5. 5.
    Jassem, W.: Podstawy fonetyki akustycznej, wyd. PWN, Warszawa (1973)Google Scholar
  6. 6.
    Lobanov, B., Piórkowska, B., Rafałko, J., Cyrulnik, L.: Peaлизaция мeжъязыкoвыx paзличий интoнaции зaвиepшённocти и нeзaвиepшённocти в cинтeзaтope pyccкoй и пoлcкoй peчи пo тeкcтy. In: Computational Linguistics and Intellectual Technologies, International Conference Dialogue’2005 Proceedings, pp. 356–362. Zvenigorod, Russia (2005)Google Scholar
  7. 7.
    Matoušek, J.: Building a new czech text-to-speech system using triphonebased speech units. In: Text, Speech and Dialog, Proceedings of the 3rd International Workshop TSD’2000, pp. 223–228. Czech Republic, Brno (2000)Google Scholar
  8. 8.
    Piórkowska, B., Popowski, K., Rafałko, J., Szpilewski, E.: Polish language speech synthesis basis on text information. New trends in audio and video, vol. I, pp. 507–526. Rozprawy Naukowe Nr 134, Białystok (2006)Google Scholar
  9. 9.
    Skrelin, P.: Allophone-based concatenative speech synthesis system for Russian. In: Text, Speech and Dialog, Proceedings of the 2nd International Workshop TSD’99, pp. 156–159. Czech Republic, Pilsen (1999)Google Scholar
  10. 10.
    Brachmański, S.: VoIP—ocena jakości transmisji mowy metodą ACR i DCR. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, nr 8–9, 424–427 (2003)Google Scholar
  11. 11.
    Janicki, A., Księżak, B., Kijewski, J., Kula, S.: Badanie jakości sygnału mowy w telefonii internetowej z wykorzystaniem zdań nieprzewidywalnych semantycznie. KSTiT 2006, Bydgoszcz (2006)Google Scholar
  12. 12.
    Trzaskowska, M.J., Mucha, B.: Metody obiektywnej oceny jakości usługi głosowej QoS w sieciach łączności elektronicznej. w Metody obiektywnej oceny jakości usługi głosowej QoS w sieciach łączności elektronicznej oraz urządzenia do takiej oceny i do badania dostępności usług poprzez numery alarmowe—etap 1, załącznik “X”, Instytut Łączności, Państwowy Instytut Badawczy, Warszawa (2006)Google Scholar
  13. 13.
    ITU-T Recommendation P.800.: Method for subjective determination of transmission quality (1996)Google Scholar
  14. 14.
    PN-90/T-05100.: Analogowe łańcuchy telefoniczne. Wymagania i metody pomiaru wyrazistości logatomowej. Warszawa (1993)Google Scholar

Copyright information

© Springer International Publishing Switzerland 2016

Authors and Affiliations

  1. 1.Faculty of Mathematics and Information ScienceWarsaw University of TechnologyWarszawaPoland

Personalised recommendations