Advertisement

HNO

pp 1–9 | Cite as

VOTE versus ACLTE: Vergleich zweier Schnarchgeräuschklassifikationen mit Methoden des maschinellen Lernens

  • C. JanottEmail author
  • M. Schmitt
  • C. Heiser
  • W. Hohenhorst
  • M. Herzog
  • M. Carrasco Llatas
  • W. Hemmert
  • B. Schuller
Originalien

Zusammenfassung

Hintergrund

Die akustische Analyse von Schnarchgeräuschen ist eine nichtinvasive Methode für die Diagnose von Entstehungsmechanismen des Schnarchens, die während des natürlichen Schlafs durchgeführt werden kann. Ziel der Arbeit ist die Entwicklung und Bewertung von Klassifikationsschemata für Schnarchgeräusche, die eine möglichst aussagekräftige Diagnoseunterstützung ermöglichen.

Material und Methoden

Basierend auf 2 annotierten Schnarchgeräuschdatenbanken mit unterschiedlicher Klassifikation (s-VOTE – 4 Klassen versus ACLTE – 5 Klassen) wurden identisch aufgebaute maschinelle Klassifikationssysteme trainiert. Der Merkmalsextraktor openSMILE wurde in Kombination mit einer linearen Support-Vektor-Maschine zur Klassifikation eingesetzt.

Ergebnisse

Mit einem ungewichteten Average Recall (UAR) von 55,4 % für das s‑VOTE-Modell und 49,1 % für das ACLTE liegen die Ergebnisse auf ähnlichem Niveau. In beiden Modellen gelingt die beste Differenzierung für Epiglottisschnarchen, während velares und oropharyngeales Schnarchen häufiger verwechselt werden.

Schlussfolgerung

Automatisierte akustische Verfahren können bei der Diagnose von Schlafatmungsstörungen unterstützen. Einschränkungen in der Erkennungsleistung sind u. a. durch die begrenzte Größe der Trainingsdatensätze bedingt.

Schlüsselwörter

Respiratorische Symptome Intrinsische Schlafstörungen Obstruktive Schlafapnoe Datenanalyse Schlafvideoendoskopie 

VOTE versus ACLTE: comparison of two snoring noise classifications using machine learning methods

Abstract

Background

Acoustic snoring sound analysis is a noninvasive method for diagnosis of the mechanical mechanisms causing snoring that can be performed during natural sleep. The objective of this work is development and evaluation of classification schemes for snoring sounds that can provide meaningful diagnostic support.

Materials and methods

Based on two annotated snoring noise databases with different classifications (s-VOTE with four classes versus ACLTE with five classes), identically structured machine classification systems were trained. The feature extractor openSMILE was used in combination with a linear support vector machine for classification.

Results

With an unweighted average recall (UAR) of 55.4% for the s‑VOTE model and 49.1% for the ACLTE, the results are at a similar level. In both models, the best differentiation is achieved for epiglottic snoring, while velar and oropharyngeal snoring are more often confused.

Conclusion

Automated acoustic methods can help diagnose sleep-disordered breathing. A reason for the restricted recognition performance is the limited size of the training datasets.

Keywords

Respiratory signs and symptoms Intrinsic sleep disorders Obstructive sleep apnea Data analysis Drug induced sleep endoscopy 

Notes

Einhaltung ethischer Richtlinien

Interessenkonflikt

C. Janott ist der Erfinder eines patentierten Verfahrens und Systems zur Ermittlung anatomischer Ursachen für die Entstehung von Schnarchgeräuschen (DE102012219128B4). M. Schmitt, C. Heiser, W. Hohenhorst, M. Herzog, M. Carrasco Llatas, W. Hemmert und B. Schuller geben an, dass kein Interessenkonflikt besteht.

Für diesen Beitrag wurden von den Autoren keine Studien an Menschen oder Tieren durchgeführt. Für die aufgeführten Studien gelten die jeweils dort angegebenen ethischen Richtlinien.

Literatur

  1. 1.
    Croft C, Pringle M (1991) Sleep nasendoscopy: A technique of assessment in snoring and obstructive sleep apnoea. Clin Otolaryngol Allied Sci 16(5):504–509CrossRefGoogle Scholar
  2. 2.
    Kent D, Rogers R, Soose R (2015) Drug-induced sedation endoscopy in the evaluation of OSA patients with incomplete oral appliance therapy response. Otolaryngol Head Neck Surg 153(2):302–307CrossRefGoogle Scholar
  3. 3.
    De Vito A, Carrasco Llatas M, Ravesloot MJ, Kotecha B, De Vries N, Hamans E et al (2018) European position paper on drug-induced sleep endoscopy: 2017 Update. Clin Otolaryngol 43(6):1541–1552CrossRefGoogle Scholar
  4. 4.
    Heiser C, Fthenakis P, Hapfelmeier A, Berger S, Hofauer B, Hohenhorst W et al (2017) Drug-induced sleep endoscopy with target-controlled infusion using propofol and monitored depth of sedation to determine treatment strategies in obstructive sleep apnea. Sleep Breath 21(3):737–744CrossRefGoogle Scholar
  5. 5.
    Janott C, Pirsig W, Heiser C (2014) Akustische Analyse von Schnarchgeräuschen. Somnologie 18(2):87–95CrossRefGoogle Scholar
  6. 6.
    Schmitt M, Janott C, Pandit V, Qian K, Heiser C, Hemmert W et al (2016) A bag-of-audiowords approach for snore sounds’ excitation localisation. Proceedings 14. ITG Conference on Speech Communication, IEEE, S 1–5Google Scholar
  7. 7.
    Qian K, Janott C, Zhang Z, Heiser C, Schuller B (2016) Wavelet features for classification of VOTE snore sounds. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2016, S 221–225Google Scholar
  8. 8.
    Janott C, Schuller B, Heiser C (2017) Acoustic information in snoring noises. HNO 65:107–116CrossRefGoogle Scholar
  9. 9.
    Qian K, Janott C, Pandit V, Zhang Z, Heiser C, Hohenhorst W et al (2016) Classification of the Excitation Location of Snore Sounds in the Upper Airway by Acoustic Multi-Feature Analysis. Ieee Trans Biomed Eng.  https://doi.org/10.1109/TBME.2016.2619675 CrossRefPubMedGoogle Scholar
  10. 10.
    Qian K, Janott C, Deng J, Heiser C, Hohenhorst W, Herzog M et al (2017) Snore sound recognition: On wavelets and classifiers from deep nets to kernels. In 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC)Google Scholar
  11. 11.
    Kezirian EJ, Hohenhorst W, Vries N (2011) Drug-induced sleep endoscopy: the VOTE classification. Eur Arch Otorhinolaryngol 268:1233–1236CrossRefGoogle Scholar
  12. 12.
    Schuller B, Steidl S, Batliner A, Bergelson E, Krajewski J, Janott C et al (2017) The INTERSPEECH 2017 Computational Paralinguistics Challenge: Addressee, cold & snoring. Proceedings of INTERSPEECH; 2017; Stockholm, Sweden, S 20–24Google Scholar
  13. 13.
    Janott C, Schmitt M, Zhang Y, Qian K, Pandit V, Zhang Z et al (2018) Snoring classified: The Munich-Passau snore sound corpus. Comput Biol Med 94:106–118CrossRefGoogle Scholar
  14. 14.
    Eyben F, Wöllmer M, Schuller B (2010) Opensmile: The munich versatile and fast open-source audio feature extractor. Proceedings of the 18th ACM International Conference on Multimedia, S 1459–1462Google Scholar
  15. 15.
    Eyben F, Weninger F, Groß F, Schuller B (2013) Recent developments in opensmile, the munich open-source multimedia feature extractor. Proceedings of the 21st ACM International Conference on Multimedia, S 835–838Google Scholar
  16. 16.
    Schuller B, Steidl S, Batliner A, Vinciarelli A, Scherer K, Ringeval F et al (2013) The INTERSPEECH 2013 Computational Paralinguistics Challenge: Social signals, conflict, emotion, autism. IProceedings of INTERSPEECH; 2013; Lyon, S 148–152Google Scholar
  17. 17.
    Schuller B, Steidl S, Batliner A, Epps J, Eyben F, Ringeval F et al (2014) The INTERSPEECH 2014 Computational Paralinguistics Challenge: Cognitive & physical load. Proceedings of INTERSPEECH; 2014; Singapore, S 427–431Google Scholar
  18. 18.
    Schuller B, Steidl S, Batliner A, Hantke S, Hönig F, Orozco-Arroyave JR et al (2015) The INTERSPEECH 2015 Computational Paralinguistics Challenge: Nativeness, Parkinson’s & eating condition. IProceedings of INTERSPEECH; 2015; Dresden, Germany, S 478–482Google Scholar
  19. 19.
    Fan R, Chang K, Hsieh C, Wang X, Lin C (2008) LIBLINEAR: A library for large linear classification. J Mach Learn Res 9:1871–1874Google Scholar
  20. 20.
    Qian K, Janott C, Zhang Z, Deng J, Baird A, Heiser C et al (2018) Teaching machines on snoring: A benchmark on computer audition for snore sound excitation localisation. Arch Acoust 43(3):465–475Google Scholar
  21. 21.
    Fant G (1970) Acoustic theory of speech productionGoogle Scholar
  22. 22.
    Hessel NS, Vries N (2003) Diagnostic work-up of socially unacceptable snoring. II. Sleep endoscopy. Eur Arch Otorhinolaryngol 259:158–161CrossRefGoogle Scholar

Copyright information

© Springer Medizin Verlag GmbH, ein Teil von Springer Nature 2019

Authors and Affiliations

  • C. Janott
    • 1
    Email author
  • M. Schmitt
    • 2
  • C. Heiser
    • 3
  • W. Hohenhorst
    • 4
  • M. Herzog
    • 5
  • M. Carrasco Llatas
    • 6
  • W. Hemmert
    • 1
  • B. Schuller
    • 2
    • 7
  1. 1.Munich School of BioEngineeringTechnische Universität MünchenGarchingDeutschland
  2. 2.ZD.B Lehrstuhl für Embedded Intelligence for Health Care and WellbeingUniversität AugsburgAugsburgDeutschland
  3. 3.Hals-Nasen-Ohrenklinik und Poliklinik, Klinikum rechts der IsarTechnische Universität MünchenMünchenDeutschland
  4. 4.Klinik für HNO-Heilkunde, Kopf- und Hals-ChirurgieAlfried Krupp KrankenhausEssenDeutschland
  5. 5.Klinik für HNO-Krankheiten, Kopf- und HalschirurgieCarl-Thiem-Klinikum CottbusCottbusDeutschland
  6. 6.Servicio de OtorrinolaringologíaHospital Universitario Doctor PesetValenciaSpanien
  7. 7.Department of ComputingImperial College LondonLondonGroßbritannien

Personalised recommendations