Skip to main content
  • 2495 Accesses

Auszug

Die erste Aufgabe zur Spracherkennung ist die Detektion von Sprache. Es gilt, aus dem kontinuierlichen Aufnahmesignal zu erkennen, wann genau eine Spracheingabe beginnt und endet. Übliche Verfahren basieren auf der Lautstärke des Signals. Wenn man davon ausgeht, dass sich die Spracheingabe deutlich vom Hintergrundgeräusch abhebt, lassen sich an Hand der Stärke des Signals s(t) die Grenzen der Äußerung feststellen. Als Maß für die Stärke berechnet man über kurze Signalabschnitte (typisch ca. 10 ms) die Energie als Summe der Quadrate:

$$ e = \sum\limits_{t = t_a }^{t_e } {s(t)^2 .} $$
(4.1)

Zur besseren Vergleichbarkeit kann man die logarithmierten Werte

$$ e_l = \log _{10} e $$
(4.2)

. Bild 4.1 zeigt für eine Äußerung den Verlauf der so berechneten Werte el. In diesem Beispiel sind gut die Grenzen des Wortes zu erkennen. Zur Sprachdetektion werden die berechneten Energiewerte mit geeigneten Schwellen verglichen. Liegt der Wert oberhalb der Schwelle, wird auf Sprache entschieden.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 39.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 44.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Rights and permissions

Reprints and permissions

Copyright information

© 2006 Friedr. Vieweg & Sohn Verlag ∣ GWV Fachverlage GmbH, Wiesbaden

About this chapter

Cite this chapter

(2006). Vorverarbeitung. In: Grundkurs Spracherkennung. Vieweg. https://doi.org/10.1007/978-3-8348-9113-6_4

Download citation

Publish with us

Policies and ethics