Indexation Audio: un état de I’art

State of the art in audio indexing

À l’heure actuelle, nous disposons d’une quantité d’informations audio à la fois importante et grandissante par le biais des bases de données publiques ou privées (sites Internet, cédéroms, ina, sacem) et des contenus télé et radiodiffusés. La description par mots- clés, jusqu’ici utilisée, est peu adaptée à la richesse de cette information, puisqu’elle entraîne une indexation subjective et coûteuse (è cause de l’importante intervention humaine). Le domaine de l’indexation audio tente done de répondre au besoin d’outils (semi- )automatiques de description de contenus audio afin d’en améliorer l’accès. Cet article propose un état- de- l’art de l’indexation audio, è travers la description de techniques liées à la discrimination en classes (plus ou moins grossières), ainsi qu’à la présentation des analyses spécifiques aux deux grandes classes que sont la parole et la musique (cette dernière etant largement privilégiée). Des comparatifs concernant les performances des systèmes existants y sont présentés, ainsi que l’adresse de sites Internet proposant des démonstrations.


Nowadays, an important and growing quantity of audio information is available by means of public or private databases (Internet sites, CD- ROMs, french Audiovisual National Institute: ina, musical copyright protection associations such as sacem) and TV/radio broadcasts. Keyword description, used until now, is poorly adapted to this information, because of its subjectiveness and cost (both due to substantial human intervention). So researches in audio indexation aim to fulfil the need of (semi- )automatic tools for audio content description, in order to improve the access to audio documents. This article reviews state- of- the- art audio indexation, by describing techniques related to the discrimination of (more or less broad) classes, and by reviewing specific analyses applied to the most considered classes : speech and music (with more focus on the latter). Comparisons between the performances of existing systems are presented, as well as the addresses of the Internet sites offering demonstrations.

Carré, M., Philippe, P. Indexation Audio: un état de I’art. Ann. Télécommun. 55, 507–525 (2000).

Mots clés

  • Etat actuel technique
  • Indexation
  • Base donnée multimedia
  • Parole
  • Musique
  • Extraction forme
  • Classification automatique
  • Analyse signal
  • Reconnaissance son

Key words

  • State of the art
  • Indexing
  • Multimedia data base
  • Speech
  • Music
  • Pattern extraction
  • Automatic classification
  • Signal analysis
  • Sound recognition