Key points are not available for this paper at this time.
Si deux voyelles avec différentes fréquences fondamentales (fo) sont présentées simultanément et monauralement, les auditeurs entendent souvent deux locuteurs produisant des voyelles différentes sur des hauteurs différentes. Cet article décrit l'évaluation de quatre modèles computationnels des processus auditifs et perceptifs qui peuvent sous-tendre cette capacité. Chaque modèle implique quatre étapes : (i) analyse de fréquence à l'aide d'une banque de filtres "auditifs", (ii) détermination des hauteurs présentes dans le stimulus, (iii) séparation des sources de parole concurrentes en regroupant l'énergie associée à chaque hauteur pour créer deux motifs spectraux dérivés, et (iv) classification des motifs spectraux dérivés pour prédire les probabilités des réponses d'identification de voyelles des auditeurs. Les modèles "place" effectuent les opérations de détermination de la hauteur et de séparation spectrale en analysant la distribution des niveaux rms à travers les canaux de la banque de filtres. Les modèles "place-time" effectuent ces opérations en analysant les périodicités dans les formes d'onde de chaque canal. Dans leurs versions "linéaires", les modèles place et place-time opèrent directement sur les formes d'onde émergentes des filtres. Dans leurs versions "non linéaires", des opérations analogues sont appliquées à la sortie d'une étape supplémentaire qui applique une non-linéarité compressive aux formes d'onde filtrées. Comparé aux trois autres modèles, le modèle non linéaire place-time fournit les estimations les plus précises des fo des paires de voyelles synthétiques concurrentes et se rapproche le plus de la prédiction des réponses d'identification des auditeurs à de tels stimuli. Bien que le modèle présente plusieurs limitations, les résultats sont compatibles avec l'idée qu'une analyse place-time est utilisée pour séparer les sources sonores concurrentes.
Assmann et al. (Mer,) ont étudié cette question.