Grundtonens betydelse för perceptionen av vokaler

Hartmut Traunmüller


I tal kan man urskilja tre typer av kvalitet med olika funktion:


Språklig fonetisk kvalitet - uppbär den konventionella språkliga informationen - utgör skillnaden mellan olika talljud. Exempel: [i] i motsats till [e].

Expressiv kvalitet - uppbär paralingvistisk information - tjänar grundläggande och primitiva kommunikativa syften. Exempel: Variation i talstyrka.

Organisk kvalitet - reflekterar storleksförhållanden hos talorganet - Exempel: 7 år i motsats till 12.


Den här demonstrationen belyser betydelsen hos grundtonens frekvens F0 för perceptionen av dessa olika kvaliteter hos vokaler. Demonstrationen består av ett flertal serier syntetiska vokaler vars formantfrekvenser och F0 har varierats systematiskt.

Den första serien består av sex vokaler som skiljer sig från varandra endast i första formantens frekvensläge F1. Detta höjs successivt i steg på ett kritiskt band (1 bark, ca. 100 Hz).


                        __
                    __    
                __         
            __            
        __                 
F1  __                    
F0  __  __  __  __  __  __       Lyssna

De här vokalerna brukar höras som mer och mer öppna, från [i] till [æ], fastän alla högre formanter har ett oförändrat frekvensläge, som hos ett kvinnligt [i]. Detta visar att F1 är av större betydelse än de högre formanterna för perceptionen av öppningsgrad hos främre vokaler.

Den andra serien skiljer sig från den första därigenom att även F0 successivt höjs i steg på 1 bark, så att avståndet mellan F1 och F0 förblir oförändrat i bark.


                        __
                    __  __
                __  __   
            __  __       
        __  __             
F1  __  __                
F0  __                            Lyssna

I denna serie hör de flesta lyssnare endast en marginell ökning av vokalernas öppningsgrad - i varje fall klart mindre än i den första serien. I stället hörs en successiv förändring i expressiv kvalitet. Talarens röst verkar mer och mer spänd.

I den tredje serien behåller samtliga formanter ett oförändrat frekvensläge medan F0 successivt sänks i steg på 1 bark.


F1  __  __  __  __  __  __
F0  __           
        __        
            __         
                __   
                    __    
                        __       Lyssna


De här vokalerna brukar höras som mer och mer öppna, medan talarens röst samtidigt blir mindre och mindre spänd. Därav kan vi sluta att den dominerande ledtråden till vokalernas öppningsgrad här återfinns i det relativa läget av F1 i förhållande till F0 och inte i F1s absoluta läge.

Den fjärde serien innehåller de första fyra vokalerna ur den andra serien, som här presenteras som bakgrund till en femte serie, i vilken inte bara F1, utan alla formanterna tillsammans successivt höjs, i steg på 1 bark, medan F0 också höjs i samma mån.

Lyssna till serierna 4 och 5

Medan den språkliga kvaliteten hos vokalerna i den femte serien är ungefär densamma som i den fjärde, så hör man här en förändring i organisk kvalitet, som om vokalerna hade producerats av allt yngre talare. Förändringen i expressiv röstkvalitet som hörs så tydligt i den fjärde serien är mycket mindre framträdande i den femte.

Man skulle kunna tro att den språkliga kvaliteten hos vokaler generellt är given av avstånden (i bark) mellan de framträdande topparna i deras spektra, som formas av formanterna och av grundtonen. Detta är dock svårförenligt med vad lyssnare brukar höra i serie två. I denna minskar ju avståndet mellan F2 och F1 successivt, och då borde vokalerna enligt denna hypotes höras som mer och mer rundade, men lyssnare visar bara en svag tendens i den riktningen. Observationerna är bättre förenliga med en modifierad version av denna hypotes, enligt vilken den perceptuella vikten hos avstånden mellan spektrala toppar avtar med ökande avstånd. Den blir då betydligt lägre hos främre vokaler än hos bakre, hos vilka avståndet mellan F2 och F1 är betydligt mindre.

(Dessutom måste man räkna med att en 'virtuell topp' kan fungera som F0-märke, vilket märks när man filtrerar bort första deltonen. Lyssnare verkar också relatera F1 till ett slags 'basvärde' för F0 snarare än till dess momentanvärde.)


nästa sida - nästa sida - nästa sida

Fonetik vid Stockholms universitet | Hartmut Traunmüller | En tur i fonetikens marker

Senast modifierat i maj 1997