Välkommen till

en tur i fonetikens marker

där vi intresserar oss för samspelet mellan

språkliga och utomspråkliga fenomen i talet

Din guide heter
Hartmut Traunmüller

För att kunna tillgodogöra sig den här turen krävs en utrustning som medger avlyssning av ljudfiler med hörlurar eller en någorlunda bra högtalare.

Turen går genom följande sidor:

  1. Grundtonen
  2. Formanterna och spektrogram
  3. Svenska vokaler
  4. Språklig och utomspråklig variation i tal
  5. Manipulation av talares ålder och kön . . . (Speaker age and sex manipulations)
  6. Grundtonens betydelse för varseblivningen av vokaler . . . (The role of F0 in vowel perception )
  7. Modulationsteorin . . . (The Modulation Theory of Speech)
  8. Nolla-halloneffekten
  9. Kan vi lita på våra öron?
  10. Besläktade presentationer på nätet


Grundtonen


De flesta talljud frambringas med svängande stämläppar. Stämläpparnas svängningsfrekvens, som brukar betecknas med F0, varieras i tal för att markera flera slags skillnader, till exempel den mellan ett påstående och en fråga, som i de här exemplen:

Svar på frågan "Var bor du numera?":   I Uddevalla.

Reaktion på påståendet "Dom sa att det hade varit jordbävning där":   I Uddevalla?!

Här föreligger också skillnader i andra avseenden, förutom dem hos F0. Dessa gör att vi i det andra exemplet inte bara hör en fråga, utan också att talaren uttrycker överraskning.

I svenskan har vi också skillnaden mellan akut och grav accent, som i anden (fågeln) att skiljas från anden (i flaskan), som i huvudsak markeras med F0.

Grundtonskurvor: akut - grav "han släppte ut anden"   Lyssna

Språk som utnyttjar tonhöjd för att skilja mellan ord brukar betecknas som "tonspråk". I kinesiskan utnyttjas tonhöjd i mycket större utsträckning än i svenskan. Den kinesiske lingvisten Zhao Yuanren (Yuen Ren Chao) komponerade flera berättelser där alla orden är likadana, bortsett från tonen. Här är en av dem:

Qi2 Qi2 qi1 qi1. Qi2 qi1 qi4 qi1 qi4. Qi2 Qi2 qi4. Qi4 qi2 qi1 qi1. Qi2 qi2 qi3. Qi1 qi1 qi4. Qi3 qi2 qi1 Qi2. Qi2 Qi2 qi1 qi1. Qi4 qi4 qi1 Qi2.   Lyssna

Översättning: Gamle Tji (som var i 60-årsåldern och bodde i Tji) hade sju hustrur. Hans hustrur kastade bort hans lackgods. Gamle Tji blev arg, övergav sina sju hustrur och red iväg på en enhörning. De sju hustrurna smågrät och bad honom att stanna i Tji. Gamle Tji övergav sorgset sin vrede och stannade i Tji.

F0 varierar inte bara på grund av språkliga faktorer utan även i hög grad på grund av sådana utomspråkliga faktorer som talarens ålder och kön. Hos kvinnor ligger ju grundtonen nästan en oktav högre än hos män och hos småbarn ligger den ännu högre. Grundtonen varierar också med talstyrkan - när vi höjer rösten så höjer vi normalt också F0.

Grundtonskurvor: man - kvinna   Lyssna

Grundtonens frekvens anges ofta i Hz, dvs. antal svängningar per sekund. Det har dock vissa fördelar att i stället använda ett logaritmiskt mått, som halvtoner. Grundtonskurvorna ser då tämligen likadana ut för män och kvinnor, som i vårt exempel. Om man använder en Hz-skala, ser det ut som om grundtonen svängde mycket mer hos kvinnor än hos män, och med grundtonens periodtid förhåller det sig tvärtom.

Fastän grundtonen utgör en mycket framträdande egenskap i talet är den inte oumbärlig för kommunikationen. I viskat tal finns ingen F0 och vi klarar ändå såväl att förstå vad som sägs som att skilja manliga från kvinnliga talare - dock inte riktigt lika bra som i vanligt tal.


Formanterna och spektrogram


Det ljud som alstras av stämläpparna är sammansatt av många deltoner (sinustoner) vars frekvenser är heltalsmultipler av F0. På sin väg genom ansatsröret förstärks deltonerna i vissa frekvensområden genom resonans. Ansatsrörets resonanser brukar kallas formanter och numreras efter sitt frekvensläge i stigande ordning: F1, F2, F3, osv.

När vi frambringar en neutral vokal, typ tvekljud, liknar ansatsrörets resonansegenskaper dem hos ett rör som är slutet i ena ändan och öppet i den andra. Om ett sådant rör är lika långt som ansatsröret hos en vuxen man, så har det resonanser vid ungefär 500, 1500, 2500, 3500 Hz, osv. Hos kvinnor och barn är ansatsröret kortare, och då får man högre värden eftersom resonansernas våglängder är proportionella mot rörets längd, och frekvensen är lika med ljudhastigheten delad med våglängden. Om rörets tvärsnittsyta inte är detsamma över hela dess längd, så får man andra värden. När vi talar så deformerar vi ansatsröret, och därmed ändrar sig formantfrekvenserna. Det finns ett nära, men inte särskilt enkelt samband mellan formanternas frekvenslägen och var längs ansatsröret det är särskilt trångt.

För att studera formanterna och andra egenskaper hos talsignaler använder man sig ofta av ljudspektrogram. I ett sådant spektrogram representerar den horisontala axeln tid och den vertikala frekvens. En tredje dimension, amplitud eller ljudnivå, representeras av svärtningsgraden. När man gör ett spektrogram så kan man välja olika grader av noggrannhet i frekvensupplösningen. Denna kan anges som en bandbredd i Hz. Om man väljer en bandbredd som är mindre än F0, så framträder deltonerna som smala mörka band i spektrogrammet. Om man väljer en större bandbredd, så ser man inte längre deltonerna, utan endast de bredare mörka banden som föreställer formanterna. I stället för deltonerna kan man då se glottispulserna som vertikala streck, eftersom upplösningen i tidsled då är tillräckligt stor för att de ska synas. Upplösningen i tidsled är nämligen omvänt proportionell mot upplösningen i frekvensled.

Här nedan visas talvågen samt ett smalbandigt (60 Hz) och ett bredbandigt (240Hz) spektrogram på ordet "sonatin". Frekvensskalan sträcker sig här från 0 till 5 kHz, och tiden har angivits i sekunder. Klicka på bilden för att lyssna.

Spektrogram

Hos tonlösa frikativor och andra ljudsegment som inte produceras med svängande stämläppar ser man förstås varken glottispulser eller deltoner, utan en grusliknande struktur präglad av slumpen. En formantstruktur finns också i dessa talljud, hos vilka det mesta av energin finns vid höga frekvenser. Hos tonande segment finns däremot det mesta vid låga. För att kunna se deras fromantstruktur bättre brukar man ofta framhäva de höga frekvenserna innan man gör spektrogram. Så har också skett i det här exemplet.

I det här spektrogrammet kan man se att ett [t] - i likhet med de andra tonlösa klusilerna som [p] och [k] - till största delen består av tystnad, följd av en abrupt "explosion" och ett aspirationsbrus. Det senare brukar vara mest utpräglat i början på betonade stavelser, som i det här exemplet. Det kan vara förbryllande att det tysta intervallet är så långt. Så låter det inte. På grund av vissa egenskaper hos vår hörsel hör vi slutet på ett ljud, vilket som helst, med en viss fördröjning. På så sätt blir det mesta av sådana pauser 'ifyllt'. Något annat som kan vara förvånande är den långa durationen hos det finala [n]-et. Den har sin grund i den allmänna finala förlängningen av talljud, som förekommer i många språk, och som också har sin motsvarighet i västerländsk musik. Fenomenet yttrar sig på samma sätt som i svenskan även i engelskan och tyskan, men det är mindre påtagligt i danska och finska.


nästa sida - nästa sida - nästa sida

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Det var ju meningen att Du skulle klicka på "nästa sida" här uppe,
annars missar Du allt det roliga som finns att uppleva på den här turen.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.


Det här är sista sidan i "En tur i fonetikens marker - språkliga och utomspråkliga fenomen i talet". Jag tackar för besöket, som jag hoppas har varit stimulerande.

Hartmut Traunmüller

Besläktade presentationer på nätet


Åter till turens början

H. Traunmüller | Avd. för fonetik | Inst. för lingvistik | Stockholms universitet


Senast ändrad i november 1997
Litet tillägg i maj 2002