Sokan sokfelé hangoztatják, hogy az [i] és az [u] ill. a [j] és a [w] képzése között gyakorlatilag nincs különbség, és csak abban térnek el egymástól, hogy a szótag közepén vagy a szélén állnak-e. Ez a megállapítás azonban nem felel meg a valóságnak, ugyanis van egy igen lényeges képzési különbség köztük.
Ezen állításukat azzal szokták alátámasztani, hogy a hosszabban kitartott [i] ill. [j] hangszínképén, a spektrogramon, nem látszik semmi különbség köztük. Vélhetően úgy gondolják, ha nincs látható különbség a spektrogramon, nincs eltérés a képzésben sem. Rosszul gondolják.
A spektrogram ugyanis – leegyszerűsítve – nem más, mint a hanghullámok egyfajta grafikus megjelenítése, és itt a hangsúly a hanghullámon van. Az ugyan igaz, hogy a hasonló hangzású hangoknak hasonló grafikus lenyomata van, csakhogy attól, hogy két hang hasonlóan hangzik, még lehet a képzési helyük és/vagy módjuk gyökeresen eltérő. Az ezt szemléltető példához nem kell messzire mennünk, mert ahogy arról már esett szó korábban, a brit [ɻ] és az amerikai [ɹ] hangzása meglehetősen hasonló, a képzésük viszont markánsan eltér, ez azonban a spektrogramjaik elemzéséből nem feltétlenül derül ki.
A spektrogram tehát csak egy leképezés, egy lenyomat, ami óhatatlanul információvesztéssel jár ahhoz hasonlóan, mint amikor egy térbeli testet vetítünk egy sík felületre. Gondoljunk csak bele: a feldobáskor a plafonon megpihenő palacsinta ugyanúgy kör alakú foltot hagy, mint ahogy a plafonnak nekidobott vizes gumilabda – mégsem állíthatjuk, hogy a palacsinta és a gumilabda térbeli alakja azonos volna.
Na de akkor mi a különbség köztük?
Abban egyet szoktak érteni, hogy az [i] és az [u] magánhangzó, a [j] és a [w] pedig mássalhangzó. Viszont ha abból a tételből indulunk ki, hogy minden, ami nem magánhangzó, az mássalhangzó, akkor már eleve nem állíthatná senki, hogy a párok tagjai között nincs képzésbeli különbség, hiszen akkor egy magánhangzó és egy mássalhangzó közé kerülne egyenlőségjel, ami meg nem összeegyeztethető az iménti kijelentéssel.
A lényeges különbség nem is annyira a képzési helyük, mint inkább a képzési módjuk között van – de nem a hagyományos értelemben véve.
Azt tudjuk, hogy az egymást követő hangok kiejtése során a beszédképző szervek helyzete folyamatosan változik, azonban hosszabb-rövidebb időtartamokra viszonylag stabil állapotba kerülnek. És itt van a kutya elásva: a képzés dinamikájában!
A magánhangzók ejtésekor ugyanis hosszabb ideig van a nyelv viszonylagos nyugalomban, mint az approximáns [j] ill. [w] esetében. Ez utóbbiak ejtésekor a nyelv az [i] ill. [u] képzési helyénél feljebbről vagy lejjebbről indul, majd ereszkedés ill. emelkedés közben keresztülhalad azok képzési helyén, és még túl is mehet azokon. Persze ez a mozdulat eléggé apró, de érzékelhető és hallható, a spektrogramon viszont nehezen kivehető. Ha pedig hosszasan kitartják e hangokat, akkor épp az őket a magánhangzóktól megkülönböztető dinamikájuktól fosztják meg őket: a [j]-t talán épp az egyébként csak átmeneti [i] pozíciójában nyújtják el. Így rögtön érthető, hogy a spektrogramon miért nem észlelhető köztük a különbség. Mint ahogy a palacsinta és a gumilabda lenyomata közt sem.
Egyetlen mondattal tehát úgy lehetne megragadni a hangpárok közti különbséget, hogy az [i] és az [u] egy-egy stabilabb állapot, míg a [j] és a [w] dinamikus átmenetek. Ez az illékonyság teszi az utóbbiakat mássalhangzóvá.