Večina današnjih najboljših sistemov za sintezo govora uporablja metodo združevanja osnovnih enot govora (ang. concatenative synthesis). Namesto črk se uporabljajo manjše osnovne enote besed - fonemi, difoni,. Glasu, ki razločuje pomen besed, pravimo fonem.