V svoji globlji strukturi je esperanto aglutinski jezik (kakor recimo turščina ali ugrofinski jeziki), kar pomeni, da je mogoče tvoriti besede iz nespremenljivih besednih elementov, ki pri tem ohranjajo izvirni pomen: korena, predpone in pripone. Besede je seveda mogoče tudi sestavljati s kombinacijo več korenov in več afiksov. Povprečno je mogoče iz enega znanega korena ob upoštevanju besedotvornih pravil sestaviti kakih 20 besed.