Ker nas oznake HTML ne zanimajo in se vanje pravzaprav ne smemo niti vtikati, jih izločimo. Seveda pa jih moramo shraniti za poznejšo rekonstrukcijo. Pomaga nam ustrezen regularni izraz in metoda match(), ki vse zadetke regularnega izraza vrne v obliki polja.