Med zapisi slik najdemo tudi datoteke PDF, ki lahko rabijo tudi kot vnosna datoteka, iz katere zajemamo besedilo.
Naslednji korak je določanje delov slike, na katerih je besedilo. Pri revijah je to lahko v stolpcih, celo prelivajoče se okrog predmetov nepravilnih oblik.