Indexeren
Indexeren, het proces dat volgt op het bezoek van een crawler of spider bij een website, waarbij het bestand (na conversie) in de index worden geplaatst. Bij het indexeren van een bestand worden een aantal processen doorlopen zoals het extraheren van metadata, het berekenen van checksum(s) (ten behoeve van het ontdubbelen) het bepalen van een document vector (ten behoeve van de 'resultaat clusters' en het zoeken naar 'vergelijkbare documenten') en een aantal taalkundige processen zoals zoeken met lemma's (grammaticale vervoegingen van woorden), synoniemen (woorden met dezelfde betekenis), homoniemen (woorden die klinken als het originele woord) en spelling controle (sterk gelijkende matches).