Indicizzazione e Ricerca
L’INDICIZZAZIONE
- Google pone in maggior risalto i siti residenti su server veloci, poichè le risorse devono essere accessibili rapidamente;
- il Googlebot controlla la data dell’ultima pubblicazione delle pagine, percià è importante che il continuo aggiornamento dei dati;
- Google ama siti semplici, con struttura lineare e tonnellate di contenuti;
- il limite oltre il quale i robot cessano di indicizzare le pagine è 101 KB (codice+testo): ogni pagina più pesante di 101 KB, sarà indicizzata comunque col peso arbitrario di 101 KB;
- quotidianamente sono reindicizzati circa 3 milioni di siti considerati rilevanti;
- Google contine nella propria memoria cache una copia di ogni pagina indicizzata, così come è stata rilevata dagli spider, e questa è la versione della pagina (solo codice html) che viene considerata e valutata.
LA RICERCA
- Google ricerca di default nel suo archivio le parole in maniera booleana, ovvero come se fossero collegate implicitamente dall’operatore AND; se una pagina contiene tutte le parole chiave sarà posizionata più in alto nell’elenco dei risultati;
- gli operatori booleani supportati sono +, -, AND, OR (introdotto nel 2000, si usa solo maiuscolo); non supporta le ricerche con NOT, oppure la possibilità di porre i termini in gerarchia ();
- non fa differenza tra maiuscole e minuscole (case sensitivity);
- ignora le Stop Words, cioè i termini che servono a legare più parole chiave (quel, il, the, that, why..); per effettuare una ricerca con stop words, si può usare un + tra le parole inserite;
- le frasi esatte generalmente andrebbero scritte tra ” “, ma su Google questa funzione è inutile poichè già di default il motore mette nelle prime posizioni le pagine che includono la frase esatta ricercata;
- le parole tronche non possono essere cercate; un singolare sarà sempre diverso da un plurale, tuttavia per ampliare la ricerca di un termine all’interno di una frase, si può inserire il simbolo * a sostituzione di una parola nella frase cercata; l’asterisco funziona da wild card, una specie di jolly, come nell’esempio seguente: “Il * degli anelli” (ma NON “Il sign* degli anelli”!);
- Field Search: Google consente la ricerca legata ad un preciso URL, premettendo i seguenti operatori:
site per cercare all’interno di un sito;
allintitle per trovare pagine che hanno il termine cercato all’interno del tag html ;
allinurl per trovare pagine che hanno il termine cercato nell’ Url (host name, path o nomi file);
filetype, posto dopo la parola chiave, serve a cercare documenti nel formato voluto (pdf, doc..etc);
link per trovare pagine che contengono links all’URL indicato.

