Leggi anche..

Indicizzazione e Ricerca

L’INDICIZZAZIONE

- Google pone in maggior risalto i siti residenti su server veloci, poichè le risorse devono essere accessibili rapidamente;

- il Googlebot controlla la data dell’ultima pubblicazione delle pagine, percià è importante che il continuo aggiornamento dei dati;

- Google ama siti semplici, con struttura lineare e tonnellate di contenuti;

- il limite oltre il quale i robot cessano di indicizzare le pagine è 101 KB (codice+testo): ogni pagina più pesante di 101 KB, sarà indicizzata comunque col peso arbitrario di 101 KB;

- quotidianamente sono reindicizzati circa 3 milioni di siti considerati rilevanti;

- Google contine nella propria memoria cache una copia di ogni pagina indicizzata, così come è stata rilevata dagli spider, e questa è la versione della pagina (solo codice html) che viene considerata e valutata.

LA RICERCA

- Google ricerca di default nel suo archivio le parole in maniera booleana, ovvero come se fossero collegate implicitamente dall’operatore AND; se una pagina contiene tutte le parole chiave sarà posizionata più in alto nell’elenco dei risultati;

- gli operatori booleani supportati sono +, -, AND, OR (introdotto nel 2000, si usa solo maiuscolo); non supporta le ricerche con NOT, oppure la possibilità di porre i termini in gerarchia ();

- non fa differenza tra maiuscole e minuscole (case sensitivity);

- ignora le Stop Words, cioè i termini che servono a legare più parole chiave (quel, il, the, that, why..); per effettuare una ricerca con stop words, si può usare un + tra le parole inserite;

- le frasi esatte generalmente andrebbero scritte tra ” “, ma su Google questa funzione è inutile poichè già di default il motore mette nelle prime posizioni le pagine che includono la frase esatta ricercata;

- le parole tronche non possono essere cercate; un singolare sarà sempre diverso da un plurale, tuttavia per ampliare la ricerca di un termine all’interno di una frase, si può inserire il simbolo * a sostituzione di una parola nella frase cercata; l’asterisco funziona da wild card, una specie di jolly, come nell’esempio seguente: “Il * degli anelli” (ma NON “Il sign* degli anelli”!);

- Field Search: Google consente la ricerca legata ad un preciso URL, premettendo i seguenti operatori:

site per cercare all’interno di un sito;

allintitle per trovare pagine che hanno il termine cercato all’interno del tag html </code>;</p> <p><em>allinurl</em> per trovare pagine che hanno il termine cercato nell’ Url (host name, path o nomi file);</p> <p><em>filetype</em>, posto dopo la parola chiave, serve a cercare documenti nel formato voluto (pdf, doc..etc);</p> <p><em>link</em> per trovare pagine che contengono links all’URL indicato.</p> </div> </div> <hr /> </div> <div id="sidebar"> <div class="featurebox"> <h3>Articoli Recenti </h3> <ul id="nav-secondary"></ul> </div> <div class="featurebox"> <h3>Commenti Recenti </h3> <ul id="nav-secondary"></ul> </div> </div> </div> </div> <hr /> <div id="footer"> <!--Creative Commons License--><a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/2.5/it/"><img alt="Creative Commons License" border="0" src="http://creativecommons.org/images/public/somerights20.png"/></a><br/> This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/2.5/it/">Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License</a><br /> "Attribuzione-Non commerciale-Condividi allo stesso modo 2.5" <p>- Autori - <a href="http://pietromalerba.it" target="_blank">Pietro Malerba</a> e <a href="http://www.googlisti.com/contatti" target="_blank">Silvia Marinelli</a> -</p> <p>Questo sito non rappresenta una testata giornalistica, in quanto non ha alcuna cadenza periodica per l'aggiornamento e non è da ritenersi un prodotto editoriale sottoposto alla disciplina di cui all'art. 1, comma III della L. n. 62 del 7.03.2001.</p> <!--<p><strong> I marchi e nomi citati appartengono ai rispettivi proprietari.</strong> <br /> Gli autori declinano ogni responsabilità per quanto riguarda i siti ai quali è possibile accedere tramite i collegamenti posti all'interno del sito stesso, <br />forniti come semplice servizio agli utenti della rete. Il fatto che <a href="http://googlisti.com">Googlisti.com</a> fornisca questi collegamenti non implica l'approvazione dei siti stessi, <br /> sulla cui qualità, contenuti e grafica è declinata ogni responsabilità; né la riproduzione di articoli altrui sottintende la condivisione delle opinioni espresse <br /> dagli autori medesimi. Le foto presenti su <a href="http://googlisti.com">Googlisti.com</a> sono state in gran parte prese da internet, e quindi di pubblico dominio; <br /> ove possibile ne viene citata la fonte. </p>--> <p>Il sito <a href="http://googlisti.com">Googlisti.com </a> <strong> non è in alcun modo affiliato o collegato direttamente</strong> con Google™. </p> <!--<p>- CMS Wordpress - Layout basato sui template di <a href="http://mollio.org" target="_blank">Mollio</a> - </p> --> <p> </p> <!-- <p><a href="http://validator.w3.org/check?uri=referer"><img src="http://www.w3.org/Icons/valid-xhtml10" alt="Valid XHTML 1.0 Transitional" height="31" width="88" /></a><a href="http://jigsaw.w3.org/css-validator/validator?uri=http://www.googlisti.com"><img style="border:0;width:88px;height:31px" src="http://jigsaw.w3.org/css-validator/images/vcss" alt="Valid CSS!" /></a> </p> --> </div> <script type="text/javascript"> lloogg_clientid = "2081020841cf0f45"; </script> <script type="text/javascript" src="http://lloogg.com/l.js?c=2081020841cf0f45"> </script> <script type="text/javascript"> var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script> <script type="text/javascript"> var pageTracker = _gat._getTracker("UA-5116637-9"); pageTracker._trackPageview(); </script> </body> </html>