Cómo
funciona ALTAVISTA.
http://www.codigovisual.net/buscadores/content.asp
El Índice de AltaVista se construye enviando "espías" (programas robot) que capturan texto y lo almacenan. En este proceso no interviene ninguna acción humana ni juicio. Lo que ven es lo que almacenan.
El principal espía, "Scooter", recoge miles de peticiones http simultáneamente como si fueran miles de usuarios picando texto, almacenándolo y enviándolo a las máquinas indexadoras para que el texto pueda ser clasificado. "Scooter" tiene "primos", otros espías que realizan tareas específica para ayudar a mantener el índice actualizado, cómo, por ejemplo, comprobar vínculos rotos -páginas que se han movido o borrado y no serán indexadas.
¿Cómo sabe Scooter dónde tiene que ir? Sigue los vínculos que se encuentra en las páginas que visita. Cuando una página es capturada, los vínculos desde esa página se almacenan en una lista. En teoría, no es necesario describir a AltaVista su sitio: el resto del sitio se encontrará automáticamente. En un día normal, Scooter y sus primos visitan más de 10 millones de páginas.
Aún así, éste un juego aleatorio con cientos de miles de Página. Aquellas páginas hacia las que apunten vínculos desde otros sitios serán encontradas frecuentemente por Scooter. Las páginas con pocos vínculos serán encontradas en una semana, un mes, seis meses o incluso más tarde. Las páginas sin vínculos no serán encontradas nunca.
Añadir y eliminar URL’S.
Al añadir su página al índice de Altavista, un espía visitará automáticamente esa página y la llevará a las máquinas de búsqueda para añadirla al índice.
Tenga en cuenta que no es necesario tener una identidad especial para añadir tu página. AltaVista no es un directorio como Yahoo!, donde la persona que añade la página debe proveer la información y probar que es quien dice ser; simplemente se sugiere una dirección URL para que el espía la visite y recoja cualquier texto que se encuentre en esa dirección.
Todo lo que sabe el espía es lo que se encuentra en la página, no lo que le hayamos dicho. Si ha cambiado la estructura de directorios de su sitio web, puede introducir la URL de todas las direcciones antiguas para eliminar la información antigua del índice. Después puede añadir las direcciones de las nuevas páginas.
Propiedades de un buscador de texto.
Las grandes empresas malinterpretan a menudo cómo funciona AltaVista. Algunos Webmasters piensan que AltaVista y otros motores de búsqueda buscan sólo a través de la información que se encuentran en las etiquetas META - palabras clave incrustadas en la cabecera de un documento HTML. Piensan que solo esas "palabras clave" son importantes y están equivocados.
Esto no es así. Las bases de datos utilizan palabras clave. Con bases de datos necesitas organizar la información para encontrarla después, pero AltaVista es un índice de texto. Cada palabra en cada página importa, y no solo palabras individuales, sino el orden de esas palabras al igual que las frases.
El uso creativo de distintas combinaciones de búsqueda puede producir resultados interesantes e inesperados. Mucha gente tiende a pensar que la única manera de organizar grandes cantidades de información es a través de bases de datos. Configurar una base de datos requiere definir campos, categorizar información, etc... Lleva un montón de trabajo crearla y más aún mantenerla.
El índice de búsqueda de AltaVista no tiene categorías. Lo que se almacena es el texto, no información acerca de ese texto. Una búsqueda hace una correspondencia directa uno a uno con el texto que aparece en las páginas web, no con descripciones publicitarias de esas páginas.
Altavista y el diseño de sitios web.
En los primeros tiempos de la Web, muchos sitios estaban diseñados como historias de aventuras. Se esperaba que el usuario entrara en la página principal y siguiera la navegación de vínculos presentada por el diseñador, con opciones limitadas y restricciones a la hora de navegar.
Hoy en día, si el contenido de su sitio está incluido en los motores de búsqueda, mucha gente no pasa por la página principal. Cualquier página puede ser un potencial punto de entrada. Una página principal no es nada especial. Todas las páginas creadas son iguales, al menos en lo que respecta a los motores de búsqueda.
Como el tráfico que puede llegar a su sitio puede venir de cualquier motor de búsqueda debe prestar atención a todas las páginas de su sitio web.
Diagnósticos con ALTAVISTA.
Si tus páginas están bien indexadas en AltaVista, puedes usar el propio motor de búsqueda como herramienta para comprobar tu sitio y arreglar los problemas que hubieras podido encontrar.
Buscando host: seguido de tu nombre de dominio te dará una lista de todas las páginas de tu sitio web que se encuentran en el índice de AltaVista. Si la lista es relativamente pequeña, puedes ver fácilmente las páginas a las que les falte el título u otro tipo de problemas. También puedes ver las fechas y determinar qué páginas están obsoletas.
Si has cambiado algún nombre de dominio o nombres de directorio en algún momento, haz una búsqueda por link: seguido de la dirección antigua para encontrar si quedan páginas (tanto dentro de tu sitio como en cualquier otro) que todavía vinculen a tu antigua dirección. Puedes arreglar inmediatamente esos vínculos obsoletos dentro de tu sitio o contactar con los webmasters de los otros sitios para actualicen sus hipervínculos.
Indexar correctamente el sitio.
AltaVista no indexa todo. De hecho, algunas características que los diseñadores de web añaden a sus sitios con gran esfuerzo, pueden llegar a bloquear los robots, lo que supone que esas páginas nunca serán indexadas y nunca serán encontradas a través de los motores de búsqueda.
En definitiva, esos sitios suelen terminar gastando dinero en promoción que en principio no estaba previsto. Prestando atención a cómo funcionan los espías y motores de búsqueda puedes conseguir más visitas al mínimo coste.
Combatiendo el SPAM.
Algunas barreras para ser indexado son debidas al mal comportamiento de unos cuantos diseñadores que tratan de engañar a los motores de búsqueda para colocar sus páginas en los primeros lugares de los resultados de búsqueda apareciendo en peticiones de búsqueda que nada tienen que ver con su página. Este comportamiento se conoce como "spamming".
El Spamming degrada el funcionamiento del índice de AltaVista y es un incordio para todos. La lógica que lleva a la gente a probar estos trucos es rastrera: "supongo que mucha gente busca la palabra "sexo". Mi sitio no tiene nada que ver con el sexo, pero quiero que la gente venga a mi página. Así que pongo la palabra "sexo" 300 veces como comentarios. Y cada vez que alguien busque "sexo" mi página aparecerá la primera". La gente lo hace. Hacen lo mismo colocando el texto de fondo de página del mismo color del fondo para que los visitantes no lo vean pero los espías lo indexen. Han tratado de hacer todo lo imaginable para engañar a los motores de búsqueda.
Si para usted es importante aparecer en los motores de búsqueda, tenga mucho cuidado al elegir el servidor que le hospeda. Si está alojado con alguien que también da hospedaje a spammers o páginas pornográficas, puede ser penalizado porque AltaVista detecta la IP del servicio de su dominio.
Orden de aparición de los resultados.
Hay cientos de millones de páginas, así qué cualquier búsqueda es susceptible de tener un gran número de páginas de resultado. Para que los resultados de búsqueda sean útiles, los motores de búsqueda deben puntuar más alto las páginas que tienen un contenido más relevante de acuerdo a la petición de búsqueda.
La forma en que AltaVista hace esto es un secreto (como la fórmula de la Coca-cola) y está sujeta a continuas mejoras.
Aparecer en el índice.
AltaVista basa su ranking, más o menos, en los siguientes factores:
- Las páginas largas con mucho texto significativo.
- Páginas con un buen sistema de navegación, con un montón de vínculos a páginas con contenido relacionado.
- La conectividad de las páginas, incluyendo no sólo cuantos vínculos hay hacia una página sino también desde dónde vienen los vínculos; el número de distintos dominios y la "calidad" de esos sitios desde los que apuntan los vínculos. Un sitio o página es "bueno" si muchas páginas apuntan a ella y especialmente si muchos buenos "sitios" apuntan a ella.
- El nivel de directorio donde se encuentra la página. Los más altos son considerados como más importantes. Si una página está muy al fondo, el espía no irá tan abajo y nunca la encontrará. Estos factores estáticos son recalculados una vez a la semana, y según vaya mejorando la página irá subiendo en el ranking.