El log de visitas es una fuente de información que debemos tener presente para valorar el rendimiento de nuestro site así como
el extraer información sobre nuestros productos. El log nos dará información sobre que información están solicitando los usuarios, que información
les resulta más interesante, cuando la necesitas, rutas de información...
Es muy importante que esta fuente de información este accesible por todos los departamentos en un formato sencillo de entender y fácil
de usar. Es esencial que la comunicación entre los departamentos (o individuos) que tienen la información del log y aquellos que la pueden
necesitar sea fluida para no desaprovechar la riqueza de información que se puede extraer del log.
Técnicamente el "log de visitas" es un archivo creado por el servidor donde se registran las acciones que los usuarios generan en la web.
El archivo en bruto presenta un formato bastante espeso y su tamaño puede ser un problema a la hora de manejarlo (un log de
20.000 visitas puede pesar 3 megas).
Ejemplo de linea de un log:
200.66.196.132 - - [03/Mar/2002:23:59:20 +0100] "GET /directorio/16.html HTTP/1.1" 304 - "http://www.dominio.com/directorio/index.html" "Mozilla/4.0 (compatible; MSIE 5.5; Windows 98; Win 9x 4.90)"
El formato de los logs varia dentro de cada servidor y dentro de cada servidor de la configuración del mismo.
Cada vez que se produce una llamada a un archivo dentro de nuestra web, el servidor escribirá una linea como esta. Cada visita, cada HTML, cada imagen dentro de ese HTML generara una linea. Es esta "redundancia" de información lo que hace que el log sea bastante difícil de manejar en bruto.
Explicación de cada elemento dentro del log |
|
| 200.66.196.132 | I.P. del usuario (numero de identificación del ordenador desde el que el usuario accede) |
| - | Usuario - para sites con identificación |
| - | Password |
| [03/Mar/2002:23:59:20 +0100] | Fecha |
| "GET /directorio/16.html HTTP/1.1" | Archivo pedido |
| 304 | ID de contestación (2xx es OK | 3xx son de redirección | 4xx son de autentificación | 5xx son de errores de servicio) |
| - | Numero de bytes enviados |
| "http://www.dominio.com/ directorio/index.html" |
página desde la que se pide el archivo |
"Mozilla/4.0 (compatible; MSIE 5.5; Windows 98; Win 9x 4.90)" |
Información sobre versión del navegador, terminal del usuario... |
Como todo método de recogida de información el log presenta una tolerancia en su precisión. El principal problema que tiene el
log es que nos puede dar menos visitas de las que realmente se están produciendo. La cache (del navegador
o del servidor proxy) harán que múltiples visitas cuenten como una única vista y que movimientos de avance y retroceso puedan no quedar
registrados en el log.
El otro problema es el no poder contar con la velocidad de conexión del usuario. Al no tener esta referencia, el tiempo de conexión se convierte en
un parámetro algo incierto. Del tiempo de conexión, cuanto se dedica a la bajada de datos y cuanto a tiempo de lectura? Difícil de adivinar, pero
de nuevo la comparación nos debería dar algún indice sobre el que poder crear una referencia.
Estos problemas están comentados de forma precisa en este artículo.
Agradecimientos a Colman López por su ayuda a la hora de preparar este artículo y a Jose Manuel Suárez y Jeff Miller por la información aportada.
Enlaces de interés:
Expresa tu opinión sobre este recurso y compártela con los demás.