Bienvenido, invitado. Puedes registrarte o iniciar sesión.
EN LOS FOROS...
  • Ir a los foros
  • Cambiados los permisos de los foros: Hola. Tras numerosos mensajes de SPAM hemos decidido restringir la publicación de nuevos topics a usuarios registrados. Hasta ahora para hacer esto no hacía falta estar regist...
  • IMPORTANTE: leer antes de publicar.: Este foro está dedicado a tratar temas relacionados con empresas de hosting. Aquí se puede hablar sobre estos servicios, plantear problemas, quejas, recomendar empresas... Per...
  • IMPORTANTE: leer antes de publicar.: Este foro está dedicado a tratar todos aquellos temas en los que se mueve dinero en internet y esto comprende tiendas online, sistemas de pago, marketing, además de propuestas...
  • Ir a los foros
NOTICIAS
Nvsbl PowerBank, una batería auxiliar para tus gadgets: No solo de tablets y lectores de libros electrónicos está lleno el catálogo de la empresa española Nvsbl. De manera muy relacionada con ellos llega su último producto, el Nvs...
La Unión Europea propone a Google solucionar las acusaciones de monopolio de sus competidores: Joaquín Almunia, miembro de la Comisión de la Competición de la Unión Europea, ha ofrecido a Google terminar con la investigación que están llevando a cabo fruto de las queja...
GitHub ya tiene cliente para Windows: GitHub ya tiene cliente para Windows. GitHub es uno de los portales de referencia para el alojamiento de proyectos, que utiliza el control de versiones Git diseñado por Linus...
Google confirma la adquisición de Motorola Mobility: Muchos meses han pasado desde que mi compañero Guillermo Julián nos informara de la compra por parte de Google de la división de móviles de Motorola. Tras salvar numerosos es...
Mandriva se ofrece a colaborar con Mageia y ésta rehusa la invitación: Pocos días después del comunicado donde se conocía que Mandriva quedaba en manos de la comunidad, el CEO de Mandriva SA, Jean Manuel Croset, publicaba en el blog oficial de l...
atfour, ayudándonos a organizar eventos y quedadas: Todos nos hemos enfrentado alguna vez al brete que supone organizar una quedada o un evento en el que hay involucrado un grupo de personas. Una cena, una visita al cine o a a...
¿Ha hecho bien Microsoft desechando Aero Glass? La pregunta de la semana: Hace unos días, mi compañero Manu Mateos hablaba de uno de los mayores cambios en la interfaz de Windows 8. Para la nueva versión de su sistema operativo Microsoft ha decidid...
Panic lanza Coda 2 junto con Coda: Ya hace mucho tiempo de eso, pero todavía recuerdo cuando los chicos de Panic lanzaron la primera versión del editor HTML y CSS Coda. Con el tiempo han habido actualizaciones...
Readlists, agrupa páginas web y crea un ebook gratuito con ellas: Hay veces en las que por el motivo que sea queremos enviar a un amigo no una, sino un grupo de páginas web. Podemos enviarle los enlaces uno a uno agrupados en un correo, per...
Google y Microsoft, su ansia por ser sociales y lo que deberían hacer para conseguirlo: No podemos negar que Google lleva varios años intentando ser social. Google Buzz, Google Wave… y ahora su mayor intento con una red social por todo lo alto: Google+. Y ...
USAMOS...

XHTML

CSS

Powered by PHP

Powered by MySQL

RSS 0.91

RSS 1.0 / RDF

RSS 2.0

ATOM

Identificar clientes por su IP: un mecanismo obsoleto
Consejos y trucos

Publicado (o actualizado) el 03/08/06 a las 17:17:40

Tomar la dirección IP de un cliente para tratar de individualizarlo es un método muy usado por la mayoría de los programas de Internet. Este método (que funcionó muy bien durante varios años), en el escenario actual de Internet ya no funciona, dando lugar a grandes confusiones. Este arículo describe detalladamente las razones de este cambio de escenario, y presenta las soluciones que pueden adoptar los programadores y webmasters para recobrar la exactitud perdida.

Uno de los fundamentos técnicos de Internet consiste en que cada dispositivo u ordenador que se conecta a la red de redes debe poseer una única dirección IP (Internet Protocol) que lo identifique. Basados en esta afirmación, muchos programas en la web intentan identificar a sus visitantes usando la IP que éstos muestran en sus cabeceras de petición HTTP (lo que el explorador envía al servidor para indicarle: "quiero ver tal página"):

  • Muchos sistemas de encuestas (polls) no dejan votar más de una vez al día a una determinada IP, para evitar que un usuario pueda manipular los resultados votando muchas veces.
  • Muchos sistemas de estadísticas se basan en la IP del usuario para determinar si las visitas que recibe un sitio provienen de diferentes clientes, y cuántas visitas repetidas nos generan algunos clientes en particular.
  • Muchos sistemas de estadísticas usan nuestra propia IP para evitar contabilizar nuestros propios accesos a nuestro sitio web, y de esta forma mostrarnos sólo la actividad de los clientes reales.
  • Muchos sistemas de intercambio de tráfico (tops, CJs, ad-Servers y rotadores de banners) leen la IP del cliente para determinar si una visita es "unica" o "raw": es decir, si se trata de un cliente que nos visita por primera vez en el día, o si es un "click" repetido, ya sea de alguien que está entrando de nuevo a un link que ya visitó, o está recargando la página, o retrocediendo en el historial del navegador.

Todos estos "controles" basados en la IP del cliente están asumiendo ingenuamente que cada PC conectada a Internet tiene una IP única que lo identifica, tal como decían los libros hace unos pocos años. Pero esto ya no es así, desde que Internet comenzó su expansión masiva y las direcciones IP comenzaron a escasear. Hoy nos encontramos con un escenario algo cambiado: es posible encontrar cientos, e incluso miles de PCs que comparten una misma IP. Pero el software que no se ha adaptado a estos cambios seguirá considerando que todo ese enorme conjunto de máquinas es un solo cliente, aunque en realidad se trate de todo un pueblo o una pequeña ciudad...

  • Entonces el mecanismo de encuestas dejará votar a una sola persona de esa ciudad (al primero que se levante a votar ese día). Los demás vecinos no podrán votar en el sistema de encuesta, que les dará el mensaje: "usted ya ha votado hoy".
  • Los sistemas de estadísticas nos estarán marcando que tenemos una menor cantidad de visitantes individuales, pero a su vez nos indicará que los mismos mantienen una intensa actividad dentro de nuestro sitio web.
  • Si compartimos nuestra IP con otros vecinos, y configuramos nuestro sistema de estadísticas para que no registre nuestra propia actividad, entonces tampoco estará registrando las visitas provenientes de los demás usuarios con que compartimos nuestra IP. Y éstos pueden ser decenas, cientos, o miles.
  • Los sistemas de intercambio de tráfico estarán considerando que las visitas de un número creciente de personas son "raw", o repetidas. Y en algunos casos puede penalizarse un intercambio (y bajar su posición en el top o en las listas de enlaces) si se reciben muchas visitas desde las mismas ciudades o pueblos (o al menos desde clientes que se conecten mediante un mismo proveedor de Internet).

Cómo y por qué se comparten las IP

Cuando hace 10 años yo era consultor de una empresa que contrató un enlace permanente a Internet de 64 Kbps, el proveedor de Internet nos asignó un bloque de 32 direcciones IP. "Una dirección IP por cada 2 Kbps" era la norma prácticamente en todo el mundo. En esa empresa había unos 25 puestos de trabajo para conectarse a Intenet. De forma que asigné una IP para cada máquina.

El año pasado asesoré a otra empresa para conectar sus sistemas a Internet. Se contrató una línea de 2 Mbps, y el proveedor nos asignó 2 direcciones IP (una IP por cada 1 Mbps) 500 veces menos que hace 10 años! (en aquel entonces nos hubiesen asignado 1024 direcciones IP). Esto es porque los anchos de banda (las velocidades de transmisión de datos) han aumentado, pero el número de posibles direcciones IP sigue siendo exactamente el mismo desde que se inventó Internet. Los investigadores han diseñado un nuevo protocolo llamado IPv6 (IP versión 6, a diferencia del que está actualmente en uso que es IP versión 4). Pero el IPv6 aún está lejos de ser usado mundialmente, a pesar de que los sistemas operativos avanzados (como Linux) ya lo traen desde hace tiempo. Cuando el IPv6 esté en uso mundialmente, ya no existirán las situaciones problemáticas a que hago referencia en este artículo.

Pero por el momento, los proveedores de acceso a la red están usando soluciones que posibilitan el acceso a mucha más gente al Intenet, pero por otro lado complican al webmaster y al administrador de servidores en la tarea de identificar a los clientes que acceden a los sitios web.

NAT: la técnica más usada para compartir una IP

El NAT (Network Address Translation) permite que muchos clientes usen una misma IP, y funciona de la siguiente forma: La red de clientes tiene en cada una de las computadoras una IP interna que no es válida en Internet (a estas IP se les llama direcciones de red privada, y son 192.168.x.x para la clase C; 172.16.x.x para la clase B, y 10.x.x.x para la clase A). Todas las máquinas de la red privada están configuradas para usar como puerta de enlace (o gateway) a una máquina o router que sí tiene su propia IP real. Este dispositivo de enlace tiene entonces 2 direcciones IP: una interna, que es la que ven el resto de las máquinas cliente (y que a la vez la usan como puerta de enlace), y una IP externa real, que es la que se ve desde Internet. Cuando una máquina de la red interna quiere acceder a un sitio en Internet, entonces hace la solicitud a su puerta de enlace. Y la puerta de enlace (el router NAT) repite la solicitud desde su conexión a Internet, como si la estuviese generando él mismo. Cuando el NAT recibe la respuesta desde el sitio de Internet, la copia a la red interna, enviándola a la máquina que generó la petición inicialmente. Es entonces un "intermediario" para toda la actividad de sus clientes. Un router NAT, visto desde Internet, parece ser una máquina normal, pero con una actividad muy intensa.

El NAT no es la única técnica de acceso a Internet que invalida el viejo concepto de "1 cliente <--> 1 IP" que muchos programas pretenden usar como mecanismo de control. También exiten proxys anónimos, IPs dinámicas, etc. Pero a efectos de este artículo, trataremos el NAT como principal problema, sabiendo que las soluciones son las mismas para los diferentes escenarios técnicos.

Esquema de una red conectada a Internet mediante NAT

Posibles soluciones

La reivindicación de las cookies: las cookies son parte del protocolo HTTP. Son un pequeño puñado de datos que el servidor es capaz de almacenar en la PC del cliente: un número de usuario o de sesión, preferencias de idioma, etc. Su uso es muy seguro tanto para el ciente como para el servidor. Pero el problema es que el usuario tiene la posibilidad de borrar las cookies de su PC (o directamente puede configurar su navegador para que no las acepte). Pero en más de un 95% de los clientes, las cookies harán su trabajo maravillosamente bien.

La "huella" de la PC: es el método más nuevo y el menos conocido y usado, pero también el más exacto. Consiste en obtener un sumario de las caracterísitcas de la máquina del ciente que establece una conexión. A su IP se suma el tamaño de su pantalla, la profundidad de color de su tarjeta de video, la versión del sistema opertaivo, el modelo y versión del explorador, si tiene instalado flash, quicktime, shockwave, Real Player, etc, etc. Leyendo la "huella" de los usuarios, aunque los veamos conectarse desde uan misma IP, sabremos por sus características que se trata de máquinas diferentes, y es posible identificarlas con gran precisión. Aún si todas las máquinas fueran iguales (dentro de una empresa, por ejemplo), pronto los usuarios les instalan plugins de software que modificaan la huella de cada máquina. El sólo hecho de modificar el tamaño de pantalla modifica la huella también: de modo que en pocas horas, en un parque de máquinas exactamente iguales y que comparten una IP, se estaría en condiciones de individualizar la actividad que provenga de cada máquina.

Conclusión

En el estado actual de la tecnología, la combinación de cookies y "huella" del computador nos da una visión razonablemente precisa sobre la actividad de nuestros visitantes en los sitios web. Y la identificación de usuarios por su IP ya debería ser descartada por su inexactitud (que va en aumento).




Autor: Eduardo González González
http://www.estadisticasweb.com/articulos/22.php

Escribe un comentario

Expresa tu opinión sobre este recurso y compártela con los demás.

Validación

Por favor, introduce abajo el texto que se muestra en la imagen. De ese modo, evitamos los envíos automáticos masivos y podemos contestar antes a los mensajes legítimos como el tuyo.


Compartir
del.icio.us digg.com technorati.com yahoo.com meneame.net
Recursos relacionados:
Menús desplegables. Más problemas que soluciones: Resumen: Los menús desplegables pueden parecer una buena solución para utilizar muy poco espacio para las categorías que estructuran un sitio web. Sin embargo son difíciles de utilizar, ocultan información, pueden ...
Cinco pasos hacia páginas más profesionales con Dreamweaver MX: Dicen que un mal artesano siempre le echa la culpa a sus herramientas. Y tienen razón. No importa lo buena que sea la herramienta, es la destreza de la persona que la utiliza lo que produce buenos resultados. Este artículo esboza los ...
Los consumidores online tienden a insensibilizarse frente al márketing: ¿Qué es lo que determina el éxito de un sitio en la red? ¿Qué elementos hacen cambiar la conducta de los usuarios? Y.. ¿durante cuánto tiempo debe mantenerse en marcha una estrategia que, en su moment...
Cómo diseñar una portada que cautive a sus visitantes: Cómo diseñar una portada que cautive a sus visitantes Por poco que os mováis en Internet en los sitios de marketing y comercio, veréis que los aspectos de promoción y publicidad de webs son profundamente tratados en todas partes...
El arte de vender humo: Vender proyectos de software es todo un ejercicio de imaginación. Se trata de convencer a un cliente de que algo que no puede ver en el momento actual se materializará en forma de beneficios tangibles para si negocio si realiza la inve...
Pon Tu Radio en Internet: Para montar tú estación de radio en Internet, tenemos dos alternativas: 1. Con tú propio servidor. 2. Con un servidor de pago (Live365.com) Para hacerlo más fácil a todas aquellas personas que no tienen una conexi&...
21 motivos por los que su empresa debe estar en Internet: ¿Todavía no tiene su sitio en la Web? Tal vez piense que Internet no es para su empresa. A continuación le presentamos una serie de motivos por los cuales su empresa tiene que estar ya! 1. Para instalar una presencia. Millones d...
Negociación: claves fundamentales para lograr resultados: Negociación: claves fundamentales para lograr resultados Cuando dos o más personas quieren hacer algo juntas (ir al cine, comprar o vender un objeto o fundar una asociación, por ejemplo), necesitan utilizar algún tipo de...
7 puntos para contratar un desarrollador externo: En cierta parte del proceso, cuando no cuentas con los recursos extras ó simplemente cuando es necesario contratar a un provedor externo para desarrollar apliaciones, siempre será bueno tener ciertas recomendaciones para justificar el ...
El uso ilegal de metaetiquetas y el word stuffing: El uso ilegal de metaetiquetas y el word stuffing ¿ Qué son las metaetiquetas ? Los desarrolladores web o webmasters saben muy bien lo que son. Son parte del código fuente de las páginas web cuya utilidad, entre otras cos...
Cortinas     Depresion     Colchones     Coches de segunda mano     
0.355673074722
eSedo.com - Compra, venta y registro de dominios y proyectos web infos proyecto: duamu.com estadísticas para proyecto: duamu.com etracker® web controlling en lugar de analisis de archivos log