Analytics: ¿ya llegamos a la India? El diablo está en los detalles

Un día, ocurrió lo inesperado: la India pasó a ser el noveno país que más visitas registraba al portal hispano Taringa. Esto implica decir que millones de usuarios visitan un portal en español desde un país del medio de Asia. Alarmados, los directivos del sitio me escribieron, pidiéndome una explicación: ¿qué conclusión se podría sacar? ¿Qué estaba sucediendo en ese país?

Abordaje del caso

Ante un cambio repentino de comportamiento, lo primero que hay que hacer es entender quiénes son los usuarios que modificaron su conducta y qué implica esta modificación.

Gracias a los gráficos de Google Analytics, creamos un segmento avanzado de usuarios conectándose desde la India y en cuestión de segundos ya pudimos sacar nuestra primera conclusión: el cambio fue realmente repentino.

Analytics India Users

 

Con esta información, todavía estábamos lejos de esbozar algún argumento, aunque la hipótesis que comenzaba a sonar como más fuerte comenzaba a ser la de algún tipo de bot que ingresaba al sitio y no era reconocido por Google Analytics como tal. Tampoco se descartaba alguna infección mediante un software malicioso en las computadoras de los usuarios. Uno de los factores más desconcertantes eran que el porcentaje de rebote se mantenía en sus valores normales.

El siguiente descubrimiento partió del informe geográfico:

 

Analytics Pune India

 

Casi todas las visitas provenían de la ciudad de Pune (India). Investigando en Wikipedia, sabemos que es la séptima ciudad más grande del país, con 4 millones y medio de habitantes. Los cálculos sobre esos números daban que, a este ritmo, en menos de 2 meses íbamos a ser visitados por un número cercano al 100 por ciento de la población local. Algo comenzaba a oler muy raro. En este punto, googleamos en internet posibles encuentros o conferencias masivas que se fueran a desarrollar en la ciudad, aunque sin resultado alguno.

El siguiente paso fue analizar las fuentes de las visitas. Por una cuestión de confidencialidad, no comparté a continuación el gráfico, pero la conclusión del mismo era la siguiente: la distribución entre las diferentes fuentes (usuarios que ingresaron al sitio directamente, los que lo hicieron googleando, los que entraron mediante alguna red social, etc.) era la misma que para los otros países. Es decir: de repente, comenzábamos a registrar millones de visitas a un sitio en español, viniendo de fuentes variadas…¡de la séptima ciudad más poblada de la India!

El desconcierto crecía por doquier. Luego de buscar en varios informes de comportamiento, nos encontramos con otro que nos llamó la atención: el reporte de tipo de dispositivo desde el que se establecían las conexiones:

Mobile Report Analytics

Este dato no se condecía con el comportamiento normal del sitio. Casi todos los usuarios que se estaban conectando desde la India, lo estaban haciendo mediante el celular. ¿Por qué ahora? ¿Quiénes eran? Fue entonces cuando se me ocurrió mirar el navegador desde el que se conectaban y, de a poquito, las piezas comenzaron a encajar:

Opera Mini

¡El Opera Mini era la causa de casi todas estas visitas! Esto explica muchas cosas. Les comento: el Opera Mini es un navegador que hegemonizaba la navegación mediante celulares antes de que naciera Android, y que el iPhone se hiciera masivo. Una de las mejores funciones que tiene es la capacidad de enviar al teléfono sitios web con un peso mucho menor al real, de la siguiente manera según Wikipedia:

“Al contrario de la mayoría de los navegadores, Opera Mini obtiene todo el contenido a través de un proxy que corre el motor demaquetación del navegador Opera. Este motor en el servidor proxy reformatea las páginas web con la anchura adecuada para pantallas pequeñas. El contenido se comprime y posteriormente se entrega al teléfono en lenguaje de marcado llamado OBML (Opera Binary Markup Language, Lenguaje de Marcado Binario de Opera). Los contenidos llegan al teléfono con una reducción de tamaño entre el 70 y el 90 por ciento.”

Traducido al castellano: Opera posee servidores que cargan los sitios. Cuando en el navegador ingresamos una URL, ese pedido se le pasa al servidor de Opera Mini, quien carga el sitio, lo maqueta y reduce para que sea más cómodo para el celular, y lo envía al dispositivo ya optimizado.

¿Qué había pasado entonces? Desde ese día, Opera Mini comenzó a enviar como ubicación geográfica de los dispositivos la ubicación geográfica del servidor que pre-cargaba los sitios. Debido a esto, usuarios que se estaban conectando desde otros países comenzaron a ser registrados en Google Analytics como procedentes de la India. Gracias al análisis minucioso de los datos, pudimos descartar las otras razones y finalmente obtener un gráfico que comprueba la teoría:

Opera Mini Not Set

 

 

De una manera casi simétrica, las visitas que provenían de usuarios navegando con Opera Mini cuyo país figuraba como indefinido (not set) fueron reemplazadas por visitantes de Opera Mini provenientes de la India.

 

Conclusión: estos errores a veces suceden, y pueden tardar meses en ser corregidos. Hasta el día de hoy, Opera Mini continúa arrojando información geográfica completamente errónea. La única manera de sacar buena información de los datos es hilando fino y entrando en el detalle. Por suerte, para eso está pensado Google Analytics.

 

 

Actualización

Trabajando junto con el equipo del Ministerio de Desarrollo Social de Argentina, descubrimos un nuevo caso de redireccionamiento erróneo que puede llevar a falsas conclusiones en la herramienta: desde el lunes 29 de septiembre del año 2014, El Ovi Browser, utilizado por la mayoría de los dispositivos Nokia, envía sus visitas como provenientes de la ciudad de Boardman, Estados Unidos.

 

Visitas desde Boardman

 

 

 

 

 

3 pensamientos sobre “Analytics: ¿ya llegamos a la India? El diablo está en los detalles

  1. Eduardo Sánchez

    Genial Ejemplo, Alan.

    El proceso analítico explicado en una página. Una demostración de cómo se detecta una anomalía, se formulan hipótesis y se contrastan para comprobar , o descartar, su validez.

    Un 10.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *