Aquí volvemos a estar, intentando sacar partido a las últimas herramientas de la Suite de Google Analytics. El otro día hicimosy vimos como trabajar con la herramienta y las posibilidades que nos ofrece sin entrar demasiado en casos prácitocs.
Hoy haremos todo lo opuesto, vamos a dar por famosa la herramienta (por lo que si no leíste el blog post que decía en el párrafo precedente sólo debes hacer clic en el enlace superior) e vamos a ir a realizar uno de los trabajos que probablemente van a ser más comunes para la mayoría de usuarios: Crear un dashboard basado en datos de Google Analytics.
- Veremos cómo es la conexión con Analytics. Su complejidad, posibilidades y limitaciones
- Cómo crear fácilmente nuestros primeros dashboards básicos
- Qué posibilidades si tenemos de filtrado y dinamismo en nuestros dashboards
- Los problemas a los que nos vamos a enfrentar para sacar los datos que queremos
- Y cómo solucionar el mayor de estos problemas: Los segmentos
Todo en un artículo e procurando no resultar ni demasiado técnico ni demasiado pesado. Espero que os guste.
Back to top1) El primer paso: Conectando Analytics a Google Data Studio
Como sabemos, Google Data Studio necesita de conexiones con fuentes de datos para poder trabajar. Con estas conexiones se crean los dataSources que usan los dashboards y lo cierto es que la oferta de conexiones y opciones de modelado es limitada pero veremos que incluso así ya tienen su miga.
Crear una conexión inicial con Analytics por fortuna no podría ser más fácil. Solo tenemos que acudir a "FUENTES DE DATOS", clickar en el icono de (+) (que recordad que siendo una estética basada en "material design" está abajo a la derecha) y seleccionar entre las posibles fuentes a "Google Analytics".
Se nos solicitará una vista específica (lo que quiere decir que cada vista de GA debe tener su propia conexión) y realizará una importación genérica (para todos los Google Analytics es exactamente la misma) de los datos.
Se nos presentará una pantalla como la que sigue, donde se nos especifican las más de 500 métricas+dimensiones que vamos a tener libres con esta conexión. Antes eran menos, pero poquito a poco van mejorando la integración. Aquí es posible que nos quedemos intranquilos admitiendo la configuración que Google ha querido hacer pero os debo decir que la conexión es bastante transparente (no inventa mucho que sea nativo de GA) y como base es adecuada, con lo que no hace falta tocar nada a menos que desees tu tocarlo por el motivo que sea.
En esta importación nos hallamos realmente más sorpresas agradables que carencias: En la parte positiva a parte de lo que podríamos aguardar ciertos datos como el ID de propiedad, agrupaciones de canales y contenido, métricas de ecommerce mejorado, estarán ahí libres mas en la negativa descubriremos que no hay indicio ni de realtime (era bastante lógico que no existiese) ni de los embudos multicanal (esto no tan lógico y que ojalá nos llegue algún día).
Genial, pues esta es la información de la que disponemos y que con los detalles que os decía resulta muy afín a los datos de los que disponemos vía API de Analytics. Con esto ya podemos lanzarnos a trabajar y a crear dashboards. Es bastante sencillo y se nota que Google ha trabajado mucho en que la sensación que nos quede es la de que en dos minutos dibujamos dashboards.
Sin embargo, yo os recomendaría que hicierais un pequeño parón antes de poneros como locos a dibujar y vierais algunas de las posibilidades de configuración de esta conexión:
1.1) Definiendo que credenciales usar
Por defecto Data Studio dejará configurado nuestro acceso para acceder con la cuenta de quien crea la conexión. O sea, cuando alguien acceda a ese dashboard en realidad pedirá los datos a través de nuestra conexión a Analytics. Esto no es bueno ni malo, solo hay que saber que implicaciones tiene:
- Por un lado tiene el beneficio de que podemos dar acceso a dashboards sin tener por qué darlos a Analytics.
- Como las conexiones son vista a vista y no de la cuenta entera no debemos preocuparnos porque esos dashboards den acceso a otros clietnes
- También hay cierto peligro con usuarios con capacidad de edición. Esto podrán solicitar datos a través de la conexión a partes de GA que en un inicio igual no queríamos que accediesen. (por servirnos de un ejemplo, podemos crear un dashboard para un distribuidor donde solo salgan sus conversiones pero no las del resto de proveedores ni la facturación real que supone y que este edite el dashboard y pueda verlo todo).
- Y por último como con el propio GA. supone cierto inconveniente de descontrol. Gemte que cambia de empresa o bien de proyecto y no se gestionan bien sus accesos.
Con este escenario yo soy más amigo de mudar la configuración de las credenciales de la conexión y pasarlas a "Credenciales del lector". O sea, que Data Studio use la conexión de Analytics de quien se conecta al dashboard. Para eso clicamos arriba a la derecha en "USAR LAS CREDENCIALES DEL PROPIETARIO" y cambiamos las opciones en el próximo panel:
Esto te da más libretad para compartir dashboards sin cuidado pues si el usuario no tiene acceso a analytics, los gráficos a los que no tenga acceso se verán así:
Como contra, implica que debes ir dando accesos a GA a todo el que quiera ver el dashboard. Así que no hay configuración buena, solo es una elección.
Lo que es una auténtica pena es que se haya pensado en un tema como este y no obstante no exista una opción del tipo "Seleccionar tu Vista al importar el dashboard" o bien algo así. Más que nada pues ahora mismo los dashboards tienen gráficos en los que cada uno separadamente se asocia a un dataSource y este a su vez si es de GA se asocia a una vista concreta. Esto hace que compartir dashboards genéricos (para que la gente importe) no es cómodo. Siempre y en todo momento podemos utilizar la cuenta de GA de la tienda de Google como ejemplo, pero ojalá algún dia dispongamos de dashboards como un recurso más de lacomo lo son ahora los informes adaptados y paneles de GA.
Por defecto Data Studio va a dejar configurado nuestro acceso para acceder con la cuenta de quien crea la conexión. Esto es, cuando alguien acceda a ese dashboard en realidad pedirá los datos a través de nuestra conexión a Analytics. Esto no es bueno ni malo, solo hay que saber que implicaciones tiene:
- Por un lado tiene la ventaja de que podemos dar acceso a dashboards sin tener por qué darlos a Analytics.
- Como las conexiones son vista a vista y no de la cuenta entera no debemos preocuparnos porque esos dashboards den acceso a otros clietnes
- También hay cierto peligro con usuarios con capacidad de edición. Esto podrán solicitar datos a través de la conexión a partes de GA que en un inicio igual no queríamos que accediesen. (por poner un ejemplo, podemos crear un dashboard para un distribuidor donde solo salgan sus conversiones mas no las del resto de proveedores ni la facturación real que supone y que este edite el dashboard y pueda verlo todo).
- Y por último como con el propio GA. supone cierto inconveniente de descontrol. Gemte que cambia de empresa o bien de proyecto y no se gestionan bien sus accesos.
Con este escenario yo soy más amigo de mudar la configuración de las credenciales de la conexión y pasarlas a "Credenciales del lector". Esto es, que Data Studio use la conexión de Analytics de quien se conecta al dashboard. Para eso clicamos arriba a la derecha en "USAR LAS CREDENCIALES DEL PROPIETARIO" y cambiamos las opciones en el próximo panel:
Esto te da más libretad para compartir dashboards sin cuidado pues si el usuario no tiene acceso a analytics, los gráficos a los que no tenga acceso se verán así:
Como contra, implica que debes ir dando accesos a GA a todo el que desee ver el dashboard. Así que no hay configuración buena, solo es una elección.
Lo que es una verdadera pena es que se haya pensado en un tema como este y sin embargo no exista una opción del tipo "Seleccionar tu Vista al importar el dashboard" o bien algo así. Más que nada por el hecho de que ahora mismo los dashboards tienen gráficos en los que cada uno de ellos separadamente se asocia a un dataSource y este por su parte si es de GA se asocia a una vista concreta. Esto hace que compartir dashboards genéricos (a fin de que la gente importe) no es cómodo. Siempre podemos utilizar la cuenta de GA de la tienda de Google como un ejemplo, pero ojalá algún día dispongamos de dashboards como un recurso más de lacomo lo son ahora los informes adaptados y paneles de GA.
1.2) Traduciendo tus dimensiones y métricas
Cuando Data Studio crea la conexión con Analytics usa los nombres que aparecen disponibles en lapor lo que los datos ya aparecen traducidos al idioma en el que tengas configurado Data Studio (o en inglés si tu idioma no está disponible).
Tambien nos encontramos con que los nombres de GA no siempre y en toda circunstancia representan lo que esa acción es para nuestro negocio. Ciertos ejemplos:
- Si usamos transacciones para guardar leads, que en el dashboard aparezca "transactiones" es confuso
- Si usamos eventAction para identificar zonas de click del usuario (botones, menús, modales, etc.) llamar a ese desglose "Acción del evento" no es lo más adecuado
- Si hemos organizado nuestro sistema de campañas de forma más acorde a nuestra empresa a analytics es probable que source o bien content no signifiquen exactametne "fuente" o bien "detalles del contenido". Por servirnos de un ejemplo es normal guardar en "utm_content" las dimensiones del banner. ¿No seria entonces más útil llamar a ese dato "dimensiones del banner"?
Para este género de tareas, y dado que luego en el entorno de diseño de dashboards no vamos a poder editar nada lo propio es que editemos los datos de conexión. Para ello tenemos dos vías:
- Buscamos el factor original y le damos el nombre que deseemos
- O duplicamos un elemento y al nuevo le damos el nombre que queremos (ideal si por servirnos de un ejemplo vamos a llamar a la misma métrica de forma diferente en distintos dashboards)
2) Nuestro primer dashboard
Ahora sí, ya tenemos una conexión digna y podemos comenzar a dibujarle piezas. ¡Así que a producir informe!
Es inevitable que las primeras veces vayamos dibujando a lo loco. Un "quesito" por aquí, un dato suelto por allá y unas "barritas molonas" al otro lado. Como es inevitable no os pediré que no paseis por ahí, pero tomaroslo como un ejercicio de práctica, no como que estáis haciedno un dashboard de veras.
Sólo como recordatorio: Crear un dashboard implica siempre iniciar fuera de la herramienta y pasar por un proceso de...
- 1. Preguntas: Necesidades que ha de resolver el dashboard,
- 2. Métricas y KPIs: Datos que vamos a usar para resolverlas
- 3. VisualizaciónPernsar cpara ada necesidad como es la mejor visualización (tipo de gráfico) para comprenderla y compararla
- 4. MockupDibujar un boceto si bien sea a lapiz en una libreta de manera que prioricemos la información y logremos el orden de lectura adecuado
- 5. ElaboraciónY entocnes si, añadir los elementos a una herramienta y acaba de afinar los detalles
En dashboards online además es deseable añadir un mínimo de interactividad. Para esto ya vimos que esencialmente tenemos 2 opciones: El selector de fechas y los filtros. Pensemos en base a la información que vamos a incluir en el dashboard que filtrados seán útiles para el usuario y dotemos de estos a nuestro dashboard.
Finalmente nos quedará un resultado más o bien menos perosnalizado y solo tendremos que ponerlo bonito. Esto de bonito tiene su importancia dependiendo de a quien dirijamos el dashboard. Para consumo interno o bien cuadros de mando importa poco lo bonitos que sean, mas para presentarlos a dirección o a gente con poco contacto diario con los datos es esencial: el dato entra por los ojos o bien no entra, y si no entra no puede comprenderse.
Nosotros hemos desarrollado este pequeño dashboard de ejemplo, muy simple, que cumple la función de ver a muy grandes rasgos la composición del tráfico en distintos periodos de tiempo (selector de datas) y para distintos canales (filtro).
Back to top3) ¿Qué datos puedo perdir verdaderamente a esta conexión?
Como veis al final todo son exactamente los mismos datos que en los informes adaptados de analytics. Todo lo que puedas sacar como informe personalizado de analytics tiene cabida en un dashboard de Data Studio.
Eso es genial, vale. ¿Pero que más puedo hacer? ¿Sólo puedo sacar la información de los informes personalizados?
Pues segúnasí es. Lo bueno es que nos dejan caer un...
ACTUALIZACIÓN:Pero la realidad es que desde el 2 de marzo de 2017 ya se nos permite filtrar con segmentos en nuestros gráficos de data studio. Esto no cambia la configuración de la fuente sencillamente se nos ha añadido, entre las opciones de configuración de los widgets de data studio un apartado donde señalar un segmento de Analytics por el que filtrar cada gráfico.
3.1) Datos de informes personalizados
Estos datos básicamente nos permiten solicitar:
- Una o múltiples dimensiones
- Una o varias métricas
- Uno o bien varios filtros.
- Y un único segmento por gráfico por el que pre-filtrar los datos.
Es decir, solo hay 4 conceptos que solicitar, lo cual esta bien mas seguimos echando en falta la posibilidad de cruzar datos, definir segmentos al vuelo o crear filtros globales de segmentos.
Trabajo Base (sin segmentos)
Sin el empleo de segmentos estamos limitados a trabajar en un único ámbito de los datos. Cuando trabajamos con Google Analytics no trabajamos con la información bárbara sino más bien con dimensiones y métricas, que son agregaciones de estos datos. Esto también es así en Data Studio.
El problema de trabajar con datos agregados es el "cómo los agrego" y ahí es donde nuestros deseos al solicitarle un dato a GA pueden no coincidir como cómo agrega GA la información.
Para resumir diremos que hoy en día hay 4 ambitos de datos:
- Usuario: cookies de usuario único
- Sesión: visitas al site
- Hit: cada input de datos sueltos (paginas, eventos, transacciones, etc)
- SubHit (eminentemente productos de ecommerce mejorado)
Analytics crea sus dimensiones y métricas en un ámbito específico y por tanto estas funcionan correctamente sobretodo en este ámbito. Así, las campañas por servirnos de un ejemplo son dimensiones de ámbito sesión y el rebote es una métrica que también se calcula en este ámbito por lo que puedo pedir el rebote por campaña.
Además analytics no va a tener inconvenientes para mostrar métricas de un ámbito más bajo en para una dimensión más alta. Así que puedo pedir cosas como "páginas vistas (ámbito hit)" por "página de destino (ámbito sesión)" en tanto que solo debe de sumar todos y cada uno de los hits de las sesiones implicadas para conseguir el dato.
Esto sumado a que la mayoría de la información de analytics está en ámbito sesión hace que percibamos que todo puede cruzarse mas no es verdad. Cuando estamos en el entorno del creador de informes personalizado de Analytics este nos va limitando las dimensiones y métricas que podemos elegir en función de las que hemos puesto (eludiendo que elijamos cosas que no van a funcionar) mas cuando consultamos vía API o bien en un caso así vía Data Studio si podemos cometer estos erroes.
El fallo más común es solicitarle a analytics métricas de un ámbito superior al de las dimensiones
El ejemplo más claro: Solicitarle sesiones (métrica ambito sesión) de una página (dimensión de ámbito hit). En un caso así GA hace lo que puede y nos enseña un informe que no es lo que nosotros deseamos.
- Nosotros esperabamos que nos mostrase todas y cada una de las sesiones que han pasado por una URL
- Pero analytics nos muestra cuantas sesiones SE ORIGINARON en una URL, es decir, cuantas tuvieron como primer hit esa url
La explicación de por qué pasa esto la tenéis en este post:
3.2) Un poco de trampas: las "vistas únicas"
Bien, esto de los ámbitos en ciertos casos puede suponer un problema, pero no olvidemos que tenemos una grandisima cantidad de dimensiones y métricas con los que trabajar. Solo tenemos que fijarnos de trabajar siempre y en toda circunstancia en el ámbito adecuado.
La mayor parte de las veces esto solo nos dará problemas como decíamos para conceptos de contenidos de los que queremos saber sesiones (y para los que como veremos entonces nos vemos obligados a crear segmentos uno a uno).
Sin embargo deseo hacer mención de una colección de métricas muy interesantes que nos pueden asistir a solventar el problema en la mayoría de los casos:
- Sesiones por página:Páginas vistas únicas & URLs de página: Número de sesiones en los que esa página ha estado involucrada
- Sesiones por zonas de la web:Vistas únicas de agrupación de contenido & agrupación de contenido: Número de sesiones en los que ese valor de agrupación de contenido ha estado implicado (ideal para sesiones por sección o bien categoría)
- Sesiones por acontecimientos al detalle:Eventos únicos & Dimensiones de categoría + acción + evento: Numero de sesiones en los que la combinación de los 3 ha aparecido
- Sesiones por eventos concretos:Combinaciones de dimensión únicas & cualquier dimensión de evento: Número de sesiones en los que esas dimensiones han estado involucradas
- Conversión por página:Valor de la página & URL de pagían: Si repartimos el valor de las conversiones entre todas las páginas vistas de esa conversión el valor es lo que se llevan las páginas que ves
Y al final, cualquier métrica con la palabra "unique" será de este género..
Estas métricas nos ayudarán a salvar la papeleta muchas veces, pero cuidado, marchan solo con las dimensiones para las que han sido creadas. Si por poner un ejemplo cruzaras "paginas vistas únicas" con la agrupación "sección de la página" cuando un usuario pase por 2 páginas con URLs diferentes mas en esa sección contarán como +2 y no como +1.
Back to top4) Usando segmentos en nuestros gráficos
Google Data Studio nació sin segmentos para Google Analytics. Hablando claro, fue una malisima decisión por la que mucha gente ha desechado la herramienta. Por fortuna en uno de sus incesantes updates los añadieron. Aunque lo cierto es que no ha sido una integración global de los segmentos y tenemos algunas restricciones con ellos.
- Los segmentos solo se eligen para cada gráfico separadamente. No podemos crear segmentos globales.
- Son fijos, el usuario que consulte el dashboard no podrá trastocarlos.
- Y solo se nos da acceso a los segmentos del sistema + aquellos que hayamos definido en analytics. Esto es, no tenemos un editor de segmentos en Data Studio con el que podamos crear a la medida los segmentos para el dashboard.
- Y solo aplicamos un único Segmento al gráfico, no podemos sumar filtros de varios tipos (esto no es sorpresa, ya sucede en el propio analytics).
En terminante, si que hay segmentos, mas si habeís trabajado en otros entornos o bien habéis configurado/programado vuestros propios dashboards con la API de google analytics vereis que podrían haberse incluido muchas más funcionalidades. Aún así, veamos lo que nos suponen.
Cuando creamos un gráfico en Data Studio vamos a poder aplicar 1 segmento a dicho gráfico (solo 1). Accedemos a la pestaña "DATOS" de nuestro panel y abajo completamente encontraremos el selector de segmentos.
Cuando lo seleccionamos nos aparecerán todos los segmentos tipicos de analytics (los del sistema) más los que hubiesemos creado en la cuenta de analytics. Si un segmento que queramos aplicar no está entre los listados nos vamos a ver obligados a acceder a nuestra cuenta de analytics, crearlo ahí, volver a Data Studio y refresacar la conexión a fin de que aparezca como libre. Así que un buen consejo sería acotar todos los segmentos anteriormente en nuestro GA para luego trabajar de forma más directa en Data Studio.
Una vez escojamos el segmento que deseemos, el sistema nos preguntará si deseamos incoporarlo. Esta es una alarma que tiene sentido cuando compartimos el dashboard con más gente. Basicamente nos viene a decir que quien vea o bien edite ese dashboard aun sin tener acceso a GA podrá usar dicho segmetno para otras cosas. Nos alertan, lo pensamos un minuto y vemos si puede ser un inconveniente en nuestro caso o no.
Y nada, desde ese momento este gráfico ya pre-filtra los datos por el segmento elegido.
Back to top5) Calculando datos en la configuración de la conexión
Otra de las posibilidades que ahora tenemos y que con analytics eran más limitadas es añadir a nuestra conexión datos calculados entre los valores de dimensión y métricas que disponemos en la conexión.
Para ello podemos editar nuestra conexión (volviendo a la home o bien dándole al icono de lápiz en la conexión al editar cualquier gráfico) y hacer algunos cambios.
Para este ejemplo hemos hecho 3 pequeños añadidos.
- Por una parte hemos alterado el nombre de "Bounces" a "Sesiones Rebotadas"
- Luego hemos añadido una métrica llamada "Sesiones No Rebotadas" que calculamos como la resta entre "Sesiones - Bounces"
- Y por último hemos creado con una expresión regular una nueva dimensión que a partir del tamaño de pantalla (Screen Resolution) de los usuarios tan solo queremos que recoja el ancho de la pantalla.
Con estos tres nuevos datos pasamos a poder crear un gráfico como este:
Que nos enseña las sesiones divididas en Rebotadas y no Rebotadas por anchos de pantalla. Este informe en GA sería imposible de crear sin crear vistas con filtros avanzados a medida para exactamente el mismo, así que tenemos una ventaja poderosa de modelado de datos en el propio Data Studio.
Para esta clase de labores nos combiene repasary saber con qué posibilidades jugamos.
Especialmente intersantes para manipulación de dimensiones son:
-
REGEXP_EXTRACT:Que nos deja sacar solo un fragmento del texto de una dimensión.
Tal y como hemos visto en el ejemplo de arriba. Mas tambien nos permitiría separar campos que tienen múltiples valores a la vez -
REGEXP_REPLACE:Que nos permite hacer reemplazos de un texto por otro.
Ideal por poner un ejemplo para hacer arreglos (por ejemplo: campaña "FB" cambiamela por "facebook". -
CASE:Que deja detallar valores en función de validaciones.
Es decir excribimos valores del tipo CASE WHEN A = B THEN "devulve esto" ELSE "devuelve esto otro" y por tanto se convierte en una función ideal para hacer agrupaciones.
Por facilitar, piensa en cosas como CASE WHEN Page = "/" THEN "Es la home" ELSE "NO es la HOME" y después piensa más a lo grande
Realmente esto de la manipulación de valores de variables es un mundo mas es probable que deseemos cruzar datos de otra forma para mostrar datos más modelados en nuestros dashboards.
Back to top6) Cargando datos de GA modelados o cruzados en Data Studio
Bueno lo primero siento decirte que realmente esto aún no se puede hacer. Y esto es por el hecho de que el editor de fuentes de Data Studio aun no permite este trabajo. Tiene pinta de que terminará haciendolo, mas incluso no es así.
¿Pero la de GA no es la única conexión de la que disponemos verdad? Así que siempre y cuando no intente cargar los datos de forma directa a través de esa conexión, si que podría cargar datos modelados. ¿El truco? Hacerlo a través de otras conexiones. Asi de simple.
6.1) Opcion 1: Vistas prefiltradas
Fácil, creo una vista en mi analytics que ya use los filtros adecuados. Luego cargo como una segunda conexión a mi GA esa nueva vista y todo cuanto use esta segunda vista estará prefiltrado.
Lo que pasa es que esto que parece una puerta interesante en la práctica se convierte en un recurso muy limitado por múltiples motivos.
- 1. No tenemos histórico, cuando creamos la vista nueva esta comienza a atrapar datos y por lo tanto no podremos preguntar el año pasado.
- 2. Un filtro de segmento no es exactamente lo mismo que un filtro de vista. Las vistas filtran hit a hit y los segmentos agrupan sesiones o usuarios completos. Si yo por ejemplo filtro una URL concreta no veré las conversiones que se produzcan en esa visita mas en una URL diferente.
- 3. Realmente prosigo sin cruzar datos, no puedo hacerlo
Asi que solo me va a aportar esta opción algo para casos muy específicos. Por servirnos de un ejemplo separación de paises por carpetas donde aplico un filtro de hit que en realidad se marcha a parecer mucho al de sesión pues un usaurio realizará la mayor parte de sus hits (si no todos) en exactamente el mismo país de la página web.
6.2) Opcion 2: BigQuery
Para los que tengan la fortuna de disponer de una cuenta premium Google Analytics (perdon, ahora tiene por nombre Analytics trescientos sesenta) se vuelca automaticamente a tablas cada día en BigQuery. Ahí podemos consultar lo que nos de la gana. ASí que lo que precisamos es crear una consulta con los datos que necesitamos, con ella crear una vista y también emplear esa vista como dataSource creando una conexión con BigQuery.
Las primeras veces, crear segmentos a nivel sesión o usuario puede ser un tanto extraño en bigQuery y más aun cruzar datos con otras fuentes. Hay que aprender a unir tablas con "TABLE_DATE-RANGE()" y entender como usar campos como visitId o bien fullVisitorId (puesto que los nombres de campos no coinciden siempre y en todo momento con los nombres de dimensión) para hacer las agrupaciones manualmente sobre las tablas de hits o bien de sesiones. Una vez dominas como se hacen ese tipo de queries el planeta se vuelve más amable.
Para los que no lo hayais tocado os dejo solo un enlace, una explicación paso a paso de como preguntar funnels dentro de bigQUery, un post que por lo complejo del inconveniente debe solventar varias partes y te da varias queries de ejemplo:
No me enredo más con esto, quien sabe usar bigQUery sabe y quien no no aprenderá solo con 4 comentarios en un post que en realidad va de otra cosa.
6.3) Opción 3: Descargas de datos modelados a MySql
Una opción muy utilizada en sites que precisan un reporting serio es hacer descargas al día de los datos de analytics vía API. Eso nos pemite crear un repositorio con datos ya modelados como necestiamos (con los segmentos ya aplicados) y consultar de manera directa las tablas MySql con la conexión de Data Studio.
El problema es crear el script que se descarga los datos. Esto acostumbra a ser trabajo más de la gente de BI que del analista, pero soluciones vamoas a encontrar varias en internet. Nosotros en IKAUE tenemos una librería propia para este género de descargas desarrollada en PHP y que es capaz de multiplicar las consultas creando compilaciones de segmentos a la medida.
Otro inconveniente de este sistema es que todo lo que no hayas pensado como dato preciso para estas exportaciones no estará libre, de ahí que es esencial planear bien las descargas de datos.
Nota: Si los datos son muchos tambien es posible que queramos descargar pero no hacia MySQL sino más bien tambien cara BigQUery. El resultado realmente sería le mismo pero más rápido de procesar.
6.4) Opción 4: Google SpreadSheets como conexión intermedia con APIs reales
Me centraré en Google Analytics, mas este sistema en realidad nos deja añadir a Data Studio no solo la API real de GA sino más bien cualquier API libre para Google SpreadSheets.
Lo que vamos a hacer es crear una hoja de repositorio de datos, esta hoja ha de ser capaz de mecanizar las cargas de datos. Entonces desde Data Studio no pediremos acceso a las API's sino a Google Spreadsheets con ese repositorio. Sería algo muy semejante a las descargas de datos modelados a MySQL que decíamos ya antes mas más alcanzable para la mayoría de personas (aunque también más limitado).
Veamos un pequeño ejemplo, vamos a conseguir traer datos de las visitas que pasan por la home (un segmento de usuarios que pasan por "/") a nuetro dashboard a través de Google SpreadSheets.
Para ello entraremos en, una página dedicada a las hojas de cáculo de google, si bien todos sabéis que a través de drive tambien se puede acceder.
El complemento de "Google Analytics"
Las hojas de Google dejan complementos, son como los macros de Excel pero programados en Javascript y con acceso a APIs. Lo mejor de estos complementos es que tenemos una galería desde la que importar los que han hecho terceros o bien el propio Google. Para ello solo tenemos que hacer clic en el menú Complementos>Obtener Complementos.
Dentro de la galería deberíamos buscar el complemento de Analytics. Se encuentra de forma bastante sencilla puesto que es uno de los complementos TOP.
Lo incorporamos y desde entonces en el propio Menú de complementos vamos a tener una nueva opción llamada "Google Analytics" con 3 opciones: Crear Informe, Ejecutar Informe y programar reports.
Hacemos Click en "Create new Report" y nos creará una nueva Hoja nueva con la plantilla de nuestro report. En esta Hoja cada columna es una consulta a la API de analytics, y en todos y cada fila debemos apuntar el valor del dato que pediríamos a la API de GA.
La consulta a la API de analytics
No deseo entretenerme con temas de la API, asi que sencillamente deciros que lo suyo es solicitarle un informe personalizado con las dimensiones y métricas que deseamos y el máximo número de días cara atrás en el tiempo que podamos dejarnos.
Algunas apreciaciones:
- El número de días dependerá de nuestro tráfico:
Analytics vía API (tanto premium como free) tiene muestreo. Por lo que cuantos más datos le pidamos más probable es que estos datos estén muestreados y a mayor volúmen más muestreo aplicará. Así que tenemos que procurar preservar la caldiad del dato mas al tiempo sabemos que cuantos más días consigamos incluir más dinámico podrá ser nuestro dashboard (por el hecho de que más días podremos poner en el selector de fechas) - Las dimensiones siempre deben incluir "ga:date" como mínimo:
Los dashboards de Data Studio marchan mucho mejor cuando tienen un rango de fechas al que asociar los datos - No hay que usar métricas calculadas:
Cómo vamos a reunir los datos hay que eludir las métricas calculadas pues al agruparse nos darán fallos. Por servirnos de un ejemplo, no tiene sentido que solicitemos el "porcentaje de rebote" porque Data Studio no podrá calcular ese dato para una franja de dias que va variando según la selección del usuario. Por ende lo suyo, si deseo disponer del rebote, es que saque sesiones y rebotes sueltos, ya calculare el "rebotes/sesiones" en Data Studio cuando toque.
Validando los datos disponibles
Una vez tenemos todos y cada uno de los datos definidos, clickamos en el menú en "Run report" y se nos generará una hoja nueva de datos (que tendrá por nombre el nombre que hemos puesto al report) y donde podemos validar qué datos tendremos disponibles.
- Revisamos que no haya muestreo, o al menos que si lo hay no nos moleste demasiado
- Y apuntamos a partir de que fila aparecen realmetne los datos en el report.
Automatizamos la recarga de datos
Ya tenemos los datos, solo debemos preocuparnos de que estos se vayan actualizando solos. Para ello Clickamos en el menú "Schelude reports" y le indicamos que lo recargue cada día a X hora. La hora tiene que ver con cuando se nos calculan los datos diarios en nuestra cuenta. En analytics premium sabemos que eso sucede a las pocas horas y como mucho podría suceder a las 4 de la mañana. En cuentas free es preferible moverlo a mucho más tarde. Lo que hago es recargar justo en el momento de inicio de actividad en la compañía. Esto es, si sabemos que absolutamente nadie estará en su puesto hasta las 9:00 de la mañana, recargamos el informe a las 8:55.
Creando la fuente en Data Studio
Ya hemos acabado con spreadsheets, vamos a por Data Studio que es lo que nos interesa. Ahí solo tenemos que crear una fuente nueva de tipo "Google Sheets", seleccionar de que archivo y hoja deseamos que vengan los datos y elegir un rango de celdas en el que actuar. En mi ejemplo hemos seleccionado las filas de la A15 (Donde comenzaban los datos) a la F10000 (por poner algo).
Una vez configurado ya podremos ir a ver los campos integrados.
¿Lo que pasa es que nos faltarán datos verdad?
Configurando a medida los datos desde SpreadSheets
A estos datos vamos a darles una vuelta. Para iniciar vamos a calcular los porcentajes de rebote y conversión. Como recordarás dijimos que no podiamos ponerle estos datos en la consulta porque dependerian de las datas escogidas. En cambio en la configuración si podemos señalarle a Data Studio como hacer ambos cálculos:
Por último nos quedará traducirlo todo a fin de que los datos que estamos cargando signifiquen algo para el que va leer el dashboard (si, por más que te empeñes "ga:sessions" no significa nada). El resultado agrupando los nombres con los que utilizamos en el dashboard que hasta el momento no tenía segmentos quedaría algo asi:
¡A dibujar!
Ahora ya si, ya podemos asistir a nuestro dashboard y añadir la información debidamente segmentada.
6.5) Ya tenemos datos modelados en Data Studio
Y bueno, si, es cierto, hemos metido cierto modelado a la información de GA en Data Studio mas estaréis conforme conmigo en que esto solo podemos hacerlo para datos muy críticos y concretos. El proceso es demasiado complejo, limitado y tedioso para que merezca la pena replicarlo para gran cantidad de datos.
Aún así esta bien que existan posibilidades como BigQuery, MySql y Google SpreadSheets que nos ayuden a terminar de redondear nuestros informes. El tema de spreadsheets me resulta en especial interesante por el hecho de que realmente no solo disponemos de apis de analytics. Podemos cargar ahí multitud de APIs y emplear estas hojas como puente para crear un dashboard con datos no solo Google. Un simple vistazo a "" puede darte una idea de todo cuanto puedes integrar así.
Back to top7) Conclusión
Bueno, creo que hemos repasado bastantes unas partes de la herramienta y las posibilidades están claras. Crear dashbaords de Analytics con Google Data Studio es una tarea que de primeras parece sencillisima (en verdad se hace más simple aun que crear informes personalizados) mas a la que vas rascando vas viendo que tienes mucho trabajo por delante. Estandarizacion de datos, crear fuentes extra para llenar tu información y luego, cuando termines, tocará ponerlo todo congruente al tiempo que hacemos resaltar los datos primordiales sobre el resto. Tenemos para cientos y cientos de horas de "diversión" asegurada con esta nueva herramienta.
Automatizamos la recarga de datos
Ya tenemos los datos, solo tenemos que preocuparnos de que estos se vayan actualizando solos. Para ello Clickamos en el menú "Schelude reports" y le indicamos que lo recargue cada día a X hora. La hora debe ver con cuando se nos calculan los datos diarios en nuestra cuenta. En analytics premium sabemos que eso sucede a las pocas horas y como mucho podría ocurrir a las cuatro de la mañana. En cuentas free es preferible moverlo a mucho más tarde. Lo que yo hago es recargar justo a la hora de inicio de actividad en la empresa. O sea, si sabemos que nadie va a estar en su puesto hasta las 9:00 de la mañana, recargamos el informe a las 8:55.
Creando la fuente en Data Studio
Ya hemos acabado con spreadsheets, vamos a por Data Studio que es lo que nos interesa. Ahi solo debemos crear una fuente nueva de tipo "Google Sheets", elegir de que archivo y hoja deseamos que vengan los datos y seleccionar un rango de celdas en el que actuar. En mi ejemplo hemos seleccionado las filas de la A15 (Donde comenzaban los datos) a la F10000 (por poner algo).
Una vez configurado ya vamos a poder ir a ver los campos integrados.
¿Lo que pasa es que nos faltarán datos verdad?
Configurando a medida los datos desde SpreadSheets
A estos datos vamos a darles una vuelta. Para empezar vamos a calcular los porcentajes de rebote y conversión. Como recordarás afirmamos que no podiamos ponerle estos datos en la consulta por el hecho de que dependerian de las fechas escogidas. En cambio en la configuración si podemos señalarle a Data Studio como hacer los dos cálculos:
Por último nos quedará traducirlo todo para que los datos que estamos cargando signifiquen algo para el que va leer el dashboard (si, por más que te empeñes "ga:sessions" no significa nada). El resultado agrupando los nombres con los que empleamos en el dashboard que hasta ahora no tenía segmentos quedaría algo asi:
¡A dibujar!
Ahora ya si, ya podemos asistir a nuestro dashboard y añadir la información debidamente segmentada.
7.1) Ya tenemos datos modelados en Data Studio
Y bueno, si, es cierto, hemos metido cierto modelado a la información de GA en Data Studio pero estaréis conforme conmigo en que esto solo podemos hacerlo para datos muy críticos y específicos. El proceso es demasiado complejo, limitado y tedioso para que valga la pena contestarlo para gran cantidad de datos.
Aún así esta bien que existan posibilidades como BigQuery, MySql y Google SpreadSheets que nos asistan a finalizar de redondear nuestros informes. El tema de spreadsheets me resulta singularmente interesante por el hecho de que verdaderamente no solo disponemos de apis de analytics. Podemos cargar ahí multitud de APIs y usar estas hojas como puente para crear un dashboard con datos no solo Google. Un simple vistazo a "" puede darte una idea de todo cuanto puedes integrar de esta forma.
Back to top8) Conclusión
Bueno, creo que hemos repasado bastantes unas partes de la herramienta y las posibilidades están claras. Crear dashbaords de Analytics con Google Data Studio es una labor que de primeras semeja sencillisima (en verdad se hace más simple aun que crear informes personalizados) mas a la que vas rascando vas viendo que tienes mucho trabajo por delante. Estandarizacion de datos, crear fuentes extra para llenar tu información y después, cuando termines, tocará ponerlo todo congruente al tiempo que hacemos destacar los datos principales sobre el resto. Tenemos para cientos de horas de "diversión" asegurada con esta nueva herramienta.
¿Te gustó este artículo? Puedes continuar sus comentarios a través de, o realizardesde tu blog.
Back to top