Crear juego de datos

 

1. ¿Qué es un juego de datos?

Un juego de datos es un modelo de datos de autoservicio que puede crear específicamente para los requisitos de visualización y análisis de los datos.

Puede basarse en una tabla, una hoja de cálculo o un archivo. Asimismo, un juego de datos puede ser un modelo de datos de autoservicio que contenga varias tablas con relaciones definidas entre las tablas.

 

2. Guía para crear un juego de datos

Antes de crear un juego de datos, hay que pensar bien que queremos añadir dentro de él y si tiene sentido que vaya ahí o en otro juego de datos. La idea principal es que un juego de datos agrupe un conjunto de tablas relacionadas entre sí y que pueden valerse por sí mismas para mostrar información. Es importante que no abusemos al meter tablas dentro de un juego de datos. La arquitectura debe basarse en que si unas tablas son necesarias en muchos juegos de datos, quizá lo mejor es abstraerlas y crear un juego de datos individual para esas tablas.

Un ejemplo muy básico es el de la tabla de Personas (GRI_PER.per_personas). Podríamos añadir esta tabla en multitud de juegos de datos ya que la columna Per_id aparece en muchas tablas y así sacaríamos información sobre la persona. En cambio, lo más óptimo es crear un juego de datos que contenga esta tabla y otras relacionadas con la persona como puede ser la tabla de nacimientos.

 

Cuando vayas a crear un juego de datos, sigue estos pasos:

  1. Revisa los juegos de datos existentes: es posible que ya existe un juego de datos similar al que estás pensando crear, o que las tablas que necesitas estén incorporadas en otro juego de datos superior. Es por eso que para no duplicar juegos de datos, es importante que eches un vistazo a lo que ya hay creado. Puedes buscar tanto en el buscador de la página principal com en el navegador, dentro de
    Datos → Juegos de datos. Como verás, los nombres son muy intuitivos, como se explica en el punto siguiente.

  2. Una vez hecha la revisión, si consideras que es necesario crear el juego de datos, procedemos con ello. Elegiremos un nombre representativo compuesto por los siguientes términos:

    1. JDD (mayúsculas).

    2. Nombre del esquema (mayúsculas): entre 3-5 letras (GRH, GRE, EST, PER, …).

    3. Nombre del área o conjunto (primera en mayúscula): No excesivamente largo pero suficientemente descriptivo (Coste Plantilla, Unidades Estructurales, Fichajes, …).

    4. Nombre del subárea o subconjunto (primera en mayúscula). Este nivel de detalle casi nunca será necesario. Aquí también puedes añadir otra información como por ejemplo el nombre de un usuario si el juego de datos va destinado a él y necesitas etiquetarlo de alguna manera.

 

Algunos ejemplos pueden ser JDD GRH Plazas, JDD PER Personas, JDD EST Estructuras o JDD GRH Coste plantilla pberbel.

  1. Una vez dentro del editor de creación de juegos de datos, elige todas las tablas que necesites. Aunque es menos frecuente, también puedes añadir ficheros externos o consultas manuales SQL. Establece todas las uniones dentro del Diagrama de unión. La mayoría de veces el tipo de unión que querrás utilizar es Izquierda (LEFT JOIN). Te quedará algo similar a la siguiente imagen:

image-20240530-121457.png
  1. Para cada columna, elige si es un atributo o una medida. Escoge medida para cualquier campo sobre el que se requiera hacer cálculos. A veces que sea un valor numérico no quiere decir que se vayan a hacer cálculos y seguirá siendo un atributo. Sin embargo, hay veces donde tenemos solo el valor 0 o 1 y si lo ponemos como medida podríamos hacer recuentos. Puedes utilizar la interfaz de ‘Metadatos’ (tienes que estar dentro de alguna tabla para que aparezca) para cambiar las características de las columnas de forma más rápida:

image-20240530-122004.png
  1. Estando dentro de CADA TABLA, haz clic sobre ‘Editar definición’. Aquí tienes dos opciones para el acceso a los datos:

    1. Activo: para obtener los datos más recientes.

    2. Almacenamiento en caché automático: para obtener los datos desde la caché.

Normalmente, la opción que vamos a marcar es ‘Activo’. Pocas veces utilizaremos la otra opción:

HAY QUE HACER ESTO CON CADA TABLA SI QUIERES QUE LOS DATOS ESTÉN ACTUALIZADOS

  1. Como último paso, haremos clic en el icono del disquet para guardar el juego de datos. Si aún no le hemos puesto un nombre (tenemos esta opción arriba a la izquierda, haciendo clic en su nombre actual), nos preguntará como queremos llamarle y seguiremos las pautas del punto 2.

 

3. Consejos a la hora de crear un juego de datos

Te recomendamos seguir los siguientes consejos a la hora de crear un juego de datos:

  1. En los campos que sean de tipo fecha, si te fijas, verás que por defecto siempre aparecen con el siguiente formato: dd/MM/yyyy hh:mm:ss.SSS tt (por ejemplo, 13/09/2024 12:00:00.000 a.m.). Casi siempre nos va a interesar que la fecha este en formato día y no en formato día más hora, como aparece aquí. Lo más interesante sería, al crear un juego de datos, los campos de fecha que sepamos con certeza que son de tipo Date, especificarlo directamente en el propio juego de datos. Es cierto que cuando trabajamos con libros de trabajo podemos cambiarlo allí también, pero con este paso nos ahorraremos que todos los usuarios tengan que hacerlo cuando trabajen con este juego de datos. Sigue estos pasos para conseguir este formato de fecha:

    1. En la pantalla de creación de un juego de datos, en la barra inferior donde tienes el Diagrama de unión y todas las tablas añadidas, elige la tabla en la cual quieres aplicar estos cambios.

    2. Haz clic en la columna de tipo fecha que quieras modificar para seleccionarla.

    3. Cambia el formato:

MUY IMPORTANTE: Aunque parezca que si le das a ‘Mostrar por’ y eliges ‘Día’, el resultado debería ser el mismo, no lo es. En el siguiente vídeo puedes ver como realizando esta acción, la fecha que aparece es un día anterior a la que teníamos.

 

  1. Evita utilizar el siguiente tipo de unión entre tablas.

Al usar este tipo de unión, hemos comprobado que las funciones de base de datos no funcionan cuando se utilizan campos de ese juego de datos como argumentos de las funciones.