SAS: La preparación de los datos es parte fundamental en el Big Data

Las modernas soluciones que existen actualmente en el mercado hacen cada vez más fácil manejar los grandes volúmenes de información, en la era del Big Data. Sin embargo, la empresa de software SAS se pregunta: ¿son necesarios tantos datos?

En otras palabras, si su solución de analítica puede organizarlos, consolidarlos y salir invicto dentro de este entorno de Big Data, ¿eso significa que estas nuevas herramientas de información pueden lograrlo con cualquier fuente de datos? La respuesta es un no rotundo, señala SAS.

Gracias a que existen estas herramientas capaces de todo, hay una tentación natural por soltar los datos a estas herramientas y esperar a ver qué sale. Sin embargo, para obtener el valor real, es necesario hacer algo más que simplemente dejar sus datos en manos de un software y esperar a que salga un informe automático.

Por ejemplo, aspectos como la calidad, el diseño y la estructura de un reporte deberían importarle y esto no es sólo responsabilidad de la solución con la que usted cuente.

La preparación de los datos es parte fundamental y por eso SAS propone algunos pasos que deben ser considerados como punto de partida para sacar el mayor provecho de su información antes de visualizarla en un informe.

1. No use columnas innecesarias. A veces usted conserva los datos de determinada manera, sólo porque vienen de la fuente original así. Analice muy bien sus datos para entender cuáles le aportarán valor y cuáles no.

2. Reduzca la distancia entre un campo y otro. A veces las casillas quedan largas debido a que se ajustan a la longitud del dato más grande. Analice qué puede hacer con estas cifras y sí es necesario mostrarlas completas.

3. Iguale el conjunto de datos para poder combinar filas. La dispersión de sus datos puede afectar negativamente el rendimiento y aumentar el tamaño de los datos cuando son escasos. Haga que sus datos estén al mismo nivel.

4. Trasponga datos desde filas a columnas. Algunas soluciones no sólo le ayudan a visualizar e informarse sobre los valores, sino que integran un análisis muy sofisticado tal como la previsión, los árboles de decisión y las correlaciones. Ubicando estos datos en columnas permite un análisis más sofisticado.

5. Reduzca la “cardinalidad” si es posible. Como la alta cardinalidad puede disminuir el rendimiento, es buena idea revisar cuáles datos tienen alta cardinalidad pero no la requieren y reducirla al mínimo.

Finalmente, no utilice estos pasos como un checklist, sino como un punto de partida para ayudarle a manejar sus datos.

TAGS: SAS, Big Data

RELACIONADAS

ÚLTIMA HORA ver todas

BLOGS ver todos

Revolución digitalPablo Bermudez

Bye bye Dubai... ¡Bienvenido NEOM! (1 de 3)

Herejías EconómicasGermán Alarco

Plan Estratégico de Desarrollo Nacional (PED...

El Vino de la Semana

Pisco, amor por el Perú

Te lo cuento fácilAlumnos de la Universidad del Pacífico

Guerra en Ucrania: un breve análisis del fac...

Economía para todosCarlos Parodi

Estados Unidos y China

WALL STREET VER TODOS

Será noticia

JOSÉ ANTONIO MONTENEGRO