Guía de compra para integración Big Data

CITO Research – Buyer’s Guide to Big Data Integration

pentaho-big-data

La llegada de nuevos tipos de datos en cantidades sorprendentes, un fenómeno conocido como Big Data, está causando a CEOs y líderes de negocio replantearse su cartera de tecnología actual. Pocas empresas construirán su propia infraestructura. La mayoría la comprará. Pero ¿qué deben comprar? ¿Y cómo pueden poner las piezas juntas en un todo coherente?

El primer reto de Big Data es que requiere nueva tecnología y por otro lado, la llegada de Big Data no ha dejado todos los demás tipos de datos y tecnologías obsoletas. Hadoop, bases de datos NoSQL, bases de datos analíticas, y almacenes de datos conviven. A los analistas no les interesa de dónde los datos proceden: la tomarán de cualquier fuente.

El segundo reto es la integración de datos. ¿Cómo puede la nueva tecnología para el procesamiento de Big Data, utilizar todos los datos y la tecnología disponible? ¿Cómo puede la tecnología y los datos existentes ser mejorados mediante la adición de grandes volúmenes de datos? ¿Cómo pueden las nuevas formas de análisis y aplicaciones usar tanto lo viejo como lo nuevo?

CITO Research cree que los CEOs y líderes de negocios pueden acelerar el progreso, centrándose en la tarea de integrar el nuevo mundo de los grandes datos y el viejo mundo del BI. Esta guía del comprador describe cómo pensar acerca de la compra de tecnología para la integración de Big Data.

DESAFÍOS DE LA INTEGRACIÓN DE BIG DATA: NUEVO Y VIEJO

Desafíos que Big Data y datos existentes tienen en común:

  •  Fusionan datos de diferentes fuentes
  •  Apoyan la exploración
  •  Crean una única versión reutilizable de la verdad
  •  Construyen conjuntos de datos combinados para análisis más completos
  •  Expanden el uso de datos
  •  Crean entornos analíticos avanzados
  •  Apoyan solicitudes
  •  Controlan el acceso
  •  Gestionan el ciclo de vida del análisis
  •  Aseguran el cumplimiento

Mientras que Big Data pueden cambiar muchas cosas acerca de la manera en que BI se hace, no va a hacer BI obsoleto. Esto significa que el camino correcto para la integración de Big Data probablemente sea a través de soluciones de integración de datos existentes que han sido adaptados para incorporar Big Data.

LO QUE USTED NECESITA PARA LA INTEGRACIÓN DE BIG DATA

Para tomar la decisión correcta respecto al montaje de un sistema para la integración de Big Data, tenga en cuenta lo que se necesita. La mayoría de las organizaciones necesitarán las siguientes capacidades: Conectar, transportar y transformar

El acceso, el movimiento y la transformación de datos han sido el corazón de varias generaciones de tecnología de integración de datos. La integración de grandes datos añade algunos nuevos giros. El acceso a todo tipo de datos y la habilidad de descubrir o definir el esquema de los datos es crucial. La sincronización de datos entre repositorios se hace más complejo por lo que las herramientas de integración deben ser más sofisticadas para poder hacer frente al tráfico de datos y además deben poder hacer que el diseño y la implementación de transformaciones sea lo más sencillo posible. La integración de Big Data requieres la habilidad de procesar flujos de datos en tiempo real desde sistemas de mensajes, buses de servicio y archivos de logs de servidores.

Integración y formas canónicas

Con el fin de aprovechar al máximo el Big Data, es vital poder combinarlo con los datos existentes. Este tipo de integración de datos es crucial en todos los niveles de análisis, desde la limpieza de datos para la creación de repositorios con el propósito especial de apoyar visualizaciones avanzadas. Por tanto, es de vital importancia que la tecnología de integración de datos se combine tanto con Big Data como con las formas existentes de datos, frecuentemente almacenados en repositorios SQL.

En otras palabras, la clave es elegir la tecnología que nos habla tanto de la lengua materna de las fuentes de Big Data como Hadoop, bases de datos NoSQL y bases de datos analíticas, así como SQL tradicional. No haga de Big Data un silo mediante la creación de una infraestructura, equipo, y conjunto de habilidades por separado.

Exploración de datos

Cuando las empresas hacen uso de los datos, es vital que todos – analistas, usuarios finales, desarrolladores, y cualquier otra persona que esté interesado- sea capaz de jugar con los datos y hacer preguntas. Esta necesidad de examinar y jugar con los datos se requiere en todos los niveles del sistema.

No importa si los datos residen en un clúster Hadoop, una base de datos NoSQL, un repositorio con propósito especial, un entorno de análisis en memoria, o una aplicación. Los mejores resultados vendrán cuando alguien pueda lanzar una pregunta y ver si los datos pueden responder a ella.

Soporte de análisis

En el ámbito de Big Data, esto significa que todas las capacidades mencionadas hasta el momento deben estar presentes: mecanismos para la definición de las transformaciones fáciles de usar, capacidad de capturar y reutilizar transformaciones, capacidad de crear y gestionar almacenes de datos canónicos, y capacidad para ejecutar consultas, preferentemente utilizando visualizaciones. Por supuesto, todo esto tiene que estar presente en los repositorios de Big Data y aquellos que combinan todas las formas de datos.

BENEFICIO DE LA CORRECTA INTEGRACIÓN DE BIG DATA

Los datos no hacen ningún bien a menos que se presenten a un humano que pueda beneficiarse de alguna manera de ellos o al menos que se utilicen en un sistema automatizado diseñado por un humano. El punto de la integración de Big Data es que sea lo más fácil posible para acceder, entender, y hacer uso de los datos.

Las recompensas de obtener correctamente la integración de Big Data son los beneficios que provienen de la utilización de datos. La reducción de retrasos, la habilidad de eliminar los cuellos de botella, y hacer cada interacción encantadora, significa que una organización puede moverse más rápido y con mayor eficacia.

Con la compra de componentes y sistemas que forman parte de una visión coherente, es posible reducir el costo, pero sin comprometer las capacidades necesarias.

Las preguntas con las que iniciamos ahora deberían ser más fáciles de responder:

¿Qué comprar? Tan pocos sistemas como sea posibles, que proporcionen las capacidades que necesite ahora y en el futuro, de una manera que es fácil de usar y a prueba del futuro.

¿Cuál es el todo coherente? Una visión de la integración de Big Data que incorpora formas y fuentes de datos existentes en un nuevo sistema que soporta todas las fases de la cadena de suministro de datos.

Fuente: http://www.pentaho.com/product/big-data-analytics