imagen porcentaje

Matricúlate con los mejores descuentos

Programas Exclusivos UAH

imagen porcentaje

Matricúlate con los mejores descuentos

5 herramientas que tienes que conocer en Big Data

5 herramientas que tienes que conocer en Big Data

El mercado del Big Data avanza a pasos agigantados; decidir cuál es la mejor herramienta a implementar es una decisión importante, ya que de ella dependerán muchas de las decisiones de negocio. Nosotros te lo ponemos fácil para que no te comas la cabeza. Estás son 5 de las mejores herramientas que puedes encontrar:

1. Apache Hadoop

Apache HadoopUna solución muy recomendable para la gestión de grandes datos no estructurados, ¿sabes cuáles son sus principales ventajas?:

  • Tecnología escalable: permite un crecimiento fácil, sin estar atados a las características iniciales del diseño. Además gracias al procesamiento de MapReduce los archivos se pueden dividir en bloques de una forma fácil.
  • Almacenamiento barato: los datos que maneja son categorizados a través de miles de computadoras baratas, lo que supone un ahorro considerable de los costes.
  • Velocidad: permite ejecutar procesamientos y análisis muy rápidos.
  • Tolerante a fallos: permite recuperar datos de forma segura, teniendo siempre una copia disponible.

2. Apache Spark

Apache SparkUna herramienta de datos en batch y tiempo real con una API unificada para ambos modelos. El único hándicap de esta herramienta es que es necesario que conozcamos el lenguaje de programación Scala. Podemos destacar:

  • Código abierto: formado por comunidad muy activa. 300 de líneas de código (2015).
  • Rápida gestión y tolerancia a fallos: A pesar de ser de código abierto, su velocidad es grandísima y permite hacer cambios con una alta tolerancia a fallos.
  • Plataforma unificada para gestionar datos: gracias a la combinación de Spark SQL, Spark Streaming, MLlib y GraphX.
  • Consola interactiva: dispone de consolas interactivas para los lenguajes con los que se puede programar, Scala y Python.

3. Apache Flink

Apache FlinkHerramienta muy potente muy similar a Apache Spark pero con mejoras a destacar:

  • Infraestructura simplificada: basada en conceptos de MapReduce, MPP Database y sistemas de flujo de datos. El procesamiento en streaming permite simplificar la infraestructura minimizando el número de componentes.
  • Rapidez y consistencia: respuesta en milisegundos y resultado correcto en caso de errores.
  • Tolerancia alta a los fallos: a través de un sistema de snapshots distribuidos.
  • APIs intuitivas multilenguaje: Scala, Python y Java.

4. Apache HBase

Apache HBaseSistema de almacenamiento de datos distribuido y escalable basado en ficheros HDFS. Su principal ventaja es que permite la actualización y el acceso aleatorio a los datos.

  • Análisis en tablas de HBase: mediante la integración con Apache Phoenix, Apache Hadoop, Apache Hive o Apache Pig se pueden ejecutar informes, consultas SQL y otros trabajos de análisis de forma masiva con datos ya almacenados.
  • Ejecución rápida a escala: Apache HBase está diseñado para mantener la ejecución a la vez que escala cientos de nodos, respaldando miles de millones de filas y millones de columnas.
  • Modelo de datos flexible: Es capaz de almacenar versiones anteriores y acceder con facilidad al historial. Además realiza el almacenamiento en columnas anchas permitiendo definir columnas arbitrarias para cada fila con fines de filtrado.

 5. Presto

PrestoMotor de consultas SQL que permite relacionar información de diferentes sistemas de almacenamiento de forma unificada sin necesidad de mover los datos a una única plataforma. Destacamos las siguientes funcionalidades:

  • Rendimiento de las consultas: ejecuta consultas en memoria, canalizadas mediante la red entre etapas. Ejecuta varias etapas en paralelo y transmite datos de una etapa a la siguiente a medida que están disponibles.
  • Compatibilidad con ANSI SQL: compatible con el estándar ANSI SQL, que facilita a los desarrolladores y analistas de datos realizar consultas tanto en datos estructurados como no estructurados a escala.
  • Facilidad de uso: posibilidad de usar herramientas como Amazon EMR o Airpal, una herramienta de ejecución de consultas basada en la Web que Airbnb suministra con código abierto.
  • Capacidad analítica multiplataforma: Presto trabaja con diferentes distribuciones de Hadoop y puede ser localizado desde una plataforma Haddop para realizar consultas en bases de datos relacionales o almacenes de datos en propiedad.

Si quieres formarte en estas y otras herramientas imprescindibles en Big Data, puedes hacerlo a través de la Carrera Profesional de Big Data y Business Intelligence Oficial de BigML y Microstrategy, o el Máster en Big Data y Análisis de Datos – Oficial de BigML. ¡Infórmate y reserva tu plaza!

Fuente: bbvaopen4u.com

 

11/09/2018 | , , , , | Big Data, BI y Marketing Online Blogs Destacadas

Miriam Martínez

Miriam Martínez

Escribe tu
Comentario

Si quieres personalizar tu avatar, click aquí.
Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *
Recuerda que los comentarios deben ser revisados por un administrador.

O si lo prefieres, déjanos tus datos y nosotros te llamamos.

*Selecciona una titulación

Te llamamos sin compromiso

Puedes llamarnos al 91 401 07 02 (Centro Maldonado) o al 91 435 58 43 (Centro Povedilla).

Si lo prefieres, déjanos tus datos y nosotros te llamamos.

Solo hasta el 25 de marzo

¡MATRÍCULA

GRATIS!

Solo quedan


*Consulta condiciones aquí
5 herramientas que tienes que conocer en Big Data
Buzón de Sugerencias
SOLICITAR UNA CLASE DE PRUEBA GRATUITA
5 herramientas que tienes que conocer en Big Data

Horario atención al cliente

  • Lunes a viernes

    • De 9 a 14 horas
    • De 16 a 21 horas
  • Sábados

    • De 9 a 14 horas

Teléfono de contacto: 91 435 58 43

Solicita información sobre
Envíanos tu opinión sobre CICE
Nosotros te asesoramos

¿No te decides?

Nosotros te ayudamos. Utiliza nuestro buscador avanzado para encontrar el curso que quieres.