Diferencia entre RDBMS y Hadoop

los diferencia clave entre RDBMS y Hadoop es que el RDBMS almacena datos estructurados mientras que Hadoop almacena datos estructurados, semiestructurados y no estructurados..

El RDBMS es un sistema de gestión de base de datos basado en el modelo relacional. El Hadoop es un software para almacenar datos y ejecutar aplicaciones en clusters de hardware básico.

CONTENIDO

1. Resumen y diferencia clave
2. ¿Qué es RDBMS?
3. Que es hadoop
4. Comparación lado a lado - RDBMS vs Hadoop en forma tabular
5. Resumen

¿Qué es RDBMS??

RDBMS significa Sistema de Gestión de Base de Datos Relacional basado en el modelo relacional. En el RDBMS, las tablas se utilizan para almacenar datos, y las claves e índices ayudan a conectar las tablas. Una tabla es una colección de elementos de datos, y ellos son las entidades. Contiene filas y columnas. Las filas representan una sola entrada en la tabla. Las columnas representan los atributos..

Por ejemplo, la base de datos de ventas puede tener entidades de clientes y productos. El cliente puede tener atributos como customer_id, name, address, phone_no. El elemento puede tener atributos como product_id, nombre, etc. La clave principal de la tabla de clientes es customer_id, mientras que la clave principal de la tabla de productos es product_id. La colocación de product_id en la tabla de clientes como una clave externa conecta estas dos entidades. Asimismo, las tablas también están relacionadas entre sí. Proporcionan integridad de datos, normalización y muchos más. Algunos de los RDBMS comunes son MySQL, MSSQL y Oracle. Utilizan SQL para consultas..

Que es hadoop?

El Hadoop es un marco de código abierto de Apache escrito en Java. Ayuda a almacenar y procesar una gran cantidad de datos en grupos de computadoras usando modelos de programación simples. El principal objetivo de Hadoop es almacenar y procesar Big Data., que se refiere a una gran cantidad de datos complejos. El rendimiento de Hadoop, que es la capacidad de procesar un volumen de datos dentro de un período de tiempo determinado, es alto.

Hay cuatro módulos en la arquitectura Hadoop. Son Hadoop comunes, YARN, Hadoop Distributed File System (HDFS) y Hadoop MapReduce. El módulo común contiene las bibliotecas y utilidades de Java. También tiene los archivos para iniciar Hadoop. Hadoop YARN realiza la programación de tareas y la administración de recursos de clúster.

Además, el Sistema de archivos distribuidos de Hadoop (HDFS) es el sistema de almacenamiento Hadoop. Utiliza la arquitectura maestro-esclavo. El nodo maestro es el NameNode y administra los metadatos del sistema de archivos. Otras computadoras son nodos esclavos o DataNodes. Ellos almacenan los datos reales. Por otro lado, Hadoop MapReduce realiza el cálculo distribuido. Tiene los algoritmos para procesar los datos. En el HDFS, el nodo maestro tiene un rastreador de trabajos. Se ejecuta el mapa reduce los trabajos en los nodos esclavos. Hay un rastreador de tareas para cada nodo esclavo para completar el procesamiento de datos y enviar el resultado al nodo maestro. En general, Hadoop proporciona un almacenamiento masivo de datos con un alto poder de procesamiento..

¿Cuál es la diferencia entre RDBMS y Hadoop??

RDBMS vs Hadoop

RDBMS es un software de sistema para crear y administrar bases de datos basadas en el modelo relacional.. Hadoop es una colección de software de código abierto que conecta muchas computadoras para resolver problemas que involucran una gran cantidad de datos y computación.
 Variedad de datos
RDBMS almacena datos estructurados. Hadoop almacena datos estructurados, semiestructurados y no estructurados..
Almacenamiento de datos
RDBMS almacena la cantidad promedio de datos. Hadoop almacena una gran cantidad de datos que RDBMS.
 Velocidad
En RDBMS, las lecturas son rápidas. En Hadoop, las lecturas y escrituras son rápidas..
Escalabilidad
RDBMS tiene escalabilidad vertical. Hadoop tiene escalabilidad horizontal..
Hardware
RDBMS utiliza servidores de gama alta. Hadoop usa hardware básico.
  Rendimiento
El rendimiento de RDBMS es mayor. El rendimiento de Hadoop es menor.

Resumen - RDBMS vs Hadoop

Este artículo discutió la diferencia entre RDBMS y Hadoop. La diferencia clave entre RDBMS y Hadoop es que RDBMS almacena datos estructurados mientras que Hadoop almacena datos estructurados, semiestructurados y no estructurados..

Referencia:

1. Punto de tutoría. "SQL RDBMS Concepts". , Punto de tutoriales, 8 de enero de 2018. Disponible aquí  
Punto 2.Tutoriales. "Tutorial de Hadoop". , Punto de tutoriales, 8 de enero de 2018. Disponible aquí  

Imagen de cortesía:

1.'8552968000'por Intel Free Press (CC BY-SA 2.0) vía Flickr