Skip to content

6. Bases de datos en AWS

6.1. Amazon RDS (Relational Database Service) de AWS

Amazon RDS es un servicio de bases de datos relacional totalmente administrado que simplifica la configuración, operación y escalabilidad de bases de datos en la nube. AWS se encarga de tareas operativas como copias de seguridad y actualizaciones, permitiendo a los desarrolladores centrarse en sus aplicaciones.

6.1.1. Características Principales

  1. Bases de Datos Compatibles: MySQL, PostgreSQL, MariaDB, Oracle y Microsoft SQL Server.
  2. Automatización: Tareas administrativas automatizadas, como configuración de hardware y aprovisionamiento de almacenamiento.
  3. Escalabilidad: Escalabilidad vertical y horizontal según las necesidades.
  4. Alta Disponibilidad: Réplicas de lectura y copias de seguridad automáticas para alta disponibilidad.
  5. Seguridad: Encriptación de datos en tránsito y en reposo, integración con Amazon VPC.
  6. Monitoreo y Métricas: Herramientas de monitoreo a través de Amazon CloudWatch.
  7. Parches y Actualizaciones: Aplicación automática de parches y actualizaciones.

6.1.2. Pasos Básicos para Crear una Instancia RDS

  1. Acceder al Panel de AWS: Ingresar a la consola de AWS y seleccionar "RDS" en el panel de servicios.
  2. Crear una Instancia: Hacer clic en "Crear base de datos" y seleccionar el motor de base de datos.
  3. Configurar Detalles: Definir detalles como nombre de la instancia, nombre de usuario, contraseña, etc.
  4. Configurar Opciones Avanzadas: Seleccionar opciones de red, seguridad y copias de seguridad.
  5. Revisar y Crear: Revisar la configuración y hacer clic en "Crear" para lanzar la instancia RDS.

La documentación oficial de Amazon RDS la puedes encontrar aqui

6.2. Amazon Redshfit

Amazon Redshift es un servicio de almacenamiento de datos en la nube proporcionado por Amazon Web Services (AWS). Se trata de un servicio de almacenamiento de datos completamente administrado que está diseñado para ofrecer un rendimiento rápido y eficiente en consultas de análisis sobre grandes conjuntos de datos.

6.2.1. Características Principales

  • Almacenamiento en columnas: Redshift organiza los datos de manera eficiente almacenándolos en columnas en lugar de filas, lo que mejora el rendimiento en operaciones analíticas y consultas ad hoc.
  • Escalabilidad: Puedes escalar fácilmente tu clúster de Amazon Redshift en función de las necesidades de tu carga de trabajo. Puedes aumentar o disminuir el número de nodos según sea necesario para adaptarte al tamaño y rendimiento requeridos.
  • Desempeño optimizado: Redshift utiliza técnicas de compresión, particionamiento y distribución de datos para garantizar un alto rendimiento en consultas analíticas complejas.
  • Totalmente administrado: AWS se encarga de la administración y mantenimiento del hardware y el software subyacentes, lo que permite a los usuarios centrarse en sus análisis en lugar de preocuparse por la infraestructura.
  • Seguridad: Ofrece capacidades de seguridad avanzadas, como la encriptación de datos en reposo y en tránsito, integración con AWS Identity and Access Management (IAM), y la posibilidad de definir reglas de firewall para controlar el acceso al clúster.
  • Integración con otras herramientas: Se integra fácilmente con otras herramientas y servicios de AWS, así como con diversas herramientas de análisis de datos y visualización, como Amazon QuickSight y Tableau.

La documentación oficial de Amazon Redshift la puedes encontrar aqui

6.3. Athena

Amazon Athena es un servicio de consulta que permite analizar datos almacenados en Amazon S3 utilizando consultas SQL estándar.

Elimina la necesidad de cargar datos en una base de datos, ya que opera directamente sobre los datos en S3.

Características principales:

  • SQL estándar: Utiliza consultas SQL estándar para analizar datos.
  • Sin servidor: No se requiere administración de infraestructura.
  • Integración con S3: Trabaja directamente con datos almacenados en Amazon S3.
  • Escalabilidad: Puede manejar grandes conjuntos de datos y escalar según las necesidades.

6.3.1. Cómo funciona

  • Metadatos y Esquemas:
    • Amazon Athena utiliza metadatos para entender la estructura de los datos almacenados en S3.
    • Puedes definir esquemas para organizar y facilitar la consulta de datos.
  • Particiones:
    • Organiza datos en particiones para mejorar la eficiencia de las consultas.
    • Mejora el rendimiento al restringir las consultas a particiones específicas.

6.3.2. Uso y Consultas

  • Inicio Rápido:
    • Accede a Athena desde la consola de AWS o mediante herramientas de terceros que admitan ODBC/JDBC.
    • Define tu base de datos y tabla utilizando metadatos o esquemas.
  • Consultas SQL:
    • Escribe consultas SQL para filtrar, transformar y analizar datos.
    • Utiliza funciones SQL estándar para realizar operaciones complejas.

AWS Athena