Cloud Storage y los tipos de almacenamiento

Ahorramos costos sin sacrificar el rendimiento al almacenar datos en diferentes clases de almacenamiento. Puede comenzar con una clase que coincida con su uso actual y luego reconfigurarla para ahorrar costos. Pero, tenemos 4 TIPOS de almacenamientos en GCP.

  • Almacenamiento estándar: Bueno para datos “calientes” a los que se accede con frecuencia, incluidos sitios web, transmisión de videos y aplicaciones móviles.
  • Nearline Storage: Bajo costo. Bueno para datos que se almacenan durante al menos 30 días, incluida la copia de seguridad de datos y el contenido multimedia de cola larga.
  • Almacenamiento en frío: Mu bajo costo. Bueno para datos que se pueden almacenar durante al menos 90 días, incluida la recuperación ante desastres.
  • Almacenamiento de archivos: El costo más bajo. Bueno para datos que se pueden almacenar durante al menos 365 días, incluidos los archivos reglamentarios.

Características

  • Almacenamiento ilimitado sin tamaño mínimo de objeto.
  • Accesibilidad mundial y ubicaciones de almacenamiento en todo el mundo.
  • Baja latencia.
  • Alta durabilidad (99,999999999% de durabilidad anual)
  • Redundancia geográfica si los datos se almacenan en una región múltiple o región dual.

Cloud SQL, Cloud Spanner, Cloud Big Table

Después de mucho tiempo, millones de dólares inversión y clientes de referencia en cada vertical importante, Google Cloud Platform finalmente se ha convertido en un competidor muy importante para Amazon Web Services y Microsoft Azure cuando se trata de infraestructura de nube. Si bien las ofertas de cómputo y almacenamiento de Google Cloud son más fáciles de entender, comprender las diferentes ofertas de bases de datos administradas no es tan sencillo.

Comparación de Bases de Datos en Google Cloud: Datastore vs BigTable bs Cloud SQL vs Spanner vs BigQuery

Cloud Data Store (no relacional)

Base de datos NoSQL altamente escalable con modelo de datos de documento, transacciones atómicas (pero no totalmente ACID), lenguaje de consulta tipo SQL y soporte para configuraciones región/multi-región.

Escala a Terabytes. Solo tiene transacciones atómicas y duraderas (lo que significa que no hay consistencia ni aislamiento). A diferencia de BigTable, Datastora está optimizado para un conjunto de datos más pequeño.

Caso de uso principales:

Alta transaccionalidad, aplicaciones existentes con datos de aplicación semiestructurados y datos jerárquicos, aplicaciones móviles y frameworks de desarrollo web.

Cloud Big Table (no relacional)

Base de datos NoSQL con modelo de datos widecolumn, de una sola región y altamente escalable con baja latencia y alto rendimiento.

Profundamente integrado con el ecosistema de Hadoop, incluida la compatibilidad de su API con la de HBase. Es bueno para aplicaciones de procesamiento analítico/transaccional. La usan los servicios internos de Google como la Búsqueda de Google, Google Maps y Gmail. Escala a Petabytes.

Caso de uso principales:

Aplicaciones que tienen una ingesta de datos frecuente, maneja millones de operaciones por segundo. Gran volumen de datos de Indutrias financiera, advertising, IoT. Sistemas de personalización y recomendaciones, conjuntos de datos geoespeciales y gráficos.

Cloud SQL

Es un RDMBS en alta disponibilidad que básicamente ofrece MySQL y PostgresSQL monolíticos como servicio administrado. No escala horizontalmente y su capacidad llega a un máximo de 10TB de almacenamiento y 416 GB RAM.

Es totalmente ACID compliant.

Que es ACID?
ACID (Atomicidad, consistencia, aislamiento, durabilidad) es un conjunto de propiedades de transacciones de base de datos destinadas a garantizar la validez incluso en caso de errores. Una secuencia de operaciones de base de datos que satisface las propiedades de ACID (y estas pueden percibirse como una sola operación lógica en los datos) se llama una transacción.

Por ejemplo, una transferencia de fondos de una cuenta bancaria a otra.

Casos de uso principales:

Es mejor para aplicaciones OLTP web y las aplicaciones existentes CRM, ERP, etc.

Qué es OLTP?

Procesamiento de transacciones en línea, se caracteriza por un gran número de transacciones cortas (INSERTAR, ACTUALIZAR, BORRAR).

El énfasis principal de los sistemas OLTP es en el procesamiento de consultas rápidas pero no complejas, manteniendo la integridad de los datos en entornos de acceso múltiple.

Cloud Spanner

Es un RDMBS también para aplicaciones OLTP, pero que necesiten una base de datos globalmente distribuida y altamente escalable. Cuenta con escalamiento horizontal y soporta Multi-región.

Escala a Petabytes y es ACID compliant.

Casos de uso principales:

Aplicaciones OLTP distribuidas, como catálogo de productos de retail, aplicaciones SaaS y juegos en línea.

Qué es un RDMBS?

Los sistemas de gestión de bases de datos relacionales (RDBMS) son compatibles con el modelo de datos relacional, orientado a tablas. El esquema de una tabla se define por el nombre de la tabla y un número fijo de atributos con tipos de datos fijos. Un registro o entidad corresponde a una fila en la tabla y consta de los valores de cada atributo.

BigQuery

Este es más bien un sistema de datawarehouse, de hecho, Google lo coloca en los productos de BigData y no de almacenamiento. Básicamente, es un base de datos Relacional SQL.

A diferencia de BigTable, se enfoca en los datos en una imagen grande y puede consultar un gran volumen de datos en poco tiempo. Como los datos se almacenan en un formato de datos en columnas, es mucho más rápido en el escaneo de grandes cnatidades de datos en comparación con BigTable.

BigQuery es realmente para el tipo de consulta OLAP y escanea una gran cantidad de datos y no esta diseñado para consultas del tipo OLTP.

Como comparación para pequeñas lecturas/escrituras, toma aproximadamente 2 segundos, mientras que BigTable toma aproximadamente 9 milisegundos para la misma cantidad de datos.

Casos de uso principales:

Elegir para explotación y procesamiento de macrodatos, línea, sistema de procesamiento con petabytes de escala, almacén de datos empresariales para análisis, generación de informes de estadísticas de grandes volúmenes de datos, BigData, ciencia de datos y análisis avanzados.

Que es OLAP?

Procesamiento analítico en línea, se caracteriza por un volumen relativamente bajo de transacciones.

Las consultas son a menudo muy complejas e involucran agregaciones. Las aplicaciones OLAP son ampliamente utilizadas por las técnicas de Data Mining.