Almacenamiento de OBJETOS vs Bloques en Big Data — AprenderBigData.com
En esta entrada vamos a explicar en qué consiste el almacenamiento de objetos vs el almacenamiento de bloques, cuáles son sus diferencias, sus aplicaciones, cómo elegir entre ellos y su uso en el Big Data.
¿Qué es el almacenamiento de objetos?
El almacenamiento de objetos (en inglés Object Storage) o almacenamiento basado en objetos consiste en tratar los datos de las unidades de almacenamiento como objetos.
Esta forma de almacenamiento se ha vuelto muy popular con los servicios en la nube como Amazon S3 o Azure Blob Storage.
Cada objeto se compone de ciertos elementos y características:
- Los propios datos que se desean almacenar en el objeto. Estos datos pueden ser cualquier conjunto de información. No se tienen por qué corresponder con un fichero.
- Metadatos. Los metadatos asociados a cada objeto pueden crecer y extenderse con nueva información relativa al dato. Son definidos por el creador del objeto y contienen toda la información que se considere de importancia para su almacenamiento. Comúnmente, entre estos metadatos se encuentra información de uso, fechas, permisos, etc.
- Identificador del objeto. Este identificador debe ser único, ya que se usa para localizar el objeto en nuestro sistema.
Es muy frecuente su uso para almacenamiento de datos que necesitan tener una alta disponibilidad y ser muy durables. Estas propiedades se consiguen habitualmente con técnicas de replicación (almacenando varias copias del dato en un sistema distribuido), de esta forma, aunque existan problemas en algunas partes del sistema, se puede seguir dando servicio sin interrupción. La replicación del dato también es útil para determinar automáticamente datos corruptos comparando el valor o el hash de cada objeto con el mismo valor calculado en sus copias.
Las fotos de Facebook y las canciones de Spotify usan este tipo de almacenamiento.
¿Qué es el almacenamiento de bloques?
El almacenamiento de bloques (Block Storage) consiste en dividir cada fichero en bloques de un tamaño fijo sin el uso de metadatos para determinar lo que es cada uno de estos bloques.
Esta estructura conduce a un mayor rendimiento cuando la aplicación y el almacenamiento son locales, pero tiene una latencia más alta cuando están separados.
Echa un ojo a la lista de reproducción Introducción al Big Data
Originally published at https://aprenderbigdata.com on December 25, 2019.