Revista Digital Universitaria
ISSN: 1607 - 6079 Publicación mensual
 
1 de diciembre de 2012 Vol.13, No.12
  Inicio Ejemplares Directorio Quiénes somos Busca artículos Vínculos Contacto Mapa de sitio
 
Documento sin título
 
Dispositivos para el almacenamiento de grandes volúmenes de información “Big data”
Javier Salazar Argonza
CITA
PDF
   
Principales tecnologías de almacenamiento
¿Qué es el almacenamiento de objetos?
Bibliografía
Aumentar Letra Disminuir Letra Disminuir Letra   facebook
twitter
google
 

Introducción

Anteriormente una empresa o institución podía ser exitosa si obtenía datos importantes en el momento preciso. Actualmente, están preocupadas por aprovechar los millones de datos que se producen diariamente en cada una de sus áreas. Esto con el fin instrumentar modelos predictivos que les permitan hacer frente a los problemas que pueden tener un efecto negativo en su competitividad. En este sentido, la tendencia del mercado es la adquirir nuevos dispositivos y sistemas capaces de almacenar y procesar grandes volúmenes de información. Por tal motivo, este artículo pretende auxiliar al lector a elegir el mejor dispositivo de almacenamiento para sus necesidades de big data.

La gran cantidad de información disponible en bancos de datos, acervos digitales, y aquella que producen diariamente los sistemas de información a partir las actividades humanas (tales como: artículos o noticias publicadas en internet, información procedente de interacciones sociales, opiniones depositadas en portales sobre productos o servicios que nos interesan, información vertida en formularios de registro para el acceso a sistemas de información, etcétera), constituye un capital muy valioso. Algunos economistas lo consideran inclusive una especie de nuevo “oro” debido a que su análisis permite obtener información estratégica para:

  • Detección de conductas y patrones de consumo de clientes.
  • Establecimiento de modelos predictivos en la fabricación de productos o instrumentación de servicios, con el fin de hacer frente a los problemas antes de que puedan tener un efecto negativo en los clientes.
  • Conocer tendencias electorales.
  • Detectar delincuentes reincidentes en base a su historial de crímenes.
  • Anticipar problemas en comunidades estudiantiles.
  • Establecer tendencias de la moda.
  • Realizar reportes especializados.
  • Etcétera.

Las posibilidades de esta tendencia, a la que se conoce como “Big Data 1”, parecen infinitas. No obstante, su utilidad depende de quiénes y cómo procesen la información y sobre todo de que plataforma tecnológica dispongan para su explotación y aprovechamiento.

Por otra parte cuando hablamos de almacenar grandes volúmenes de información, estamos haciendo referencia a dispositivos especializados que tienen la capacidad de manejar con eficiencia grandes cantidades de datos: transaccionales, no estructurados, y basados en archivos en las escalas de gigabytes, terabytes, petabytes y zetabytes; que deben asegurar no solo la preservación de la información, sino también brindar un alto desempeño y permitir un crecimiento modular. De igual manera para el procesamiento de los datos, se requiere de nuevo software, capaz de explotar adecuadamente el hardware de tecnología reciente. Es decir, servidores con más de un procesador, procesadores con varios núcleos, clusters, etcétera. Esto en virtud de que el software tradicional de análisis nos puede resultar obsoleto en términos de desempeño.

Ahora bien, cuando tenemos la necesidad de adquirir una plataforma tecnológica para almacenar y procesar grandes volúmenes de información,  la principal incógnita a resolver es decidir cuál es la tecnología más adecuada para nuestras necesidades. Ya que este tipo de soluciones, por su grado de especialización, normalmente son poco conocidas, muy costosas y existen muchos riesgos en su instrumentación si no se toman las previsiones adecuadas. Por tal motivo en este artículo, se pretende dar algunas sugerencias que auxilien al lector, a realizar la mejor elección, específicamente en el rubro de los dispositivos de almacenamiento de grandes volúmenes de información.

Las sugerencias son las siguientes:  

  1. Identifique sus necesidades de almacenamiento de información. Estos datos le proporcionarán una idea clara de sus necesidades de almacenamiento y le ahorrarán mucho tiempo cuando solicite cotizaciones con los proveedores. Deberá recabar:

    • Tipo de información a almacenar. (Documéntela. En este rubro encontraremos una gran variedad de tipos de información).
    • Cantidad de información a almacenar y su crecimiento a corto, mediano y largo plazo.
    • Si la información es de misión crítica. (Es decir que tan rápido debe ser accedida por los usuarios finales).
    • Periodicidad con la que se actualizará la información y vigencia de misma.
    • Sus necesidades de preservación de la misma. (¿Deberá estar disponible para las próximas generaciones?)

  2. Reconozca los principales procesos que utilizarán el dispositivo de almacenamiento.

  3. Estime el número de usuarios tanto concurrentes como simultáneos que deberá soportar su plataforma.

  4. Tenga presente cuanto es su presupuesto disponible.

  5. Sabiendo que algunos de los dispositivos de almacenamiento que adquiera, seguramente van a fallar en algún instante de tiempo, la tecnología que elija deberá asegurarle que sus datos permanecerán intactos y que el tiempo de acceso a éstos no se degradará mientras se soluciona la falla.

  6. Examine las innovaciones tecnológicas disponibles en la plataforma que este evaluando. Esto le permitirá obtener mayores beneficios en su inversión. Por ejemplo: La característica de “procesamiento en NAS”, el manejo de objetos en base a metadatos, la posibilidad de realizar snapshots 2 ilimitados sin costo adicional, etcétera.

  7. Tenga a la mano los planos y el cálculo del área disponible en su site. Esto con el fin de establecer la mejor ubicación para albergar su hardware y planear el crecimiento a futuro.

  8. Tenga presentes los costos de adecuación de su site para recibir la solución que adquiera, así como la problemática asociada con la migración de la información que pueda tener en su sistema actual.

  9. Identifique los costos adicionales que generará la infraestructura física y lógica conforme se incrementa la capacidad de almacenamiento cada “n” gigabytes, terabytes o petabytes; en los rubros de energía eléctrica, personal administrativo, contrato de mantenimiento, disponibilidad de refacciones, etcétera.

  10. Determine las facilidades y costos de la replicación de información en la solución que elija, ya que realizar respaldos de información en dispositivos que pueden almacenar gigabytes, terabytes o más información, no es lo más recomendable.

  11. Asegúrese de que la solución permita un crecimiento modular de acuerdo a sus necesidades de almacenamiento actuales y futuras. Asimismo de que este crecimiento sea en cuestión de segundos sin interrumpir sus aplicaciones y de que preferentemente, se aumente el rendimiento de su dispositivo de almacenamiento (cluster) de forma lineal.

  12. Dependiendo de sus necesidades específicas de almacenamiento,  tenga precaución con las técnicas de comercialización que emplean algunos proveedores tales como: precios muy bajos, ó que le digan que sus equipos pueden manejar toda la capacidad de almacenamiento con un solo LUN (Logical Unit Number ó Número de Unidad Lógica)  y leyendas como la siguiente: “Almacenamiento tipo NAS”, las cuales pueden hacer que usted compre un dispositivo que no sea el adecuado para sus necesidades.

  13. Tenga cuidado con soluciones híbridas, ya que dispositivos de almacenamiento de diferentes marcas pueden tener diferente terminología y diferentes procesos para la asignación de los recursos ya sean LUN o grupos de LUN a un host  o de otra índole.

  14. Conozca las tecnologías de almacenamiento para grandes volúmenes de información disponibles en el mercado e identifique la utilidad de cada una de ellas. Consulte en la siguiente sección “las principales tecnologías disponibles para el almacenamiento de grandes volúmenes de información”.

  15. Solicite varias cotizaciones y dese tiempo para revisarlas con detalle. Cuide las garantías, tiempos de entrega, esquemas de licenciamiento y el nivel de soporte técnico que requiere.

  16. Prefiera soluciones tipo “llave en mano” que le aseguran que no faltarán accesorios o componentes (pendientes de comprar), para que su plataforma funcione.

1 Big Data: Es un término aplicado a conjuntos de datos que superan la capacidad del software y hardware habitual para ser almacenados, capturados, gestionados y procesados en un tiempo razonable. Big Data no está enfocado solo al tamaño, sino a la complejidad de los datos, en los cuales, el numero de variantes puede ser indeterminado, por lo cual, sus relaciones crean diversas formas de analizar o visualizar la información. El potencial de Big Data va más allá de la inteligencia empresarial tradicional, revelando patrones casi en tiempo real, con el fin de facilitar la mejora gradual de los procesos predictivos del negocio, e incluso plantear totalmente nuevos modelos de negocio.

2 Snapshot: Copia instantánea de un volumen. Es una copia instantánea del estado de un sistema en un momento determinado.

 
  subir        
 
metadatos en la red
  Editorial
 




Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons