Imagen de avatar anacareaga
Ana Lilia Careaga

Cassandra: la base de datos de origen mitológico

Ana Lilia Careaga Mercadillo, Febrero de 2014
Abstract

The ancient Greeks told the story of Cassandra, the daughter of King Priam and Queen Hecuba of Troy. She was one of the most beautiful women of her generation. When offered the gifts of a prophetess by the Greek god Apollo, she quickly accepted, but when she later spurned his amorous advances, Apollo cursed her to always know the truth and never be believed by any to whom she spoke it. Thanks to her gift of prophesy, Cassandra foresaw the trap presented by the Trojan horse, but thanks to her curse of disbelief, no one in Troy would listen to her warnings. They brought the horse within the city walls, and unwittingly invited the Greek soldiers hidden therein into the city, which led to Troy’s fall. Cassandra was taken as a war prize back to Greece by Agamemnon, where she again foresaw the future: his (and her) death, but was again disbelieved—and, sure enough, both he and she were killed. Modern computer science geeks tell the story of Cassandra a little differently, as Apache Cassandra, another of the “NoSQL” databases—and a popular one at that—in use at a variety of well-known Internet-based companies (Twitter, Facebook, Netflix and others), and presumably one whose reports are actually taken at face value. Apache Cassandra is an open source distributed database management system designed to handle large amounts of data across many commodity servers, providing high availability with no single point of failure.
———————————————————————————————————


Introducción

Indudablemente, es difícil creer que haya un remanso de tranquilidad en medio del vertiginoso ritmo de la Ciudad de México, pero créanlo y experiméntelo ustedes mismos visitando la Sala Nezahualcóyotl en el Centro Cultural Universitario de la UNAM, donde la experiencia de asistir a un concierto comienza desde que uno se acerca a este Centro Cultural, parcialmente oculto por la piedra volcánica y la abundante vegetación que ha crecido en los casi 38 años desde su inauguración, donde la Sala “Neza”, como la conocemos ahora, parece surgir del pedregal de los restos de lava que nos dejó el volcán Xitle. Inspirada en el “Concertgebou” de Ámsterdam y en la Sala sede de la Orquesta Filarmónica de Berlín, Eduardo Mata (1942-1995) , reconocido compositor y director de orquesta mexicano, tenía una idea clara de cómo tenía que ser esta sala, cuyo proyecto fue confiado al arquitecto Arcadio Artis [1] y a Christopher Jaffe para el diseño acústico. La sala es acogedora, con el público rodeando el escenario de manera que existe una relación más íntima entre los músicos y los asistentes; pero lo más importante de este recinto es el excelente sonido reverberado por una cámara acústica ubicada abajo del escenario y que se complementa con unos reflectores acústicos de acrílico suspendidos en su parte superior. De esta manera es que fue posible balancear los diferentes componentes de la reflexión acústica (dirección ,amplitud, frecuencia y tiempo) para lograr que la música pudiera escucharse con la misma claridad desde cualquier punto de la sala.

Todos hemos sentido emociones escuchando música y sabemos que es una manifestación espiritual del hombre. Sin embargo, la música es una de las artes que presenta más dificultades cuando queremos describirla. Incluso, la filosofía, ámbito al que no podemos acusar de no haber intentado pensar en diversos temas, ha tropezado permanentemente en su intento. Todos podemos, a grandes rasgos, describir con palabras el contenido de una obra literaria o de una película así como también podríamos reconocer en una obra plástica, ya sea pintura, escultura o arquitectura, lo que hay ellas. Pero, ¿cómo relatarle a otro una sinfonía de Mozart o una sonata para piano de Beethoven? O incluso, cómo transmitir verbalmente una canción escuchada en la radio, sin tener que tararear la melodía?

¿Qué representa la música? ¿Qué expresa? ¿Cómo se articulan los sonidos para transmitir emociones? No lo sé, pero la experiencia de estar ahí, inmerso en esta especie de nave polígona, después de que el director marca la anacrusa y los músicos comienzan a hacer sonar sus instrumentos es inexplicable al mismo tiempo que maravillosa porque comenzamos a llenarnos de emoción. Pero no sólo eso tiene la música porque también podemos presenciar a través de cada obra musical una realidad histórica que nos retrocede en el tiempo mientras nos vamos llenando de sensaciones que alimentan nuestro espíritu. Hace algunos días pude experimentarlo particularmente en esta Sala , en la cual, por un momento sentí que era la casa de Euterpe (Musa griega de la música, protectora del arte de tocar la flauta), porque en esa noche, un “solo” de oboe, en medio de un allegro poderoso y brillante me dibujó diferentes personajes de la Mitología Griega como si estuvieran grabadas acústicamente sus figuras en esas piedras de lava. Escuchábamos la Obertura de Las Ruinas de Atenas, op113 de Ludwig van Beethoven, una obra poco conocida y quizá solo reconocida en su música incidental, como la Marcha Turca, la cual tuvo el desafortunado destino de acompañar los programas del “Chavo del Ocho”.

El pasaje inicial de esta obertura , lento pero con un matiz algo dramático, hace aparecer a la diosa Atenea, hija del poderoso Zeus. Zeus es el rey del Olimpo, el dios de dioses, dotado de un poder absoluto; razón por la cual se le representa portando un cetro, símbolo de poder. Hijo de Cronos y Rea está marcado desde su nacimiento por una leyenda porque a su padre, Cronos, se le había pronosticado en un oráculo que uno de sus hijos lo destronaría, por lo que siempre se devoraba a sus hijos al nacer. Sin embargo, cuando nació Zeus, Rea lo tuvo en secreto para salvarlo. Zeus es conocido por sus numerosas aventuras y amantes, fruto de las cuales tuvo muchos hijos que fueron tanto héroes como deidades, como la misma Atenea, Apolo, Artemisa, Hermes, Dionisio, Helena, entre otros. Por su parte, Atenea, conocida como Minerva por los romanos, es la hija favorita de Zeus, diosa de la guerra, civilización, sabiduría, estrategia de las artes, de la justicia y de la habilidad [2]. Ella es guerrera, poderosa, campeona. Combate ante Troya del lado de los griegos porque Paris[3] le ha negado el primer premio de belleza en un concurso. Ares es su enemigo debido a su instinto criminal y su sed de sangre, pero ella no combate de esa manera, utiliza la astucia, la estrategia, y de ser necesario, la magia. Atenea recibió culto en toda la Antigua Grecia y tuvo influencia desde las colonias griegas de Asia Menor hasta la península ibérica y norte de África.

Aunque Beethoven escribió en 1811 esta música incidental para la obra teatral del dramaturgo alemán August Friedrich von Kotzebue, titulada bajo el mismo nombre “Las Ruinas de Atenas”, la cual consta de esta breve obertura así como de coros, arias y la famosa Marcha Turca, cabe aclarar que la trama original está apegada a la obra teatral y no propiamente a la mitología griega.En la época en que fue compuesta esta obra, Grecia formaba parte del Imperio Otomano. De acuerdo al libreto de Kotzebue, la diosa Atenea, hija del poderoso Zeus, se despierta después de miles de años y comprueba que las construcciones que alguna vez fueron espléndidas en la ciudad que lleva su nombre están en ruinas. La diosa exhorta a sus compatriotas a la rebelión contra los opresores. Atenea viaja a Budapest, acompañada por el dios Hermes, para pedir ayuda al emperador de la monarquía de los Habsburgo. En la capital húngara ambos dioses tienen la ocasión de asistir a la inauguración del nuevo teatro de la ciudad y son testigos del triunfo de las musas Talía y Melpómene[4] .

Pero lo maravilloso de la música es que en su abstracción, hace llegar al que la escucha, variadas experiencias, las cuales en esta particular obra fueron para mí la presencia de diversos personajes mitológicos. La obertura dura apenas 6 minutos, pero suficientes para refrescar las principales deidades y héroes de la mitología griega, la cual, sin duda, es una de las más apasionantes y extensas. El crescendo final que antepone Beethoven a sus arias y coros nos invoca a recordar todos esos relatos fascinantes de la mitología griega que han hecho que su conocimiento trascienda no solo en la música sino en todas las artes. Pero además de trascender en las artes, también lo ha hecho en numerosas ocasiones en la tecnología, como es el caso de Cassandra (en castellano, Casandra) , un tipo de base de datos empleada en Facebook y Twitter. En griego antiguo, Casandra (Κασσάνδρα) significa “la que enreda a los hombres” y en la mitología griega es hija de Príamo y Hécuba, reyes de Troya y es hermana gemela de Héleno. De Casandra se conocen diferentes versiones, una de ellas es que al nacer, se hizo una fiesta en el templo de Apolo, en las afueras de Troya. Al anochecer, los padres se marcharon y dejaron a los bebés en el templo por un olvido. Al día siguiente, cuando regresaron a recogerlos, los gemelos estaban dormidos y dos serpientes les pasaban la lengua por los órganos de los sentidos para purificarlos. Los padres empezaron a gritar de angustia, ante lo cual las serpientes se retiraron. Fue así como Casandra y Héleno tuvieron el don profético cuando fueron adultos. Otra versión de la leyenda, transmitida directamente a través de la Ilíada de Homero, indica que Apolo se había enamorado de Casandra y le prometió a la joven el don de la profecía si aceptaba entregarse a él. Ella aceptó, pero una vez iniciada en las artes de la adivinación, se negó a cumplir su parte del trato. Ante esto, Apolo le escupió en su boca y le retiró el don de la persuasión, por lo que aunque ella dijera la verdad, nadie le creería. Lo que sucedía con su don de profecía, es que el dios Apolo tomaba posesión de ella, y en ese estado ella formulaba los oráculos. Casandra es fundamentalmente conocida por sus predicciones en dos momentos cruciales en la historia de Troya. El primero ocurre cuando ella predice que Paris -siendo desconocido- traerá la ruina a la ciudad. Cuando éste va a ser condenado a muerte, ella reconoce en último momento que el joven es hijo de Príamo, y por lo tanto su hermano. Después, cuando Paris aparece con Helena en Troya ella indica que este hecho provocará la ruina de la ciudad, pero nadie la escucha. Luego, después de la muerte de Héctor, cuando regresa Príamo [5], ella descubre que su padre trae el cadáver de su hermano antes de que este hecho se sepa. Además, se opone rotundamente junto con el adivino Laocoonte a que se introduzca el famoso caballo de madera, pues ella sabía que éste era una trampa y que adentro venían guerreros aqueos [6]. Por supuesto, nadie le cree y Apolo envía unas serpientes para que devoren a Laocoonte [7] y a sus hijos. Por eso, los troyanos permiten que el caballo entre en la ciudad. Durante el saqueo, Casandra se oculta en el templo de Atenea, pero Áyax (legendario héroe de la Guerra de Troya que pelea junto con su primo Aquiles) la persigue. Ella se abraza a la diosa Atenea, pero Áyax no se detiene y la arranca de ésta, provocando que la estatua se tambalee. Ante esto, los troyanos se ofenden y van a lapidar al joven guerrero, pero éste se refugia en el templo que acaba de ofender y se salva. Posteriormente, cuando los aqueos se reparten el botín, Casandra es entregada a Agamenón, quien se enamora perdidamente de la joven. Ella se había mantenido virgen hasta el momento, pero ahora le pertenece a Agamenón y de él tiene aparentemente unos gemelos llamados Teledamo y Pélope. Según una versión, cuando Agamenón llega a Micenas, su esposa Clitemnestra lo mata y asesina a Casandra por celos, aun cuando ella misma tenía un amante.

Es así que, de esta historia de la mitología griega , surgió la otra Cassandra, un proyecto de Apache Software que busca tener los poderes proféticos de Casandra. Apache Cassandra es una base de datos escrita en Java, NoSQL distribuida y basada en un modelo de almacenamiento clave-valor lo que le permite tener una gran disponibilidad y manejo de altos volúmenes de información, razón por la cual la emplean Netflix, Facebook y Twitter como parte de su plataforma.

A veces pienso que la mitología griega tiene más sentido que lo que pronosticamos en nuestra industria del software porque para el programador/ desarrollador, Cassandra, el software, puede ser sólo tan confuso como las predicciones de Casandra sobre Troya. Dispone “de un código abierto, base de datos distribuida, descentralizada, elásticamente escalable, altamente disponible, tolerante, tuneably consistente, orientada en la columna de que basa su diseño de distribución Dynamo de Amazon y su modelo de datos en Bigtable de Google” [ “Cassandra: La guía definitiva,”O ‘ Reilly Media, 2010, p. 14].

¿Quieres saber más sobre Cassandra ?

Continúa leyendo…

Comenzando con lo básico: Qué es una Base de Datos

El término de base de datos fue escuchado por primera vez en 1963, en un simposio de Informática celebrado en California, USA. Una base de datos es un conjunto de datos que están organizados para un uso determinado y el conjunto de programas que permiten gestionar estos datos es lo que se denomina Sistema Gestor de Base de Datos (DBMS).Casi todos los sistemas de gestión de bases de datos modernos almacenan y tratan la información utilizando un modelo de gestión de datos relacional, en los cuales la información se organiza a través de tablas. Las tablas almacenan información sobre un tema como pueden ser los clientes de una empresa, o los pedidos realizados por cada uno de ellos. Cada tabla tiene una o más columnas y filas. Las columnas, llamadas “campos”, guardan una parte de la información sobre cada elemento que queramos guardar en la tabla y cada fila de la tabla conforma un registro. Por lo que todos los campos de un cliente forman un registro y todos los datos de otro cliente forman otro registro.

Entre las principales características de los sistemas de base de datos podemos mencionar[8]:
• Independencia lógica y física de los datos.
• Redundancia mínima.
• Acceso concurrente por parte de múltiples usuarios.
• Integridad de los datos.
• Consultas complejas optimizadas.
• Seguridad de acceso y auditoría.
• Respaldo y recuperación.
• Acceso a través de lenguajes de programación estándar.

Por otra parte, cada Sistema de Base de Datos posee diferentes tipos de campos que pueden ser similares o diferentes. Entre los más comunes podemos nombrar:

• Numérico: entre los diferentes tipos de campos numéricos podemos encontrar enteros “sin decimales” y reales “decimales”.
• Booleanos: poseen dos estados: Verdadero “Si” y Falso “No”.
• Memos: son campos alfanuméricos de longitud ilimitada. Presentan el inconveniente de no poder ser indexados.
• Fechas: almacenan fechas facilitando posteriormente su explotación. Almacenar fechas de esta forma posibilita ordenar los registros por fechas o calcular los días entre una fecha y otra.
• Alfanuméricos: contienen cifras y letras. Presentan una longitud limitada (255 caracteres).
• Autoincrementables: son campos numéricos enteros que incrementan en una unidad su valor para cada registro incorporado. Su utilidad resulta: Servir de identificador ya que resultan exclusivos de un registro.

Resumiendo, los campos son los distintos tipos de datos que componen la tabla, por ejemplo: nombre, apellido, domicilio. La definición de un campo requiere: el nombre del campo, el tipo de campo, el ancho del campo, etc. Los registros constituyen la información que va contenida en los campos de la tabla, por ejemplo: el nombre del paciente, el apellido del paciente y la dirección de este.

Clasificación de las Bases de Datos

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto que se esté manejando o a su utilidad.

Según la variabilidad de los datos almacenados se clasifican en estáticas y dinámicas. Las estáticas son nada más de lectura y son empleadas para almacenar datos históricos y las dinámicas son las que pueden modificarse en el tiempo, como por ejemplo los inventarios.

Según el contenido, pueden clasificarse en bases de datos bibliográficas o de texto completo de uso genérico.

Modelos de Bases de Datos [9]

Además de la clasificación por la función de las bases de datos, éstas también se pueden clasificar de acuerdo a su modelo de administración de datos. Un modelo de datos es básicamente una “descripción” de algo conocido como contenedor de datos (algo en donde se guarda la información), así como de los métodos para almacenar y recuperar información de esos contenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la implementación de un sistema eficiente de base de datos; por lo general se refieren a algoritmos y conceptos matemáticos.

Algunos modelos con frecuencia utilizados en las bases de datos son:

Bases de datos jerárquicas

En este modelo los datos se organizan en forma de árbol invertido (algunos dicen raíz), en donde un nodo padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas. Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que manejan un gran volumen de información y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento. Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos.

Base de datos de red

Éste es un modelo ligeramente distinto del jerárquico; su diferencia fundamental es la modificación del concepto de nodo: se permite que un mismo nodo tenga varios padres (posibilidad no permitida en el modelo jerárquico). Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución eficiente al problema de redundancia de datos; pero, aun así, la dificultad que significa administrar la información en una base de datos de red ha significado que sea un modelo utilizado en su mayoría por programadores más que por usuarios finales.

Bases de datos transaccionales

Son bases de datos cuyo único fin es el envío y recepción de datos a grandes velocidades, estas bases son muy poco comunes y están dirigidas por lo general al entorno de análisis de calidad y datos de producción e industrial. Un ejemplo habitual de transacción es el traspaso de una cantidad de dinero entre cuentas bancarias. Normalmente se realiza mediante dos operaciones distintas, una en la que se decrementa el saldo de la cuenta origen y otra en la que incrementamos el saldo de la cuenta destino. Para garantizar la atomicidad del sistema (es decir, para que no aparezca o desaparezca dinero), las dos operaciones deben ser atómicas, es decir, el sistema debe garantizar que, bajo cualquier circunstancia (incluso una caída del sistema), el resultado final es que, o bien se han realizado las dos operaciones, o bien no se ha realizado ninguna.

Bases de datos relacionales

Éste es el modelo utilizado en la actualidad para modelar problemas reales y administrar datos dinámicamente. Tras ser postulados sus fundamentos en 1970 por IBM, no tardó en consolidarse como un nuevo paradigma en los modelos de base de datos. Su idea fundamental es el uso de “relaciones”. Estas relaciones podrían considerarse en forma lógica como conjuntos de datos llamados “tuplas” En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la base de datos. La información puede ser recuperada o almacenada mediante “consultas” que ofrecen una amplia flexibilidad y poder para administrar la información. El lenguaje más habitual para construir las consultas a bases de datos relacionales es SQL, Structured Query Language o Lenguaje Estructurado de Consultas, un estándar implementado por los principales motores o sistemas de gestión de bases de datos relacionales.

Bases de datos multidimensionales

Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creación de Cubos OLAP (OnLine Analytical Processing)

Bases de datos orientadas a objetos

Este modelo, bastante reciente, trata de almacenar en la base de datos los objetos completos (estado y comportamiento).Una base de datos orientada a objetos es una base de datos que incorpora todos los conceptos importantes del paradigma de objetos: Encapsulación, herencia y polimorfismo. SQL: 2003, es el estándar que, soporta los conceptos orientados a objetos y mantiene la compatibilidad con SQL92.

Bases de datos documentales

Permiten la indexación a texto completo, y en líneas generales realizar búsquedas más potentes. Tesaurus es un sistema de índices optimizado para este tipo de bases de datos.

Bases de datos deductivas

Un sistema de base de datos deductiva, es un sistema de base de datos pero con la diferencia de que permite hacer deducciones a través de inferencias. Se basa principalmente en reglas y hechos que son almacenados en la base de datos. Las bases de datos deductivas son también llamadas bases de datos lógicas, a raíz de que se basa en lógica matemática. Este tipo de base de datos surge debido a las limitaciones de la Base de Datos Relacional de responder a consultas recursivas y de deducir relaciones indirectas de los datos almacenados en la base de datos.

Tipos de Gestores de Bases de Datos

Entre los diferentes tipos de gestores de bases de datos, podemos encontrar los siguientes:

• MySQL : es una base de datos de software libre, con licencia GPL basada en un servidor. Se caracteriza por su rapidez. No es recomendable usar para grandes volúmenes de datos.
• PostgreSql y Oracle: Son sistemas de base de datos poderosos. Administran muy bien grandes cantidades de datos, y suelen ser utilizadas en intranets y sistemas de gran calibre.
• Access: Es una base de datos desarrollada por Microsoft. Esta base de datos, debe ser creada bajo el programa Access, el cual crea un archivo .mdb .
• Microsoft SQL Server: es una base de datos más potente que Access desarrollada por Microsoft. Se utiliza para manejar grandes volúmenes de informaciones.
• Apache Cassandra: es una base de datos NoSQL distribuida y basada en un modelo de almacenamiento de “clave-valor”, escrita en Java. Permite grandes volúmenes de datos en forma distribuida.

APACHE CASSANDRA [10]

Cassandra es un sistema gestor de base de datos, NoSQL descentralizada; hoy en día es un proyecto de Apache. Cassandra fue desarrollado por Facebook (la versión original fue escrita por un ex empleado de Amazon y otro de Microsoft), en el 2008 fue liberado como un proyecto open source en Google Code, en el 2009 se convirtió en un proyecto “ Apache Incubator ” y finalmente en el 2010 se convirtió en un proyecto TOP-LEVEL. Algunas de sus características a comentar son:

• Orientada a columnas.
• Está escrita en Java.
• Permite modificar la consistencia de los datos.
• Se puede hacer uso de CQL(Cassandra Query Language)
• Bajo una licencia Apache
• Es mantenida por la organización Apache.
• La usan grandes organizaciones como Facebook o Twitter.
• Tiene herramientas para administrar los nodos de forma gráfica
• Fácil de instalar

¿Pero…qué es NoSQL?

Cuando hablamos de NoSQL(Not Only SQL) nos referimos a un sistema gestor de base de datos no relacional, esto generalmente conlleva una serie de características que en algunos casos son deseables.

• La estructura de los datos puede no ser fija.
• No garantizan completamente las propiedades ACID
(Atomicity, Consistency, Isolation and Durability) [11]
• Son fácilmente escalables.
• Pueden manejar una gran cantidad de datos.
• No usan SQL como lenguaje de consulta.

Dicho en pocas palabras, Cassandra es un almacén de datos “orientado a la columna”, lo que significa que en lugar de almacenar idénticamente estructurando “tuplas” de datos ordenados de acuerdo a una estructura fija (el esquema de la tabla), Cassandra almacena “familias de columna” en “keyspaces.” En términos más descriptivos, Cassandra asocia un valor de clave con un número variable de pares nombre/valor (columnas) que puede ser totalmente diferente de “fila” de uno a otro.

Cassandra puede manejar varios terabytes de datos así como millones de archivos, incluso en un cluster pequeño, por lo que se ha planteado esta tecnología como clave en aplicaciones del tipo “Big Data”, la cual es claramente la tendencia más comentada en el sector de las Tecnologías de Información debido al avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a una base de datos relacional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales.

Conclusiones

Los seres humanos estamos creando y almacenando información constantemente y cada vez más en cantidades astronómicas. Se podría decir que si todos los bits y bytes de datos del último año fueran guardados en CD’s, se generaría una gran torre desde la Tierra hasta la Luna y de regreso.

Esta contribución a la acumulación masiva de datos la podemos encontrar en diversas industrias, porque las compañías mantienen grandes cantidades de datos transaccionales, reuniendo información acerca de sus clientes, proveedores, operaciones, etc., de la misma manera sucede con el sector público. En muchos países se administran enormes bases de datos que contienen datos de censo de población, registros médicos, impuestos, etc., y si a todo esto le añadimos transacciones financieras realizadas en línea o por dispositivos móviles, análisis de redes sociales (en Twitter son cerca de 12 Terabytes de tweets creados diariamente y Facebook almacena alrededor de 100 Petabytes de fotos y videos) [12] , ubicación geográfica mediante coordenadas GPS, en otras palabras, todas aquellas actividades que la mayoría de nosotros realizamos varias veces al día con nuestros “smartphones”, estamos hablando de que se generan alrededor de 2.5 quintillones de bytes diariamente en el mundo. Muchas organizaciones se enfrentan a la pregunta sobre ¿qué información es la que se debe analizar?, sin embargo, el cuestionamiento debería estar enfocado hacia ¿qué problema es el que se está tratando de resolver?

Todas esas montañas de información han generado un costo potencial al no descubrir el gran valor asociado. Por lo que la respuesta a estas preguntas se ha planteado con diferentes ángulos, pero bajo un mismo acercamiento, al cual se le conoce como Big Data. Desde luego, el ángulo correcto que actualmente tiene el liderazgo en términos de popularidad para analizar enormes cantidades de información es la plataforma de código abierto Hadoop y bases de datos Cassandra.

[1] Arcadio Artis Espriu, arquitecto mexicano egresado de la Facultad de Arquitectura de la UNAM en 1971. Desarrolló el proyecto del Centro Cultural Universitario, en particular la Sala Nezahualcóyotl. Actualmente se dedica a la pintura.

[2]  Citado en http://es.wikipedia.org/wiki/Atenea

[3] En la  mitología griega, Paris ( en griego antiguo, Aléxandros, ‘el protector del hombre’) fue un príncipe  troyano, hijo del rey  Príamo y de su esposa  Hécuba. Paris fue conocido como “El de la hermosa figura”

[4] En la  mitología griega  las musas eran, según los escritores más antiguos ,las  diosas inspiradoras de la música y, según las nociones posteriores, divinidades que presidían los diferentes tipos de  poesía, así como las  artes  y las  Ciencias. Eran 9 y Talía era la musa de la comedia y Melpómene la musa del teatro

[5] Abril S.A. Cultural e Industrial “Mitología” Editor Victor Civita, 1973 Vol III pág 632

[6] Aqueos es uno de los nombres colectivos utilizados para el conjunto de los griegos en la  LA Iliada y la Odisea de Homero.

[7] En la  mitología griega Laocoonte era el sacerdote de  Apolo Timbreo en Troya, casado con Antiopa y padre de dos hijos. Según el relato de  Virgilio en la  Eneida, después de que los sitiadores  aqueos  hubieran simulado una retirada, los troyanos encontraron un  caballo construido de madera en las puertas de Ilión.

[8] Citado en http://www.maestrosdelweb.com/editorial/%C2%BFque-son-las-bases-de-datos/

[9] Citado en http://es.wikipedia.org

/wiki/Base_de_datos#Modelos_de_bases_de_datos

[10] Ver http://cassandra.apache.org/

[11] En bases de datos se denomina ACID a un conjunto de características necesarias para que una serie de instrucciones puedan ser consideradas como una  transacción. Así pues, si un  sistema de gestión de base de datos  es ACID compliant quiere decir que el mismo cuenta con las funcionalidades necesarias para que sus transacciones tengan las características ACID.

[12] Citado en http://www.ibm.com/developerworks/

Tags: , , ,

Deja un comentario