Capítulo 5: Hablemos de Big Data
Nunca, en la historia de la humanidad, hemos tenido tanta información, tanta DATA como le llaman. ¿Y sabes? No importa cuando leas esto ahora hay más… y ahora hay más… y ahora hay mucha más… por minuto, por segundo se genera información e información. Quien toma ventaja de la interminable cantidad de información y data es quien gana el juego. Así es que llegó el día. es momento de hablar de Big Data.
Esto es Cerebro de Silicio, el futuro de la Inteligencia Artificial, hoy.
Capitulo 5: Hablemos de Big Data
Tal vez este es el momento que esperabas desde que comenzó Cerebro de Silicio. Y es que el Big Data está hoy en día, en boca de todos. Expertos e inexpertos, todos recurren al término Big Data para explicar todo y nada, lo comprensible y lo incomprensible. Pareciera el término perfecto para describir un sitio mágico donde se encuentra la información.
-”¿De donde viene la información?”, pregunta alguien.
-”Big Data”, por supuesto. Y entonces todos, expertos e inexpertos, avalan como confiable la información presentada porque… pues porque viene del Big Data. Una especie de mundo que los Dioses dispusieron para albergar la verdad.
Quiero que cierres los ojos, bueno, a menos de que estés manejando. Recuéstate, cierra los ojos. Trata de poner tu mente en blanco. Esta no es un a meditación pero ayuda si bajas las luces. Ahora recuerda lo que desayunaste hoy. recuerda que fue lo último que hiciste ayer antes de dormir. Es difícil ¿Verdad? Ahora recuerda cuál fue el punto culminante de tu semana pasada. Posiciónate ahí. Siente nuevamente eso que sentías… emoción, angustia, dolor, alegría. Ahora recuerda cómo fue el primer día de trabajo de este año. Ese 2 de enero regresando de vacaciones. No intentes describirlo, solamente recuerda una imagen. Ahora tu último día de clases de… no sé… de tu maestría, de tu licenciatura, el día de preparatoria o bachillerato… ahora recuerda tu primer “enamoramiento” -que no quiere decir que haya sido tu primer amor. El primer día que sentiste ese “algo raro” que pasaba en tu interior y que no habías sentido y que no podrías describir, ese no sé qué que qué sé yo que te desconcertó. Recuerda ahora un día en la primaria, un día cualquiera. 7 u 8 años. A ese quiero que te transportes Recuerda tu salón, tus compañeros a tu alrededor, recuerda tu maestra y el pizarrón. Visualiza la ventana y la puerta. Toma tu cuaderno y ponlo en tu pupitre. Ahora recuerda tu libro de texto, ese que tanto odiabas y ponlo en tu pupitre y después recuerda el libro que tanto amabas. Ponlo a un lado. saca de tu estuche tu pluma nueva, y tu lápiz. Sácale punta. Recuerda la satisfacción de sacarle punta a un lápiz, ver como salían las rebanadas y virutas de madera del filo de la navaja, recuerda el olor a madera y grafito. La magia de ver cómo aparecía una punta con la que aprenderás a escribir o a dibujar un árbol y una luna. recuerda cómo era tu uniforme y tus zapatos recién lustrados. recuerda la emoción de saludar a tu amigo de la banca de al lado. Recuerda cuánto detalle puedas sobre ese día. ¿Quienes estaban en el salón? ¿Recuerdas sus nombres? ¿Recuerdas el nombre de tu maestra? ¿Recuerdas sí hacía frío o calor? ¿Sol o lluvia? ¿Recuerdas cómo era tu lonchera? ¿Recuerdas quién se sentaba enfrente de ti y detrás de ti y que te decía “agáchate que no me dejas ver”? ¿Recuerdas quién te decía: “¿Que dice en la segunda línea allá en el pizarrón?”? ¿Recuerdas cómo sabías cuando acababa la clase si no llevabas reloj? ¡ni siquiera sabías cómo leer la hora! ¿Qué recuerdas? Más bien, ¡que recuerdos! Bien, ya llegamos. Abre los ojos. Es momento de empezar.
Acabas de experimentar el Big Data. Una interminable cantidad de información, en este caso, reside en tu cabeza. Normalmente, reside en equipos enormes de almacenamiento de empresas, instituciones gubernamentales y educativas. Es una obscena cantidad de datos e información almacenada y que se sigue, todos los días, incrementándose. Acumulándose. Son números y números, palabras, nombres oraciones, párrafos, textos completos. Son olas de datos e información. Un sin fin de código de indexación que te permite saber dónde está la información que buscas. Es el todo en términos de información.
1997, año en el que aparece el primer documento con el término Big Data, indica Forbes. Un paper de científicos de la nasa, describiendo el problema que tenían con la visualización -gráficas en computadora. Un gran reto en el que los sets de datos resultaron tan grandes grandes, que saturaron la capacidad de la memoria principal, el disco local e incluso, discos remotos.
-”No tenemos data… tenemos Big Data”, me imagino que habrá dicho alguien. ¿Cómo se resuelve? Comprando más recursos.
https://www.forbes.com/sites/gilpress/2014/09/03/12-big-data-definitions-whats-yours/#1f9c8e3713ae
El diccionario Oxford lo define como “data de grandes cantidades, típicamente niveles en los que su manipulación y administración presenta retos significativos de logística.”
Ahora, imagina la organización en la que trabajas, ya sea un banco o una empresa de manufactura, una empresa de retail, una aerolínea o una institución educativa o gubernamental. En ella, el Big Data es toda la información que a alguien se le ocurrió guardar y almacenar:
Nombres y números de clientes, direcciones, teléfonos, correos. Todo.
Insumos para producción, números de parte, colores, modelos para producir, ubicación en horarios, inventarios y pedidos. Todo.
Números de vuelos, rutas, cantidad de pasajeros y espacios vacíos, maletas, matrícula de aeronaves, inventario de combustible y consumibles. Todo.
Nombres de ciudadanos y adeudos en impuestos, salarios, movimientos. Todo. Todo lo que está guardado, es Big Data.
Bien, después de esta abrumadora información, un director o gerente del área de Inteligencia Artificial debe tomar todo el Big Data y procesarlo para contestar las preguntas de la dirección general o de las áreas correspondientes. La buena noticia es que no es tu responsabilidad como ejecutivo o director de un área de Inteligencia Artificial lidiar con el Big Data. Tu responsabilidad es emplearla, manejarla, utilizarla, operar y obtener valor del Big Data. Sistemas o IT, es quien en realidad se encarga de guardar, de contener y de administrar la información, de resguardarla, de mantener estándares de calidad de datos y seguridad (ya veremos estos dos términos posteriormente).
¿Cuál es la importancia del Big Data? De forma simple y sencilla es convertir una organización tradicional en una organización data driven, es decir, donde las decisiones se toman basándose en información. No hay decisiones por decreto, las hay porque hay hechos -facts-.
¿Es necesaria tanta, tantísima información para tomar decisiones? la respuesta es… sí, no… depende. Piensa en una fotografía. ¿Qué nivel de definición es el correcto para una fotografía? Depende. Una fotografía que vaya a imprimirse en tamaños gigantescos, requiere mucha definición, igual que una foto de un león o una cebra publicada, por ejemplo, en el National Geographic. El detalle es crucial. Una foto de un día común y corriente tomada con un celular, requerirá menos definición, menos detalle. El número de píxeles, el número de colores, la definición es la diferencia entre Data y Big Data. Hay decisiones que deben tomarse con “alta definición” y otras en “baja definición”. Competir en ciertos mercados, hoy en día, requiere de alta, altísima definición. Toda la información disponible para generar mejores estrategias y mayor inteligencia. Competir contra las empresas más exitosas del mundo requiere una gran cantidad de data para ser más inteligentes -claro, de la mano con una poderosa herramienta de Inteligencia Artificial. Así fue como se hizo grande Amazon, así fue como Google se apropió del mercado. Por ello, se le ha denominado al Big Data el nuevo petróleo, es el insumo más importante para desarrollar conocimiento y ventajas competitivas en las organizaciones digitales.
El siguiente paso es solicitar a IT la información que necesites para hacer los análisis correspondiente de Inteligencia Artificial. ¿Por qué debes saber tanto sobre Big Data si tu no lo vas a administrar? Porqué IT te preguntará:
- “Bien ¿exactamente que información requieres para tu análisis?” Es muy tentador decir “Toda… quiero toda la información, por favor.” Y aquí el problema. Es como si quisieras escribir tu biografía con TODA la información de tu vida, según el ejercicio anterior, sería una pila interminable de hojas, fotografías, videos, recuerdos e imágenes que llegaría al infinito… por ambos lados.
Así es que lo importante es saber que puedes tener acceso a un sin fin de información, pero solamente necesitas una mínima rebanada de toda ella para hacer tus análisis. Si no sabes que pedir, te darán información incorrecta, incompleta o inútil (las tres “Is”). El verdadero peligro es que IT cumpla tu deseo de darte toda la información o información de más -por si las moscas- y te ahogaras en información irrelevante.
Así es que ahora ya lo sabes. ¿Qué es big data? Mucha información, muchísima. ¿Qué hay que hacer con ella? ya te contaré en el siguiente capítulo.
https://sloanreview.mit.edu/case-study/lessons-from-becoming-a-data-driven-organization/
Cerebro de Silicio es más que un podcast. Es una producción de Azul Chiclamino.
visita Cerebrodesilicio.com y encuentra mas información. Bibligorafia, referencias y el transcript de este episodio.
Yo soy Rodrigo Llop