¿Qué son el Data Science, Big Data, Inteligencia Artificial, Machine Learning y Deep Learning (y en qué se diferencian)?

Tiempo de lectura: 8 minutos

El principal objetivo de este post es compartir definiciones simples y resumidas sobre algunos de los principales conceptos relacionados al mundo de los datos (Data Science, Big Data, Inteligencia Artificial, Machine Learning y Deep Learning). Así también, presentaré ejemplos y mencionaré las principales relaciones y diferencias entre estos términos.

Espero que al leer este artículo encuentres una buena introducción para seguir aprendiendo e involucrándote en el maravilloso mundo de los datos 🙂

¿Por qué escribo este post?

En los últimos años he visto un creciente interés en las distintas áreas relacionadas al mundo de los datos. Y esta demanda por conocer más sobre conceptos relativamente nuevos (o por lo menos, de fama reciente), ha sido satisfecha, en parte, por libros, videos, podcasts, blogs, etc.

Pero como pasa en otras dimensiones de la vida, cantidad no es sinónimo de calidad. Y es que, después de horas buscando material para ponerme al día con lo “básico” como punto de partida de mi re-inicio como Data Scientist, me he dado cuenta de los 3 principales problemas presentes en la mayoría del material disponible (por lo menos para los múltiples sitios que revisé):

  • El material está en inglés.
  • Fue escrito hace años.
  • No está escrito ni presentado de forma simple (de cara a personas que están comenzando en el mundo de los datos). 

Así, la principal motivación de este post es poder aportarles con un resumen de mi aprendizaje para partir (o volver a partir en mi caso) en los siguientes temas:

Y todo esto de la forma más simple y resumida posible.

¿Quién debería leer este post?

Este post debería interesarte si eres una persona que quiere comenzar a adentrarse en el mundo de los datos, ya seas un estudiante de pregrado pensando en ser un científico de datos, o quieras cambiar de trabajo a un rol relacionado, o seas un líder en una organización en la cual se esté comenzando a hablar de estos temas.

Mis descargos de responsabilidad 🙂

Antes de comenzar, te dejo algunos comentarios para sacarle el mayor provecho a lo que viene:

  • Seguramente habrá temas o complejidades que pasaré por alto para mantener la simpleza del post.
  • Es muy probable que conozcas casos (roles, cargos, empresas, estructuras, etc.) que no coincidan de forma exacta con las descripciones que incluyo, ya que este post se basa en mi experiencia y, además, a propósito he querido incluir sólo los casos principales que he conocido.
  • Por último, me gustaría que este post (y el blog en general) sea un punto de partida para que sigamos conversando sobre estos temas, así que si quieres enviarme comentarios, observaciones, felicitaciones, o lo que te nazca, sólo haz clic aquí 🙂

Y ahora, sin más, ¡comencemos!

¿Qué es el Data Science?

El data science (DS, o ciencia de datos en español) se define como la ciencia que busca extraer conocimiento desde los datos.

Ejemplos de aplicaciones de data science:

  • Te solicitan un análisis que busca identificar a los clientes más valiosos para un banco, para lo cual utilizas, entre otras cosas, datos transaccionales de la tarjeta de crédito de dicha entidad bancaria.
  • Trabajas en un hospital y desarrollas un modelo para priorizar a nuevos pacientes según su probabilidad de presentar síntomas graves. Y para esto, utilizas como input data histórica de pacientes.
  • Quieres conocer más sobre una determinada red social, para lo cual realizas una segmentación para entender los distintos usuarios existentes en base a datos demográficos, de uso y de interacciones.

¿Qué tienen en común estos ejemplos? En los 3 se busca responder “preguntas contextuales” tomando como input distintas formas de datos para el descubrimiento de insights (utilizo el término “preguntas contextuales” como un concepto más amplio de lo que se denomina generalmente “preguntas de negocio” en el contexto de las empresas).

Ejemplos de aplicaciones de data science.
Tabla #1: Ejemplos de aplicaciones de data science (elaboración propia).

Si quieres saber más sobre data science, pincha aquí.

¿Qué es el Big Data?

El big data (BD) corresponde a un conjunto de técnicas y herramientas especializadas en el trabajo con grandes volúmenes de datos.

Ejemplos de aplicaciones de big data:

  • Se desarrolla un proceso que extrae, transforma y carga data en un banco para las transacciones realizadas con tarjeta de crédito (la gran mayoría de los bancos posee grandes volúmenes de data transaccional).
  • Te piden entrenar un modelo de machine learning, para el cual debes utilizar prácticamente la totalidad de data de una cadena de retail (grandes volúmenes de datos transaccionales).
  • Se necesita un análisis, el cual busca identificar a los clientes inactivos en una empresa de telecomunicaciones, por lo que debemos analizar grandes volúmenes de datos sobre tráfico y llamadas.

De los ejemplos anteriores, podemos destacar que:

  • Los 3 casos tienen en común el uso de grandes volúmenes de datos, independiente del objetivo final de cada aplicación (flujo de datos, entrenamiento de un modelo de machine learning e identificación de clientes inactivos, respectivamente).
  • Como podemos ver con el último ejemplo, tenemos una intersección entre el big data y el data science, lo cual podemos graficar con la siguiente imagen:
Relación entre el big data y data science
Fig. #1: Relación entre el big data y data science (elaboración propia).

Así, podemos describir las 3 zonas anteriores como:

  • Zona 1: Aplicaciones big data pero no data science (ejemplo: desarrollo de un proceso que busca hacer más rápida la creación diaria de una base de datos de gran volumen).
  • Zona 2: Aplicaciones que al mismo tiempo corresponden a big data y data science (ejemplo: análisis que busca identificar a los clientes inactivos en una empresa de telecomunicaciones mediante el uso de un gran volumen de datos).
  • Zona 3: Aplicaciones data science pero no big data (ejemplo: segmentación para entender los tipos de clientes que posee una pequeña tienda. En este caso, el volumen de datos que debería manejar una tienda como esta no calificaría como Big Data).

¿Qué es la Inteligencia Artificial?

La Inteligencia Artificial (Artificial Intelligence, AI o IA) se define como la disciplina enfocada en la creación de máquinas programadas para realizar tareas que requieren la misma inteligencia de los seres humanos.

Ejemplos de aplicaciones de inteligencia artificial:

  • Un robot programado para trabajar en una línea de producción y separar la fruta madura del resto (en base a identificación de rasgos visuales mediante imágenes de cada fruta).
  • Una máquina programada para jugar ajedrez en contra de un ser humano.
  • Un algoritmo diseñado para detectar la presencia de cierta enfermedad en base a información del paciente (exámenes de sangre, síntomas declarados, genes, etc.)

¿Qué tienen en común estos ejemplos? En los 3 existen acciones o decisiones realizadas por máquinas que están imitando el comportamiento e inteligencia humana (con distintos niveles de complejidad).

¿Qué es el Machine Learning?

El Machine Learning (ML, o aprendizaje automático) corresponde a una rama de la inteligencia artificial en donde, mediante algoritmos y tomando datos como input, se logra que las máquinas aprendan sin ser explícitamente programas para esto.

Relación entre el machine learning y la inteligencia artificial
Fig. #2: Relación entre el machine learning y la inteligencia artificial (elaboración propia).

Ejemplos de aplicaciones de machine learning:

  • Desarrollas un modelo basado en el algoritmo XGBoost para el cálculo de probabilidad de pacientes de gravedad en un hospital, en base a datos demográficos y síntomas identificados, entre otras fuentes de información.
  • Creas un modelo utilizando el algoritmo CART (árbol de decisión) para la predicción de fuga (término de contrato) de clientes de una empresa de telecomunicaciones, en donde el input corresponde a información demográfica y de uso de los teléfonos móviles (llamadas, tráfico por internet, etc.)
  • Utilizas una regresión lineal para explicar y predecir el precio del dólar en base a otros indicadores macroeconómicos, tales como, actividad económica de los países, precios pasados de la moneda, entre otras.

¿Qué es el Deep Learning?

El Deep Learning (DL, o aprendizaje profundo) corresponde a una rama del machine learning (y por ende, de la inteligencia artificial) en donde se utilizan algoritmos inspirados por la estructura y funcionalidades del cerebro humano (redes neuronales artificiales).

Relación entre el deep learning, machine learning y la inteligencia artificial
Fig. #3: Relación entre el deep learning, machine learning y la inteligencia artificial (elaboración propia).

Ejemplos de aplicaciones de deep learning:

  • Desarrollar un modelo basado en redes neuronales profundas para la identificación y clasificación de imágenes de plantaciones, con el objetivo de identificar posibles plagas.
  • Creas modelos utilizados para la traducción, en tiempo real, de textos o imágenes.
  • Utilizas modelos para el reconocimiento de rostros en imágenes.

Relación entre el Data Science, Big Data, Inteligencia Artificial, Machine Learning y Deep Learning.

¿Y si ahora relacionamos todo lo que hemos aprendido? Veamos la siguiente imagen:

Relación entre el data science, big data, deep learning, machine learning y la inteligencia artificial
Fig. #4: Relación entre el data science, big data, inteligencia artificial, machine learning y deep learning (elaboración propia).

De esta figura podemos comentar:

  • Tal como mencionamos arriba, el deep learning está contenido en el machine learning, el cual, a su vez, está contenido en la inteligencia artificial.
  • También podemos ver la relación que ya comentamos entre el data science y el big data: áreas “exclusivas” para cada campo (zona H+I+J+K para big data – No data science y zona D+E+F+G para data science – No big data) y un área de intersección (zona L+M+N+O).
  • Además, el data science presenta áreas de intersección tanto con la IA, como con sus ramas ML y DL (zonas D+E+F+M+N+O).
  • Lo anterior, también ocurre entre el big data y el IA y sus ramas (I+J+K+M+N+O)
  • Si quieres ver más detalles y ejemplos, puedes revisar el siguiente cuadro:
Detalle de relación entre el data science, big data, inteligencia artificial, machine learning y deep learning
Tabla 2: Detalle de relación entre el data science, big data, inteligencia artificial, machine learning y deep learning (elaboración propia).

Palabras al cierre.

¿Mucha información? 😮

Bueno, espero que este post sea de mucha utilidad para ti si lo que buscas es conocer qué es, de forma simple y resumida, el Data Science, Big Data, Inteligencia Artificial, Machine Learning y Deep Learning.

Y antes de finalizar, te dejo un resumen de los principales puntos que abordamos:

Definiciones.

  • Data Science (DS): Ciencia que busca extraer conocimiento desde los datos.
  • Big Data (BD): Técnicas y herramientas especializadas en el trabajo con grandes volúmenes de datos.
  • Inteligencia Artificial (IA): Disciplina enfocada en la creación de máquinas programadas para realizar tareas que requieren la misma inteligencia de los seres humanos.
  • Machine Learning (ML): Rama de la inteligencia artificial en donde, mediante algoritmos y tomando datos como input, se logra que las máquinas aprendan sin ser explícitamente programas para esto.
  • Deep Learning (DL): Rama del Machine Learning (y por ende, de la IA) en dónde se utilizan algoritmos inspirados por la estructura y funcionalidades del cerebro.

Principales relaciones.

  • Data Science vs Big Data:
    • Existen aplicaciones que corresponden a DS pero no a BD, como por ejemplo, una segmentación para entender los distintos tipos de clientes que posee una pequeña tienda en base a sus datos (en este caso, el volumen de datos que debería manejar una tienda como esta no calificaría como BD).
    • Existen aplicaciones que corresponden a BD pero no a DS, como por ejemplo, el desarrollo de un proceso que busca hacer más rápida la creación diaria de una base de datos de gran volumen.
    • Existen aplicaciones que corresponden tanto a DS como a BD, como por ejemplo, un análisis, que utiliza los datos de las compras realizadas con tarjeta de crédito de un banco (gran volumen), y que busca identificar a los clientes más valiosos para la empresa.
  • Inteligencia Artificial vs Machine Learning vs Deep Learning:
    • Se considera que el ML es una rama contenida en la IA.
    • A su vez, el DL es una rama contenida en el ML.
  • Todo lo anterior se puede resumir en la siguiente imagen:
Relación entre el data science, big data, inteligencia artificial, machine learning y deep learning.
Fig. #5: Relación entre el data science, big data, inteligencia artificial, machine learning y deep learning (elaboración propia).

Recuerda que si deseas conocer más sobre la ciencia de datos, puedes visitar el post que preparé de este tema en particular.

Si quieres saber más o te gustaría que publique sobre algún otro tema, no dudes en escribirme. También puedes escribirme si tienes alguna duda o si quieres darme feedback. Por último, sería genial seguir en contacto a través de mis redes sociales, como Twitter y LinkedIn (también sígueme en Instagram que tengo Instagram).

🙂