
Lo que no sabes del machine learning
«Algún día seremos capaces de hacer copias de nuestros cerebros. Puede que los creemos en un laboratorio o que, simplemente, descarguemos su contenido en un ordenador».
Esta cita es del matemático Marvin Minsky (1927-2016) para la revista XLSemanal (junio de 2014).
Minsky consideraba que era necesario utilizar la tecnología para potenciar nuestras capacidades, evitar el sufrimiento, la vejez y, por qué no, la muerte.
Más allá de contemplar si llegaremos a ese punto, lo que hoy ya es una realidad es el machine learning.
¿Qué entendemos por machine learning?
Podemos decir que machine learning (aprendizaje automático) es la capacidad de las máquinas de aprender.
De la misma forma que una persona o un animal es capaz de aprender de la experiencia, una máquina también puede lograrlo.
Un dispositivo que aprende es un algoritmo que revisa los datos y es capaz de predecir comportamientos futuros, identificando patrones entre los datos para hacer esas predicciones.
Por ejemplo, mientras escribo este post, si cometo una errata, el programa me sugiere la palabra correcta.
Otro ejemplo: piensa en las recomendaciones que Netflix te manda cuando te sugiere películas que te pueden gustar, cuando Facebook te sugiere personas que podrías conocer, o cuando tu coche reconoce las señales de tráfico y el asistente actúa en consecuencia.
Todo esto es machine learning, y poco a poco se va colando en nuestras vidas de forma imperceptible pero sin pausa.
Objetivos del machine learning
Abordar y resolver problemas prácticos sin intervención humana.
Esto permite:
- Controlar una inmensa cantidad de información de forma mucho más efectiva.
- Poder tomar mejores decisiones sin intervención humana.
¿Cómo funciona?
La estadística es la base del aprendizaje automático.
A medida que se recogen más y más datos, se mejora de forma progresiva la realización de tareas y el análisis de los datos, sin recibir programación explícita para hacerlo.
Tipos de machine learning
Existen diferentes tipos de aprendizaje dependiendo de los datos disponibles y la tarea a realizar.
Aprendizaje supervisado
Este tipo de aprendizaje se basa en la llamada información de entrenamiento.
Se entrena al sistema proporcionándole cierta cantidad de datos definiéndolos al detalle con etiquetas.
Es decir, utilizamos distintos ejemplos a partir de los que generalizar para nuevos casos.
Estos modelos producen como salida una etiqueta discreta, o sea, una etiqueta dentro de un conjunto finito de etiquetas posibles.
A su vez, los modelos de clasificación pueden ser binarios si tenemos que predecir entre dos clases o etiquetas, o multiclase, cuando hay más de dos.
Un tercer tipo serían los modelos de regresión, que producen como salida un valor real (número).
Aprendizaje no supervisado
En este tipo de aprendizaje se trabaja con datos sin etiquetar.
Se utiliza en tareas donde es necesario analizar los datos para extraer nuevo conocimiento o agrupar entidades por afinidad.
El esquema siguiente lo expresa de forma clara:

Aprendizaje semi-supervisado
Es un mix de los dos anteriores.
Se comienza etiquetando algunos de los datos. Una vez tenemos una pequeña porción de datos etiquetados:
- Entrenamos a un algoritmo de aprendizaje supervisado sobre esos pocos datos etiquetados y utilizamos los modelos resultantes del entrenamiento para etiquetar el resto de datos.
- Después, entrenamos a un algoritmo de aprendizaje no supervisado utilizando los datos etiquetados inicialmente más las etiquetas generadas por el modelo anterior.
Aprendizaje por refuerzo
Es cuando los sistemas aprenden a partir de la experiencia.
Esta técnica está basada en prueba y error, y en el uso de funciones de premios/castigos que optimizan el comportamiento del sistema.
Los pasos serían los siguientes:
- Observación del entorno
- Decidir cómo actuar
- Actuar de acuerdo a esa decisión lo que modifica el entorno
- Recibir una recompensa o penalización
- Aprender de la experiencia y refinar la estrategia hasta que se encuentre la estrategia óptima
Es una de las maneras más interesantes de aprendizaje para sistemas de Inteligencia Artificial, pues no requiere de la introducción de gran cantidad de información.
Aprendizaje profundo (deep learning)
El aprendizaje profundo es un subconjunto del aprendizaje automático basado en redes neuronales artificiales.
El proceso de aprendizaje se llama profundo porque la estructura de redes neuronales artificiales se compone de varias capas de entrada, salida y ocultas. Cada capa contiene unidades que transforman los datos de entrada en información que la capa siguiente puede usar para realizar una tarea de predicción determinada.
Gracias a esta estructura, una máquina puede aprender a través de su propio procesamiento de datos.
Definición de Francesca Lazzeri (Microsoft)
Por ejemplo, la traducción automática o el reconocimiento de imágenes utilizan este tipo de aprendizaje.
Aplicaciones en la industria y en particular en la agricultura
Llegados a este punto, ya te puedes imaginar los beneficios de aplicar el machine learning a los distintos sectores productivos.
Vamos a ver algunos ejemplos:
- En el sector bancario. Tiene muchas aplicaciones, como detectar pagos fraudulentos o clasificar a los clientes por perfiles de mayoro o menor riesgo.
- En sanidad. Cualquiera de nosotros ya puede llevar un registro de sus constantes vitales gracias a un sensor como por ejemplo una smartband. Estos datos pueden permitir realizar un diagnóstico o identificar tendencias en la población.
- Marketing online. Es un ejemplo muy claro ya que cualquier web captura los datos de un usuario (interés, comportamiento, navegación…) y esos datos permiten ofrecer una mejor experiencia de compra en un e-commerce (por ejemplo)
- Transporte. Se pueden analizar los datos de tráfico disponibles para identificar patrones y tendencias. Con ello, las empresas de transporte pueden hacer rutas más eficientes o más rápidas según el momento del día.
- Agricultura. El machine learning está revolucionando la agricultura.
Ya existen equipos capaces de distinguir entre cultivos y malas hierbas.
Ello permite utilizar fertilizantes, herbicidas, fungicidas y demás productos químicos de forma selectiva, logrando un beneficio doble: reducir el uso de esos productos y mejorar la producción.
Puedes consultar estos dos post relacionados si quieres leer más ejemplo sobre aplicaciones de inteligencia artificial:
Todo lo que debes saber sobre Inteligencia Artificial y su aplicación en la industria hortofrutícola
Robotización, automatización y digitalización: el futuro es ahora
Si te ha quedado alguna duda sobre los conceptos que tratamos en el post o quieres ampliar información no dudes en contactar con nosotros.