Predecir las respuestas que habrá en el futuro, gracias al entrenamiento del algoritmo con datos conocidos del pasado (datos históricos).
Es una subcategoría del aprendizaje automático y la IA.
Se define por el uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifiquen datos o predigan resultados con precisión.
El aprendizaje supervisado ayuda a las organizaciones a resolver una variedad de problemas del mundo real a gran escala, por ejemplo clasificar el correo no deseado o detectar fraude.
Requiere la predicción de una variable continua.
Puede tener como entrada valores continuos o discretos.
Un problema con múltiples variables de entrada a menudo se denomina problema de regresión multivariante.
Requiere variable objetivo con dos o más clases.
Puede tener variables de entrada discretas o continuas.
Un problema con dos clases se denomina problema de clasificación binaria y con más de dos clasificación multiclase.
En vez de predecir categorías, predicen valores numéricos. Es decir, la variable target en un problema de regresión es de tipo cuantitativa.
Necesitan predecir la clase más probable de un elemento, en función de un conjunto de variables de entrada. Para este tipo de algoritmos, la variable target o respuesta, es una variable de tipo categórica.
Depende del tipo de problema que plantea mi variable a predecir utilizaré un algoritmo de clasificación o de regresión.