Palabras claves:
Predecir.
Toma de decisiones para sacar valor.
Entender el negocio.
Calidad de los datos.
Extraer información.
Relación con las variables.
Método científico.
Contar una historia con los datos.
Tipo de aprendizaje donde existe retroalimentación para el algoritmo debido a que hay etiquetas, los problemas típicos a resolver son clasificación y regresión.
Le mandamos datos y entrenamos el algoritmo, es decir, le damos manzanas para que aprenda que es una manzana.
1. Regresión lineal
2. Regresión logística
3. Árboles de decisión
4. Bosques aleatorios
5. Máquinas de vectores de soporte (SVM)
6. Redes neuronales artificiales
Tipo de aprendizaje donde NO existe retroalimentación para el algoritmo debido a que NO hay etiquetas, los problemas típicos a resolver son clustering y reducción de dimensionalidad.
Ejemplo en A. No Supervisado: Le mandamos datos y luego el algoritmos agrupa por alguna característica, por ejemplo tamaño, color.
No tiene una Variable Target objetivo, por eso se trabaja con Clustering, se agrupan por categorías o reducción de dimensionalidad.
Los grupos que forme pueden ser por color, por tamaño, etc. Va a particionar la población en diferentes grupos.
1. Clustering (K-means, clustering jerárquico, DBSCAN)
2. Reducción de dimensionalidad (PCA, t-SNE)
3. Reglas de asociación (Apriori)
4. Redes neuronales autoencoder
Son estructuras de datos de dos dimensiones (rectangulares) que pueden contener datos de diferentes tipos, por lo tanto, son heterogéneas. Esta estructura de datos es la más usada para realizar análisis de datos y es habitual si has trabajado con paquetes estadísticos.
La visualización de datos es la práctica de trasladar la información a un contexto visual, como un mapa o un gráfico, para que el cerebro humano pueda entender los datos extraer conclusiones. El objetivo principal de la visualización de datos es facilitar la identificación de patrones, tendencias y valores atípicos en grandes conjuntos de datos..
ScikitLearn es una librería fundamental para el desarrollo de modelos de Machine Learning (Algoritmos Supervisados y No supervisados entre otros) en Python
https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html