¿Qué es numpy?
Numpy es una biblioteca para el lenguaje de programación Python 🐍 que da soporte para crear vectores y matrices grandes multidimensionales, junto con una gran colección de funciones matemáticas de alto nivel para operar con ellas.
Numpy nos permite usar Arrays, Pandas nos brinda los Dataframes (tablas)
¿Qué es pandas?
Pandas es una herramienta de manipulación y análisis de datos de código abierto rápida, potente, flexible y fácil de usar, construida sobre el lenguaje de programación Python 🐍
Pandas facilita la manipulación de grandes volúmenes de datos a través de un conjunto de métodos y estructuras diseñadas para tal fin.
Extiende las funcionalidades de Numpy, por lo que sus estructuras de datos son totalmente compatibles.
Es de uso libre, su primera versión se creó en 2008.
Está enmarcado en un proyecto llamado NUMFOCUS (2015)
Estructuras:
Series: Similar a los arrays, con 1 sola dimensión y lo presenta como columnas.
DataFrames: Similar a las matrices, con 2 dimensiones.
Paneles: Más de dos dimensiones, múltiples tablas.
Python tiene dos grandes objetos dentro de Panda:
Serie
DataFrame
Es un vector del mismo tipo, si tengo un valor que es de tipo String, toda la serie es de tipo String.
Tiene un indice que empieza en 0 (cero)
Es como una matriz con filas y columnas.
Son como un conjunto de Series, cada columna es de un tipo.
Tiene un indice que empieza en 0 (cero)
En el DataFrame puedo pedir filtros, por ejemplo que me de una sola columna, o una sola fila o un conjunto.
Librería --> Pandas (para usar una tabla de filas y columnas)
Por convención se define como pd
Con pandas trabajamos el objeto DataFrame
import pandas as pd
import numpy as np
df= pd.DataFrame(data=np.random.randint(64, size=(8,8)),columns=['Ja','Mu','Ct','Dn','Eo','Tp','Yn','Om'])
print(df)
Ja Mu Ct Dn Eo Tp Yn Om
0 26 41 62 50 41 52 49 35
1 4 13 37 4 18 7 30 43
2 57 19 41 55 53 15 14 57
3 47 6 53 47 58 15 39 49
4 61 32 53 15 48 56 42 20
5 60 56 40 55 7 32 51 13
6 45 9 29 21 48 43 61 30
7 44 5 27 59 6 47 7 46