data = {'PA': [2001,2001,2022, 2022,2022,2022],
'Ventas': [100, 150, 200, 50, 120, 80]}
dfprueba = pd.DataFrame(data)
dfprueba.shape
(6, 2)
# Agrupar por la columna 'PA' y calcular la suma de 'Ventas'
ventas_por_PA = dfprueba.groupby('PA')['Ventas'].sum().reset_index()
# Mostrar el resultado
print(ventas_por_PA)
PA Ventas
0 2001 250
1 2022 450
# Ejemplo de Group By con un DataFrame de ejemplo 2 - .count()
data2 = {'PA': [2001,2001,2022, 2022,2022,2022],
'Carrera': [99, 100, 1,1, 2, 3]}
dfprueba2 = pd.DataFrame(data2)
dfprueba2.shape
(6, 2)
dfprueba2
|index |PA| Carrera|
|0| 2001 |99|
|1| 2001 |100|
|2| 2022 |1|
|3| 2022 |1|
|4| 2022 |2|
|5| 2022 |3|
# Agrupar por la columna 'PA' y calcular la Cantidad de Inscriptos
Cantidad_por_PA = dfprueba2.groupby('PA')['Carrera'].count().reset_index()
# Cantidad de Carreras por PA
print(Cantidad_por_PA)
PA Carrera
2001 2
2022 4