Aprende a organizar datos de ventas de bicicletas usando las funciones de clasificación y filtrado de Excel para preparar tu análisis
Antes de ordenar o filtrar, es importante entender la estructura del conjunto de datos. Nuestro archivo Bike_Sales contiene datos de ventas de bicicletas con 18 columnas de información.
| Date | Month | Year | Customer_Age | Customer_Gender | Country | State | Product | Profit | Revenue |
|---|---|---|---|---|---|---|---|---|---|
| 2-September-2015 | September | 2015 | 29 | M | Canada | British Columbia | Hitch Rack - 4-Bike | 74 | 119 |
| 22-January-2014 | January | 2014 | 29 | M | Canada | British Columbia | Hitch Rack - 4-Bike | 74 | 119 |
| 7-August-2015 | August | 2015 | 38 | M | Germany | Saarland | Hitch Rack - 4-Bike | 53 | 98 |
Para ordenar correctamente todas las columnas juntas, primero necesitamos seleccionar todos los datos. Si solo seleccionamos una columna, los demás datos no se moverán junto con ella, causando desalineación.
Ahora realizaremos una clasificación de varios niveles: primero por país (orden alfabético) y luego por mes (orden cronológico). Esto nos permitirá ver los datos organizados por región geográfica y tiempo.
Convertir los datos a formato de tabla facilita el filtrado y agrega automáticamente las flechas desplegables en cada columna. También permite nombrar la tabla para referencias futuras.
Usemos el filtro de la columna Country para revisar qué valores contiene y detectar posibles problemas en los datos.
| Valor encontrado | Problema | Acción requerida |
|---|---|---|
| (en blanco) | Datos faltantes | Eliminar filas |
| United States / US | Posible duplicidad de nomenclatura | Estandarizar nombre |
| Saarland | Es un estado, no un país | Corregir a Germany |
Las filas con valores en blanco en la columna Country pueden causar problemas en nuestro análisis. Vamos a filtrarlas y eliminarlas.
Si hay variantes del nombre "United States" (como "US" o "USA"), debemos estandarizarlas. Hay dos métodos: Autorrellenado para pocas filas, o Buscar y Reemplazar para muchas.
Saarland es un estado de Alemania, no un país. Al filtrar por Saarland, podemos ver que los datos de toda la fila se desplazaron una columna. Este es un error común cuando se importan archivos CSV con delimitadores faltantes.
| ... | Country | State | Product_Category | ... |
|---|---|---|---|---|
| ... | Saarland | Accessories | Bike Racks | ... |
| ⬇ Debería ser ⬇ | ||||
| ... | Germany | Saarland | Accessories | ... |