Descartar registros con datos faltantes o reemplazarlos de manera apropiada.
Ajustar las variables a una escala común para evitar sesgos debido a las diferencias de magnitud.
Convertir variables categóricas en representaciones numéricas para su procesamiento por algoritmos de IA generativa.
Equilibrar las clases minoritarias o sobre-muestrear las clases minoritarias para evitar sesgos en el análisis.
Separar los datos en un conjunto de entrenamiento para el modelado y un conjunto de prueba para evaluar el rendimiento de la IA generativa.