Uno de los aspectos más conservadores de las finanzas, la decisión de otorgar crédito a alguien, está siendo transformada por la puntuación crediticia impulsado por IA. Este es un cambio gradual para personas cuyo historial crediticio es amplio y que han estado con bancos durante un largo período de tiempo. Sin embargo, podría cambiar la vida de los prestatarios con historial limitado y aquellos que están en la economía informal. Finalmente pueden ser detectados en lugar de ser invisibles para el sistema. Este artículo analiza la aplicación de datos alternativos para crear puntuaciones crediticias basadas en IA para individuos y pequeñas empresas que carecen de un historial crediticio tradicional, el riesgo de injusticia y sesgo cuando los datos de buró no están disponibles, y el impulso regulatorio para crear IA explicable en la suscripción de poblaciones con acceso bancario limitado.
Las calificaciones crediticias convencionales presuponen algún tipo de existencia financiera. Asumen que un individuo tiene una cuenta bancaria, productos financieros formales, y ha solicitado un préstamo o usado una tarjeta de crédito previamente. Presuponen que los empleadores operan nóminas de manera formal y los comerciantes trabajan en la parte visible de la economía: la parte documentada. En la práctica, una proporción colosal del mundo no es así. Los adultos jóvenes a menudo no tienen préstamos ni tarjetas. Los migrantes pueden poseer buenos antecedentes crediticios en sus países de origen y nada en los nuevos. La mayoría de sus transacciones se realizan en efectivo o en plataformas de terceros que no reportan a los burós: trabajadores freelance, vendedores ambulantes, comerciantes informales y un gran número de microempresarios. Donde existen burós, incluso su cobertura puede ser superficial o sesgada hacia poblaciones urbanas con empleo formal. El archivo de buró de tales solicitantes aparece en blanco o casi en blanco para los prestamistas. Como los equipos de riesgo están entrenados para confiar en los datos de buró, cometen errores a favor de la precaución. El resultado es predecible: mayor rechazo, límites reducidos, precios aumentados o exclusión total.
Estos prestatarios no son necesariamente más riesgosos; es solo que el sistema es sordo y ciego a las señales que realmente caracterizan sus vidas financieras. El concepto básico de la aplicación de IA a la puntuación crediticia aquí es directo. Donde las estadísticas de buró faltan o son demasiado escasas, buscar en otro lugar. Existen numerosas huellas digitales en la vida moderna. Cuando tales huellas se recopilan de manera responsable con consentimiento y se convierten en señales más organizadas, pueden revelar mucho sobre la estabilidad de una persona, su potencial de ingresos y sus posibilidades de pagar. Una de las primeras y más valiosas fuentes es a menudo los datos de telecomunicaciones. Los operadores móviles entienden cómo alguien recarga saldos prepagados regularmente, si usan el mismo número durante años o cambian frecuentemente, si son constantes o erráticos en su actividad, y si adquieren paquetes de datos del mismo tamaño. Un individuo que mantiene un número a lo largo del tiempo, recarga el número y exhibe patrones consistentes de utilización generalmente está más profundamente arraigado en una comunidad y es más consistente en su comportamiento en comparación con alguien que abandona o fluctúa en la utilización. La estabilidad está asociada con un riesgo crediticio reducido.
Otra fuente de poder es el comercio electrónico y datos del mercado de plataformas digitales. Poco puede contenerse en el archivo de buró de un conductor de transporte por aplicación, pero una plataforma puede acceder a conteos de viajes, ingresos por semana, datos de cancelación, reseñas de clientes y duración del conductor. Un microcomerciante como vendedor en un marketplace deja un historial de pedidos completados, reembolsos realizados, quejas presentadas, agotamientos de stock y patrones de crecimiento. En el caso de negocios informales, los datos de plataforma pueden usarse como el equivalente más cercano a estados financieros oficiales. A continuación, están los datos del mercado de cuenta bancaria, billetera digital y flujo de efectivo de API de banca abierta. Aunque un prestatario puede carecer de un largo historial crediticio, él o ella también tiende a tener una cuenta donde se deposita salario, ingresos freelance, remesas o ingresos comerciales. A través del análisis de entradas y salidas basadas en tiempo, los prestamistas pueden estimar los ingresos comunes, su variabilidad, si tiene reservas o no, y qué porción de los ingresos ya ha sido asignada a gastos recurrentes como alquiler, servicios públicos y deudas existentes. En el caso del prestatario con acceso bancario limitado, la suscripción de flujo de efectivo es a menudo más confiable que el scorecard tradicional, que depende tanto de préstamos pasados. Una capa más es proporcionada por APIs de nómina y empleo.
En situaciones donde los empleadores están conectados a servicios de ganancia de nómina, los prestamistas pueden confirmar empleo, ingresos mensuales, duración del empleo y cambios de compensación. Para aquellos con varios trabajos de medio tiempo, esta imagen compuesta será mucho más informativa que un recibo de pago. Por último, con uso apropiado, datos de comportamiento y a nivel de dispositivo pueden usarse para asistir tanto en fraude como en estimación de riesgo. La duración del tiempo que un individuo ha estado usando el mismo dispositivo, la regularidad de sus ubicaciones de inicio de sesión, cómo usan la app durante los meses, así como la hora del día en que usualmente realizan las transacciones, pueden proporcionar indicadores de autenticidad y estabilidad. Estas señales deben manejarse con cuidado para prevenir discriminación indirecta, aunque pueden ser de apoyo útil. Todas estas fuentes están conectadas por el hecho de que cuentan sobre la vida real de una persona y cómo vive, cómo gana y paga incluso cuando está claro que nunca ha puesto su dedo en una tarjeta de crédito en su vida.
\
Estas otras fuentes de datos están densamente pobladas y no estructuradas. La estructura de registros de telecomunicaciones, eventos de plataforma, transacciones bancarias y telemetría de dispositivos no es la de un informe de buró tradicional. Son ruidosas, dimensionales y llenas de patrones de idiosincrasia. En este punto, la IA, en particular el aprendizaje automático moderno, es necesaria. El ciclo de vida común comienza con agregación de datos del mercado. Los prestamistas tienen acceso a socios de telecomunicaciones, feeds de banca abierta, APIs de nómina y socios de plataforma bajo condición de leyes de protección de datos y consentimiento directo de los clientes.
Absorben datos en bruto en entornos seguros y los normalizan. Actividades de recarga telefónica, crédito de billetera y pedidos de comercio electrónico se convierten en series temporales que tienen formatos regulares. Anomalías innecesarias y duplicados se eliminan y valores faltantes se procesan. De esto, características son construidas por científicos de datos del mercado. Crean variables resumen en lugar de simplemente alimentar todas las transacciones en bruto a un modelo: flujo de efectivo neto mensual promedio; la proporción de meses donde los ahorros flexibles son positivos; el período consecutivo más largo sin pagos a acreedores; los meses de bajos ingresos; crecimiento o decaimiento de ingresos de plataforma; variabilidad de horas de trabajo; permanencia de ubicación semana a semana.
Estos atributos intentan comprimir la vida económica de un individuo en números que pueden ser digeridos por el modelo. Árboles de refuerzo de Gradiante, bosques aleatorios y redes neuronales son entonces algoritmos de aprendizaje automático que se entrenan con datos en cadena históricos donde el resultado ya es conocido. En el caso de puntuación crediticia, el resultado es usualmente un incumplimiento por el prestatario durante un período de tiempo especificado, digamos seis o doce meses. El modelo aprende combinaciones de características que indican más o menos riesgo. Patrones encontrados entre suscriptores humanos no habrían sido identificados por discernimiento humano, como interacciones menores entre las volatilidades de flujos de efectivo y permanencia en plataforma. La validación es crítica. El modelo se aplica a datos del mercado que no fueron usados en su entrenamiento para que su desempeño sea real y no resultado de sobreajuste.
Medidas como AUC, coeficiente de Gini y estadísticas de Kolmogorov-Smirnov se usan para medir el poder de discriminación, mientras que gráficos de calibración indican si las probabilidades predichas son idénticas a las tasas de incumplimiento reales. Además de cifras principales, los prestamistas necesitan observar el desempeño basado en segmento: prestatarios nuevos versus experimentados, varias ocupaciones, regiones y bandas de ingresos. Al desplegar, el modelo entonces calificará nuevos solicitantes al instante, y una respuesta será proporcionada en pocos segundos. El proceso no puede terminar ahí. Las estadísticas cambian con el tiempo, las plataformas de terceros evolucionan sus políticas y la macroeconomía evoluciona.
\
:::tip Esta historia fue distribuida como un comunicado por Sanya Kapoor bajo el Programa de Business Blogging de HackerNoon.
:::
\


