Scoring de Crédito Alternativo en Mercados Emergentes

90% de los datos del mundo fueron creados en los últimos 2 años.

¿Qué significa eso para los no bancarizados en mercados emergentes?

A lo largo del mundo emergente, instituciones financieras innovadoras se están dando cuenta del potencial de los datos alternativos para transformar el financiamiento. Datos en línea de las redes sociales, registros de teléfonos móviles y psicometría ayudan a iluminar el potencial de los prestatarios en donde la información de crédito tradicional es escasa, permitiendo así nuevos préstamos y un mayor control del riesgo. Pero en tanto estas fuentes alternativas de datos encuentran su camino, es importante reconocer que no todas las fuentes son iguales. Por el contrario, poseen fortalezas y debilidades importantes con grandes implicancias para las instituciones financieras y los clientes que estas sirven.

¿Por qué el score de crédito tradicional no es suficiente para los mercados emergentes?

En el mundo desarrollado, las grandes empresas de calificación de crédito como Equifax, Experian y TransUnion proveen a las instituciones financieras de calificaciones de crédito basadas principalmente en el historial de pagos de los solicitantes de crédito. Si bien estos scores tradicionales son altamente predictivos, ellos se basan en gran medida en robustos y centralizados burós de crédito, que recopilan, almacenan y comparten historiales de pago veraces. Esta dependencia en la infraestructura de crédito impone un desafío en los mercados emergentes, donde los datos del buró son a menudo inexactos o incompletos sino del todo inexistentes. Según el Banco Mundial, menos de 1 de cada 10 personas en países de ingresos bajos y medios de todo el mundo están en los archivos de los registros de crédito públicos[i].

¿Qué son Datos Alternativos?

Datos alternativos puede significar cualquier cosa más allá de los datos de re-pago recogidos por los bancos y burós de crédito. Sin embargo, recientemente tres fuentes de datos han alcanzado una atención especial entre prestamistas de mercados emergentes: datos en línea, datos móviles y psicometría. En EFL, hemos trabajado extensamente con las tres fuentes de datos, utilizando grandes bases de datos de desempeño de préstamos y técnicas de modelamiento de vanguardia en la industria para entender su relación con el riesgo crediticio[ii]. Entonces, ¿qué incluyen estas fuentes de datos? ¿Cómo pueden ser utilizados por los prestamistas? Y actualmente, ¿quién los está utilizando?

alternative data cuadro.bmp

¿Qué hace que una fuente de datos alternativos sea más o menos valiosa para un prestamista?

Hay dos indicadores por los cuales una fuente alternativa de datos de score de crédito debe ser considerada: disponibilidad y capacidad de predicción. Hemos evaluado los datos en línea, móviles y psicométricos por ambos indicadores, haciendo factible el primer análisis comparable, cuantitativo y objetivo de las tres fuentes de datos[iii].

Disponibilidad: ¿cuántas personas capturan cada fuente de datos y a qué precio?

Datos en línea

El porcentaje de personas que utilizan Internet en todo el mundo se ha más que triplicado en los últimos diez años, y en tanto el acceso crece también lo hacen las huellas digitales de los individuos, capaces de proporcionar insights sobre riesgos que antes eran inaccesibles. Por otra parte, ya que los datos en línea están públicamente disponibles o pueden obtenerse a través de una sencilla autenticación de usuario y autorización, es barato obtenerlos.

Sin embargo, el hecho es que el 60% del mundo permanece fuera de línea, y el 60% está fuertemente concentrado en economías en desarrollo. En el sur de Asia, por ejemplo, menos de 1 de cada 7 personas están en línea, y menos aún están en redes sociales y sitios de comercio electrónico. Además, las huellas digitales son más ricas entre jóvenes, conocedores de tecnología y con cierto nivel de educación, lo que significa que en muchos mercados, los datos en línea sólo se aplicarán a una pequeña y sesgada porción de la población.

Los datos en línea están creciendo rápidamente y se obtienen a bajo costo, pero todavía son escasos en mercados emergentes y sesgados hacia los jóvenes y educados. En nuestro análisis de prestatarios de ocho prestatarios africanos subsaharianos, 10% tenían datos verificables de redes sociales en línea.

Datos móviles

En la última década, los teléfonos móviles tienen una presencia generalizada en todo el mundo. Más del 90% de las personas tienen un teléfono móvil, y hay más suscripciones celulares en los países en desarrollo que en los desarrollados. Mientras los teléfonos móviles se convierten en el medio esencial de comunicación en los mercados emergentes, los datos que pueden ser recogidos y analizados de ellos se vuelven más ricos y más descriptivos.

A diferencia de los datos en línea, los datos móviles requieren una inversión inicial significativa. Tanto los registros detallados de llamadas (CDR por sus siglas en inglés) como los registros detallados de transacciones (TDR por sus siglas en inglés) son propiedad de los operadores de redes móviles (MNO por sus siglas en inglés) que protegen legítimamente los datos y privacidad de sus usuarios. Por otro lado, algunos MNOs se están convirtiendo en prestamistas, estando menos dispuestos a compartir los datos de sus usuarios con otros prestamistas que pueden estar compitiendo por los mismos clientes. Por último, en muchos países, los usuarios móviles tienen suscripciones prepago con múltiples MNOs, haciendo necesario amalgamar múltiples fuentes de datos para construir una imagen completa del comportamiento móvil de un individuo. Para recopilar datos móviles completos para sólo el 80% de la población de Indonesia, por ejemplo, sería necesario obtener el consentimiento de 5 diferentes MNOs.

Los datos móviles están ampliamente disponibles. En nuestro análisis, el 72% de los prestatarios en un mercado emergente del Caribe tenía datos móviles disponibles, pero las leyes de privacidad y los mercados fragmentados implicaron altos costos iniciales para recopilar y utilizar esos datos.

Psicometría

A diferencia de los datos en línea y móviles, que ya existen, los datos psicométricos se capturan de forma activa en el momento de la aplicación. El scoring psicométrico no se basa en información retrospectiva y, por tanto, no se limita a pequeños subconjuntos de la población ni depende de los proveedores de información externos.

Más bien, los datos psicométricos se recogen a través de preguntas en una encuesta, y por lo tanto pueden estar disponible para cualquier persona, en cualquier lugar.

Sin embargo, una activa recopilación de datos también significa mayores costos de recolección. Las instituciones financieras que utilizan datos psicométricos para la toma de decisiones de crédito a menudo eligen administrar las solicitudes psicométricas de crédito en persona, en lugar de hacerlo a distancia y en línea, lo cual requiere tiempo y energía por parte no sólo de los ejecutivos de crédito sino también de los solicitantes de préstamos.

Los datos psicométricos son de acceso universal y pueden ser fácilmente implementados, pero son capturados activamente y por tanto incurren en costos marginales más altos que las de las otras fuentes de datos.

alternative data 1

Poder: ¿Qué tan significativas y prácticas son las fuentes de datos en la medición del riesgo de pago?

Datos en línea

El poder predictivo de los datos en línea depende del tamaño y la madurez de la huella digital de un individuo. Conjuntos de datos más amplios proporcionan más funcionalidades para el modelamiento y permiten una visión más completa de la conducta de una persona en línea. En nuestros esfuerzos de modelamiento, encontramos que cosas simples como el uso frecuente de jergas y contracciones en Facebook pueden relacionarse fuertemente con el riesgo de impago.

Sin embargo, si se implementa sin cuidado, los datos en línea pueden ser engañosos, ya que es relativamente fácil de manipular durante cortos períodos de tiempo. Usuarios que conocen los atributos que los prestamistas están evaluando pueden ajustar su comportamiento en línea, por ejemplo utilizando menos jergas antes de su solicitud de crédito. Por esta razón, es muy importante trabajar con huellas digitales amplias y maduras, de preferencia a través de múltiples plataformas.

En nuestro análisis de prestatarios en África subsahariana, los datos en línea presentaron un poder predictivo relativamente pequeño de 14% de Gini. Sin embargo, con la profundización de las huellas digitales es probable que este poder predictivo aumente con el tiempo.

Datos móviles

Los conjuntos de datos CDR proporcionan detalles complejos sobre una serie de atributos que incluyen con quién se comunica el individuo, con qué frecuencia y por cuánto tiempo, así como el historial de pagos de una cuenta. En nuestro análisis encontramos que con características simples como el promedio de días entre las llamadas, continuidad del servicio, frecuencia de consulta de saldo y duración de llamadas fuimos capaces de crear un modelo relativamente poderoso.

Los datos móviles también tienen ciertas ventajas prácticas sobre los datos en línea, es decir, es más fácil relacionarlos a un individuo ya que los números de teléfono son únicos. Al igual que los datos en línea, los prestamistas deben tener cuidado de limitar su análisis a conjuntos de datos amplios y maduros con el fin de mitigar el riesgo de manipulación del usuario.

Los datos móviles ofrecen abundante información comportamental cuando se capturan en conjuntos de datos lo suficientemente amplios y maduros. En nuestro análisis, los datos móviles alcanzaron un Gini del 26%.

Psicometría

Los datos psicométricos ofrecen una amplia variedad de características para el modelamiento de datos, permitiendo así tener una visión integral sobre el carácter y disposición a pagar de un individuo. La capacidad de la psicometría para medir el riesgo, sin embargo, depende en gran medida de la calidad de las preguntas formuladas. Factores como la lengua, la cultura, la edad, y la industria pueden influir en las respuestas que el individuo provee en la encuesta, por lo que se debe tener cuidado en la elaboración de preguntas que sean imparciales y de aplicación universal. Además, se debe prestar especial atención al seguimiento y prevenir la manipulación del usuario, ya que los psicométricos se obtienen de un auto-reporte y no de una observación.

Cuando se implementa de forma diligente, la psicometría ofrece sólido poder predictivo. Esto es particularmente cierto cuando la aplicación se administra de forma electrónica, en lugar que con lápiz y el papel, ya que permite observar no sólo lo que respondió un individuo, sino la forma en que este interactuó con la aplicación, es decir, el tiempo que demoró en cada pregunta, si cambió las respuestas, y así sucesivamente. Estos meta-datos proporcionan funcionalidades adicionales que son muy valiosos tanto en el modelamiento, como en la detección de fraudes por parte de los solicitantes de crédito o ejecutivos de crédito.

Los datos psicométricos ofrecen un fuerte poder predictivo cuando se implementan con la debida atención a la calidad de las preguntas y la a manipulación del usuario. La encuesta de EFL obtiene un Gini de 24 a 33%, dependiendo del país.

alternative data 2

Lo que sigue en relación a Datos Alternativos

Los datos alternativos tienen el potencial de cambiar fundamentalmente los préstamos en los mercados emergentes. Las instituciones financieras que buscan comprender mejor a sus clientes, incrementar sus carteras y controlar el riesgo deben mirar los datos alternativos como fuente de oportunidades, pero también tener en cuenta las ventajas y desventajas inherentes a cada fuente de datos. Tal como ilustra la siguiente figura, la disponibilidad y poder de predicción de las fuentes de datos alternativas varían ampliamente, lo que puede adaptarse a diferentes necesidades de diferentes prestamistas en diferentes mercados. Por otra parte, las instituciones financieras deben saber que el scoring de crédito, basado en datos alternativos o no, es sólo un componente del proceso de préstamo y, por tanto, un buen score de crédito no puede garantizar un sólido desempeño de la cartera. Por último, los prestamistas deben tener en cuenta que en algunos casos estas fuentes de datos pueden ser utilizados como complementos y no sustitutos, estratificados para proporcionar una comprensión más matizada del riesgo y potencial crediticio.

alternative data 3

Espero que estas experiencias sean útiles en sus esfuerzos – aprovechar estas y otras fuentes de datos nuevas pueden hacer una gran diferencia en el reto de lograr la inclusión financiera.

Bailey Klinger

Bailey

Nota técnica: todos los ginis pertenecen a modelos construidos utilizando regression logística y forward stepwise automático sobre una muestra aleatoria de 80%, y calculados sobre una muestra de validación de 20%. La variable objetivo fue 90 días de mora en todos los casos. Datos móviles pertenecen a un país en desarrollo en el Caribe. Datos de redes sociales pertenecen a ocho países de África. Datos psicométricos son el promedio de seis mercados emergentes en América Latina, Asia meridional y Asia oriental. Datos sobre el poder predictivo del buró tradicional pertenecen al buró nacional de una nación latinoamericana de tamaño mediano, tasa de éxito para burós fueron tomadas del Banco Mundial como promedio en América Latina, África, Asia meridional y Asia oriental y el Pacífico.

[i] http://data.worldbank.org/indicator/IC.CRD.PUBL.ZS

[ii] En aras de total transparencia, EFL utiliza principalmente psicometría para toma de decisiones de crédito, ya que fue la primera tecnología que desarrollamos e implementamos, y descubrimos su efectiva contribución en mejorar los créditos en mercados emergentes.

[iii] Un simple algoritmo de regresión logística y forward stepwise sobre una muestra aleatoria de 80%, que fue validada sobre la muestra de validación alteatoria del 20% restante.

 

Comments are closed