摘要:O objetivo deste estudo foi aplicar e comparar as técnicas regressão logística e redes neurais no desenvolvimento de modelos de predição de credit scoring com base em dados de uma grande instituição financeira brasileira . A questão - pro blema deste estudo é relevante , pois contribui para o aprimoramento das previsões e fornece apoio para as instituições financeiras tomarem decisões mais precisas sobre concessões de crédito.A base de dados correspondeu a o período de agosto de 2009 a fevere iro de 2010 , período em que o Brasil vivenciou notável expansão da oferta de crédito no mercado . A partir de uma amostra de 20 .000 dados, foram aplicadas as duas técnicas. A amostra foi dividida em três sub - amostras provenientes do mesmo universo de interess e: uma para construção do modelo ( 8.000 dados ) ; a segunda para validação do modelo construído ( 6.000 dados ) e a terceira também com 6.000 dados para testar o modelo obtido. Nas 3 sub - amostras houve uma distribuição eq u itativa de bons e maus clientes , class ificados nestas categorias de acordo com padrõe s da instituição . Os dois modelos testados apresentaram estatísticas de desempenho satisfatórias e poderão ser empregados pela instituição bancária interessada na identificação de bons e maus pagadores de empré stimos. O processo de tomada de decisões de concessão de crédito bancário poderá ser agilizado com o apoio dos modelos analisados neste trabalho.
其他摘要:The objective of this study was to apply and compare the techniques logistic regression and neural networks in the development of models for predicting credit scoring based on data from a large Brazilian financial instituti on . The question - problem of this study is important , because it contributes to the improvement of forecasts and provides support for financial institutions in taking more precise decisions about credit concessions . The database corresponded to the period of August 2009 to February 2010 , in which Brazil experienced a great expansion of credit offer to the market . From a sample of 20,000 data, the two techniques have been applied. The sample was divided into three smaller samples from the same universe of inte rest: one sample for model construction (8,000 data); the second one for model validation (6,000 data) and the third one also with 6,000 data to test the model obtained. In the three samples there was an equitable distribution of good and bad clients, clas sified into these categories according to the standards of the institution. The two modelstested showed satisfactory performance statistics and may be employed by banking institution interested in identifying good and bad payers of loans .The decision - makin g process in bank loan requests can be sped up with the support of the models analyzed in this work.