Introdução: Baixo peso ao nascer (<2500g) pode estar associado a complicações neonatais e pós-neonatais. Sua prevalência no Brasil está em torno de 10%, ao ano, dos nascimentos e depende das regiões estudadas. Objetivo: O objetivo deste estudo é desenvolver um modelo de análise preditiva com técnicas de machine learning (ML) identificando casos de baixo peso ao nascer no estado de São Paulo. Método: Foram obtidos, do SINASC (disponível publicamente), dados de recém-nascidos (RN) nos municípios do estado de São Paulo entre 2019 e 2021. Ocorrem cerca de 600 mil partos por ano no estado. Foram selecionadas variáveis maternas, fatores socioeconômicos e indicadores de saúde pré-natal para capturar informações que podem influenciar o peso ao nascer. A utilização de algoritmos de ML, como regressão logística, árvores de decisão e redes neurais, permitem explorar padrões complexos e não-lineares presentes nos dados. O treinamento e validação dos modelos foram conduzidos utilizando técnicas de validação cruzada, garantindo robustez e generalização para dados não observados. Foram obtidos valores de acurácia dos modelos, da área sob a curva ROC (AUC) e precisão. Resultados: Foram incluídos 1.660.740 dados de RN no período. Os modelos RandomForest, Regressão Logística, ADABoost, Rede Neural, LightGBM e XGBoost apresentaram acurácia = 93.3%, AUC = 88.5% e precisão = 78.6%. Estes algoritmos revelam uma eficácia consistente, evidenciada pela AUC, valor da acurácia destacando sua capacidade global de classificação correta dos casos e precisão indicando a proporção de casos identificados como baixo peso ao nascer que eram verdadeiramente positivos. Conclusão: Os resultados provenientes deste estudo respaldam a eficácia do modelo preditivo na análise de baixo peso ao nascer, corroborando sua utilidade como instrumento de apoio na identificação precoce de gestações com potencial risco pelos profissionais de saúde.