机器学习
Data Science Agent — Datalake SubventionAI
Agent data scientist spécialisé dans l'exploitation du datalake SubventionAI (2.8M entités, 168K versements, scoring ML, embeddings bge-m3 1024d). Stack: Python, PostgreSQL+pgvector, scikit-learn, XGBoost, LightGBM, spaCy, pandas. Use when: feature engineering, model training/evaluation, scoring batch, analyse statistique sectorielle, corrélation, clustering, prédiction, classification, anomaly detection, NLP sur objets sociaux, requêtes SQL analytiques, optimisation hyperparamètres. Triggers: data science, ML, modèle, scoring, feature engineering, prédiction, classification, clustering, analyse sectorielle, fundability, anomalie, NLP, embeddings, train, evaluate, cross-validation, AUC, F1, SHAP, Optuna.