Name: ML Competition — Advanced: Pseudo-Labeling, Ensemble, Post-Processing & Tracking
Author: KameniAlexNea

ML Competition — Advanced: Pseudo-Labeling, Ensemble, Post-Processing & Tracking

Implement and debug late-stage improvements for tabular ML competitions: pseudo-labeling, ensemble meta-learning, submission post-processing, and experiment tracking. Use when: adding pseudo-labeling after base models converge; building ensemble (weighted blend / LogReg stacking / dynamic gating); calibrating predictions (Platt / isotonic); clipping or constraining output values; tracking OOF scores and diagnosing OOF vs LB divergence; deciding which submission to make final. NOT for base model training, feature engineering, or hyperparameter tuning.

KameniAlexNea0 스타2026. 3. 29.

직업
카테고리: 머신러닝

Overview

This skill covers the four late-stage pipeline components applied after base models converge:

Pseudo-labeling — when/how to use test predictions as additional training labels; per-task label generation; confidence gating; weight decay over rounds; pitfalls
Ensemble meta-learning — weighted blend (Nelder-Mead), LogReg stacking, dynamic gating, and the weights+gating hybrid; honest OOF discipline
Submission post-processing — calibration (Platt/isotonic), OOF-optimized clipping, domain constraints; YAML toggle; when calibration hurts vs helps
Experiment tracking — score ledger, using OOF as LB proxy, diagnosing OOF vs LB divergence, submission decision logic

Order of operations: base models → hyperparameter tuning → pseudo-labeling → ensemble → post-processing. Violating this order contaminates the OOF used for ensemble training.

Prior / Auxiliary Data Rules

CatBoost handles heterogeneous cardinality and distribution shift better → auxiliary data often helps

ML Competition — Advanced: Pseudo-Labeling, Ensemble, Post-Processing & Tracking

KameniAlexNea0 스타2026. 3. 29.

직업
카테고리: 머신러닝

Overview

This skill covers the four late-stage pipeline components applied after base models converge:

Pseudo-labeling — when/how to use test predictions as additional training labels; per-task label generation; confidence gating; weight decay over rounds; pitfalls

Ensemble meta-learning — weighted blend (Nelder-Mead), LogReg stacking, dynamic gating, and the weights+gating hybrid; honest OOF discipline

Submission post-processing — calibration (Platt/isotonic), OOF-optimized clipping, domain constraints; YAML toggle; when calibration hurts vs helps

Experiment tracking — score ledger, using OOF as LB proxy, diagnosing OOF vs LB divergence, submission decision logic

Order of operations: base models → hyperparameter tuning → pseudo-labeling → ensemble → post-processing. Violating this order contaminates the OOF used for ensemble training.

ML Competition — Advanced: Pseudo-Labeling, Ensemble, Post-Processing & Tracking

Overview

Prior / Auxiliary Data Rules

ML Competition — Advanced: Pseudo-Labeling, Ensemble, Post-Processing & Tracking

Overview

Prior / Auxiliary Data Rules

Calibration — When It Helps vs Hurts

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns