小規模な不動産データに対する機械学習モデル(坪単価予測)の構築、欠損値補完、および時系列検証の設計を支援します。
このSkillは、カテゴリ特徴量が多く、データ件数が限られている不動産取引データに対して、高精度かつ堅牢な予測モデルを構築するための専門知識を提供します。
大規模な計算リソースを必要とせず、実装コストを最小化するために以下のライブラリを活用します:
TimeSeriesSplit)に使用します。不動産データに多いカテゴリ変数に対して、以下の戦略を提案します:
複数年度のデータがある場合、未来のデータで過去を予測しないよう、正確な検証を行います:
/real-estate-ml 坪単価をターゲットとしたCatBoostの学習スクリプトを生成して。時系列交差検証を含めてください。
/real-estate-ml 少ないデータ件数で過学習を防ぐための、ハイパーパラメータの探索範囲(Optuna用)を提案して。
必ず python-pro スキルを同時に参照し実装を行ってください。