yfinanceとEDINET APIを使用して、市場データと定性情報を収集・保存します。
市場データと有価証券報告書からのテキストデータをハイブリッドで取得します。
auto_adjust=True を必須とし、分割調整後の価格を取得する。qualitative_extractor.py のロジックを使用し、EDINETから取得する。prices.csvinfo.json全ての取得データ(銘柄詳細、財務テキストなど)に対して、以下のクリーニング処理を必ず適用します。
NFKC正規化 (Normalization)
A → A, 1 → 1)㈱ → (株))空白文字の正規化
\u3000)やNBSP()を半角スペースに置換\xa0src/daily_harvester.py を使用して、全銘柄の株価データを段階的に取得します。
stocks_master.csv の last_price_update カラムで各銘柄の最終更新日時を管理します。
last_price_update を現在日時に更新data/{ticker}/prices.csvauto_adjust=True で分割調整済み価格を取得