Skill ファイル

Fidelity 1099 Parser

Name: Fidelity 1099 Parser
Author: spinjob

Extract and process Fidelity Tax Reporting Statements (1099-B and 1099-DIV). Use for parsing Fidelity consolidated 1099 PDFs to extract sales transactions, dividends, and distributions. Generates estate accounting schedules with monthly totals using auditor terminology (Total Income, Total Disbursements, Net FMV Change). Triggers on Fidelity 1099, tax statement, estate accounting, brokerage tax forms, 1099-B sales, 1099-DIV dividends.

spinjob0 スター2026/02/15

職業
カテゴリ: 金融・投資

スキル内容

Parse Fidelity Tax Reporting Statement PDFs to extract sales and dividend transactions, with accurate 1099-B section classification and 1099-DIV box mapping.

Quick Start

Generate Estate Report

# Auto-generates YYYY-XXXX-Estate-Report.xlsx from PDF filename
python scripts/generate_estate_report.py path/to/fidelity_1099.pdf

# Or specify custom output path
python scripts/generate_estate_report.py path/to/fidelity_1099.pdf output_report.xlsx

Output filename is normalized to YYYY-XXXX-Estate-Report.xlsx format (e.g., 2020-9147-Estate-Report.xlsx).

Programmatic Usage

from scripts.generate_estate_report import generate_report
generate_report("path/to/fidelity_1099.pdf")  # Auto-generates output filename

# Or use individual extractors:
from scripts.extract_sales import extract_sales_from_pdf
from scripts.extract_dividends import extract_dividends_from_pdf

sales = extract_sales_from_pdf("fidelity_1099.pdf")
dividends, totals = extract_dividends_from_pdf("fidelity_1099.pdf")

関連 Skill

Fidelity 1099 Parser | Skills Pool

# Symbol line format: COMPANY NAME,SYMBOL,CUSIP (3 fields)
# Also handles 2-field format: DESCRIPTION,CUSIP (for exchanged securities)
symbol_pattern_3field = r'^([A-Z0-9][A-Z0-9 &\-\.\'#/\*!()\$]+?),([A-Z]{1,5}),([A-Z0-9]{9})$'
symbol_pattern_2field = r'^([A-Z][A-Z0-9 &\-\.\'\*#/()\$]+),([A-Z0-9]{9})$'

# Sale line format: Type Quantity DateAcquired DateSold Proceeds CostBasis
sale_pattern = r'^(Sale|Cash In Lieu|Merger|Redemption|Exchange)\s+([\d,.]+)\s+(\d{2}/\d{2}/\d{2})\s+(\d{2}/\d{2}/\d{2})\s+([\d,.]+)\s+([\d,.]+)'

# Unknown term pattern: Type Quantity Unknown DateSold Proceeds Unknown
unknown_term_pattern = r'^(Sale|Cash In Lieu|...)\s+([\d,.]+)\s+Unknown\s+(\d{2}/\d{2}/\d{2})\s+([\d,.]+)\s+Unknown'

def is_dividend_section(text):
    """Check if page contains dividends (not capital gains)."""
    if "Dividends and Distributions" not in text:
        return False
    # CRITICAL: Exclude Capital Gains pages
    lines = text.split('\n')[:25]
    for line in lines:
        if "Total Capital Gains Distributions Detail" in line:
            return False
        if "Capital Gain Distr" in line and "2a" in line:
            return False
    return True

words = page.extract_words()
for word in words:
    x = word['x0']
    if 100 <= x < 200:      # Box 1a Ordinary Dividends
    elif 340 <= x < 420:    # Box 1b Qualified Dividends
    elif 480 <= x < 575:    # Box 11 Exempt Interest
    elif 575 <= x < 700:    # Box 12 Private Activity Bond
    elif 700 <= x < 800:    # Box 7 Foreign Tax Paid

# Matches: "01/10/20", "!C 02/11/20", "!C02/11/20"
date_pattern = r'^!?C?\s*(\d{2}/\d{2}/\d{2})(?:\s|$)'

current_symbol = None
for line in lines:
    if SEPARATOR_PATTERN.match(line):  # Dashes reset context
        current_symbol = None
        continue
    if symbol_pattern.match(line):
        current_symbol = extract_symbol(line)
    elif date_pattern.match(line) and current_symbol:
        # Associate this transaction with current_symbol

from scripts.validate_extraction import validate_extraction
report = validate_extraction(pdf_path, sales, dividends, div_totals)
print(report)  # Shows pass/fail for each field with $0.02 tolerance

Issue	Symptom	Fix
Capital Gains in Dividends	Box 1a over-reported by ~$2,500+	Update `is_dividend_section()` to exclude pages with "Total Capital Gains Distributions Detail" header
Missing !C entries	Box totals under-reported	Ensure date pattern handles `!C` prefix with/without space
Wrong symbol association	Amounts on wrong symbol	Reset symbol context on separator lines (dashes)
Column value mismatch	Wrong box amounts	Recalibrate x-position boundaries from actual PDF
2-field securities missed	Missing exchanged securities	Add pattern for `DESCRIPTION,CUSIP` format (no symbol)

# Found $2,499.87 AEMSX on page 226 - a Capital Gains Distribution page
# Fix: Added check for "Total Capital Gains Distributions Detail" header

pip install pdfplumber openpyxl

Fidelity 1099 Parser

Quick Start

Generate Estate Report

Programmatic Usage

Fidelity 1099 Parser

Quick Start

Generate Estate Report

Programmatic Usage

Extraction Workflow

1. Sales Transactions (1099-B)

2. Dividends (1099-DIV)

3. Symbol Tracking

Validation

Common Validation Issues and Fixes

Debugging Validation Failures

Output Sheets

Sheet Structure

Excel Formula References

Output Filename Convention

Resources

scripts/

references/

Dependencies

Llm Trading Agent Security

Energy Procurement

Council

Carrier Relationship Management

Market Research

Market Research