Name: Data Analysis
Author: ceasarXuu

스킬 검색.../

Data Analysis | Skills Pool

-- 统计痛点类别频率
SELECT 
  category,
  COUNT(*) as count,
  AVG(upvotes) as avg_upvotes,
  COUNT(*) * 100.0 / (SELECT COUNT(*) FROM user_quotes) as percentage
FROM user_quotes
GROUP BY category
ORDER BY count DESC;

-- 提取高频痛点的样本
SELECT quote, source, upvotes
FROM user_quotes
WHERE category = 'battery_anxiety'
ORDER BY upvotes DESC
LIMIT 10;

## 痛点聚类结果

| 痛点类别 | 提及次数 | 占比 | 平均 Upvotes | 严重程度 |
|---------|---------|------|-------------|---------|
| 电池焦虑 | 45 | 38% | 520 | ⭐⭐⭐⭐⭐ |
| 存储问题 | 32 | 27% | 380 | ⭐⭐⭐⭐ |
| 通知过载 | 18 | 15% | 210 | ⭐⭐⭐ |

-- 时间分布分析
SELECT 
  DATE(created_at) as date,
  category,
  COUNT(*) as daily_count
FROM user_quotes
WHERE created_at >= DATE('now', '-6 months')
GROUP BY DATE(created_at), category
ORDER BY date DESC;

-- 来源分布
SELECT 
  source,
  category,
  COUNT(*) as count
FROM user_quotes
GROUP BY source, category;

TAM (Total Addressable Market):
= 全球潜在用户数 × 年付费金额

SAM (Serviceable Available Market):
= TAM × 实际可服务比例

SOM (Serviceable Obtainable Market):
= SAM × 实际可获得比例

### iOS 电池健康工具市场规模

**TAM 计算**:
- 全球 iPhone 用户: 10 亿
- 年付费金额: $30
- TAM = 10 亿 × $30 = $300 亿

**SAM 计算**:
- 关心电池健康的用户比例: 20%
- SAM = $300 亿 × 20% = $60 亿

**SOM 计算** (Year 1):
- 预计下载量: 50,000
- 转化率: 5%
- 付费用户: 2,500
- 年收入: 2,500 × $35 = $87,500

| 竞品 | 估算下载量 | 估算收入 | 评分 | 评论数 | 市场份额 |
|------|-----------|---------|------|--------|---------|
| A    | 500K      | $50K/月 | 4.2  | 12K    | 35%     |
| B    | 300K      | $30K/月 | 3.8  | 8K     | 21%     |
| C    | 200K      | $20K/月 | 4.5  | 5K     | 14%     |

-- 竞品评分趋势
SELECT 
  competitor_name,
  date,
  rating,
  review_count
FROM competitor_tracking
ORDER BY date DESC;

-- 竞品功能覆盖率
SELECT 
  feature_name,
  SUM(CASE WHEN has_feature = 1 THEN 1 ELSE 0 END) as competitor_count,
  COUNT(*) as total_competitors,
  SUM(CASE WHEN has_feature = 1 THEN 1 ELSE 0 END) * 100.0 / COUNT(*) as coverage_rate
FROM competitor_features
GROUP BY feature_name
ORDER BY coverage_rate ASC;

正面关键词: love, great, awesome, perfect, recommend
负面关键词: hate, terrible, awful, worst, disappointed
强度词: very, extremely, absolutely, completely

-- 情感分类统计
SELECT 
  sentiment,
  COUNT(*) as count,
  AVG(upvotes) as avg_upvotes
FROM (
  SELECT 
    *,
    CASE 
      WHEN quote LIKE '%love%' OR quote LIKE '%great%' THEN 'positive'
      WHEN quote LIKE '%hate%' OR quote LIKE '%terrible%' THEN 'negative'
      ELSE 'neutral'
    END as sentiment
  FROM user_quotes
)
GROUP BY sentiment;

-- 月度趋势
SELECT 
  strftime('%Y-%m', created_at) as month,
  category,
  COUNT(*) as count
FROM user_quotes
GROUP BY month, category
ORDER BY month DESC;

-- 增长率计算
WITH monthly_counts AS (
  SELECT 
    strftime('%Y-%m', created_at) as month,
    COUNT(*) as count
  FROM user_quotes
  GROUP BY month
)
SELECT 
  a.month,
  a.count as current_count,
  b.count as previous_count,
  (a.count - b.count) * 100.0 / b.count as growth_rate
FROM monthly_counts a
LEFT JOIN monthly_counts b ON 
  DATE(a.month || '-01', '-1 month') = DATE(b.month || '-01')
ORDER BY a.month DESC;

| 维度 | 数值 | 趋势 |
|------|------|------|
| 用户原话 | 120 | ↑ |
| 痛点类别 | 8 | → |
| 平均 Upvotes | 450 | ↑ |

电池焦虑: ████████████████████ 45 (38%)
存储问题: ██████████████ 32 (27%)
通知过载: ████████ 18 (15%)
性能下降: ████ 12 (10%)
其他:     ████ 11 (10%)

pie title 痛点分布
    "电池焦虑" : 38
    "存储问题" : 27
    "通知过载" : 15
    "性能下降" : 10
    "其他" : 10

# 数据分析报告: [主题]

## 数据概况
- 分析时间: YYYY-MM-DD
- 数据来源: [列出来源]
- 数据量: X 条记录
- 时间范围: YYYY-MM-DD 至 YYYY-MM-DD

## 痛点聚类
[痛点频率表格]

### Top 3 痛点详细分析

#### 1. [痛点名称]
- 提及次数: X
- 占比: XX%
- 严重程度: ⭐⭐⭐⭐⭐
- 典型用户原话:
  > "..."
  > "..."

## 市场规模估算
- TAM: $XXX
- SAM: $XXX
- SOM (Year 1): $XXX

## 竞品分析
[竞品对比表格]

## 趋势分析
[时间趋势图表]

### 关键发现
1. [发现 1]
2. [发现 2]
3. [发现 3]

## 建议
基于数据分析,建议:
1. [建议 1]
2. [建议 2]
3. [建议 3]

-- 总记录数
SELECT COUNT(*) FROM user_quotes;

-- 按类别统计
SELECT category, COUNT(*) 
FROM user_quotes 
GROUP BY category;

-- Top 10 高赞内容
SELECT quote, upvotes, source
FROM user_quotes
ORDER BY upvotes DESC
LIMIT 10;

-- 交叉验证: 同一痛点在多个来源出现
SELECT category, COUNT(DISTINCT source) as source_count
FROM user_quotes
GROUP BY category
HAVING source_count >= 3;

-- 痛点严重程度评分
SELECT 
  category,
  COUNT(*) as frequency,
  AVG(upvotes) as avg_intensity,
  COUNT(*) * AVG(upvotes) as severity_score
FROM user_quotes
GROUP BY category
ORDER BY severity_score DESC;

Data Analysis

数据分析与可视化技能

概述

核心能力

工具要求

分析方法

1. 痛点聚类分析

Data Analysis

数据分析与可视化技能

概述

核心能力

工具要求

分析方法

1. 痛点聚类分析

2. 频率统计与分布分析

3. TAM/SAM/SOM 计算

4. 竞品数据分析

5. 情感分析

6. 趋势识别

数据可视化

使用 Markdown 表格

使用 ASCII 图表

使用 Mermaid 图表

分析报告模板

常用 SQL 查询库

基础统计

高级分析

最佳实践

输出清单

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling