Name: Social Science Analysis
Author: beita6969

搵技能.../

Social Science Analysis | Skills Pool

Method	When	Pros	Cons
Simple random	Known population	Unbiased	Need sampling frame
Stratified	Subgroup comparison	Precise estimates per stratum	Complex
Cluster	Geographic spread	Cost-effective	Higher design effect
Convenience	Exploratory	Easy	Not generalizable
Snowball	Hard-to-reach populations	Access hidden groups	Selection bias
Quota	Ensure representation	Practical	Not truly random

import numpy as np

def cronbachs_alpha(items_df):
    """Calculate Cronbach's alpha for scale reliability"""
    k = items_df.shape[1]
    item_vars = items_df.var(axis=0, ddof=1)
    total_var = items_df.sum(axis=1).var(ddof=1)
    alpha = (k / (k - 1)) * (1 - item_vars.sum() / total_var)
    return alpha

# Interpretation: α > 0.7 acceptable, > 0.8 good, > 0.9 excellent

from sklearn.decomposition import FactorAnalysis
import numpy as np

# Determine number of factors (parallel analysis or scree plot)
fa = FactorAnalysis(n_components=3, rotation='varimax')
fa.fit(X_scaled)
loadings = pd.DataFrame(fa.components_.T, index=item_names, columns=['F1', 'F2', 'F3'])
print(loadings.round(3))
# Items loading > 0.4 on a factor belong to that construct

# pip install semopy
import semopy

model_spec = """
    Latent1 =~ item1 + item2 + item3
    Latent2 =~ item4 + item5 + item6
    Latent1 ~ Latent2
"""
model = semopy.Model(model_spec)
model.fit(df)
print(model.inspect())
# Check fit indices: CFI > 0.95, RMSEA < 0.06, SRMR < 0.08

| Code | Definition | Example Quote | Theme |
|------|-----------|---------------|-------|
| ADAPT | Adaptation strategy | "We had to change our approach..." | Resilience |
| BARR | Barrier encountered | "The main obstacle was..." | Challenges |

# Quantitative content analysis
import pandas as pd
from collections import Counter

def content_analysis(texts, codebook):
    """
    codebook: dict of {category: [keywords]}
    Returns frequency matrix
    """
    results = []
    for text in texts:
        text_lower = text.lower()
        counts = {}
        for category, keywords in codebook.items():
            counts[category] = sum(text_lower.count(kw.lower()) for kw in keywords)
        results.append(counts)
    return pd.DataFrame(results)

# Inter-coder reliability (Cohen's Kappa)
from sklearn.metrics import cohen_kappa_score
kappa = cohen_kappa_score(coder1_labels, coder2_labels)
# κ > 0.8 excellent, 0.6-0.8 substantial, 0.4-0.6 moderate

import networkx as nx
import numpy as np

G = nx.from_pandas_edgelist(df, 'source', 'target')

# Centrality measures
degree = nx.degree_centrality(G)
betweenness = nx.betweenness_centrality(G)
closeness = nx.closeness_centrality(G)
eigenvector = nx.eigenvector_centrality(G)

# Community detection
from networkx.algorithms.community import greedy_modularity_communities
communities = list(greedy_modularity_communities(G))

# Network statistics
print(f"Nodes: {G.number_of_nodes()}, Edges: {G.number_of_edges()}")
print(f"Density: {nx.density(G):.4f}")
print(f"Clustering coefficient: {nx.average_clustering(G):.4f}")

Social Science Analysis

Survey Design

Question Types & Best Practices

Likert Scale Design

Sampling Methods

Social Science Analysis

Survey Design

Question Types & Best Practices

Likert Scale Design

Sampling Methods

Psychometrics & Scale Development

Reliability

Exploratory Factor Analysis

Confirmatory Factor Analysis / SEM

Qualitative Analysis

Thematic Analysis (Braun & Clarke)

Coding Framework Template

Grounded Theory

Content Analysis

Tips

Update Skills

Eval Harness

Ecc Tools Cost Audit

Code Tour

Rules Distill

Design System

Social Science Analysis

Survey Design

Question Types & Best Practices

Likert Scale Design

Sampling Methods

Social Science Analysis

Survey Design

Question Types & Best Practices

Likert Scale Design

Sampling Methods

Psychometrics & Scale Development

Reliability

Exploratory Factor Analysis

Confirmatory Factor Analysis / SEM

Qualitative Analysis

Thematic Analysis (Braun & Clarke)

Coding Framework Template

Grounded Theory

Content Analysis

Social Network Analysis

Tips

Update Skills

Eval Harness

Ecc Tools Cost Audit

Code Tour

Rules Distill

Design System