Instructions

该 skill 调用评委公平性评估脚本（${CLAUDE_SKILL_DIR}/start.py）。

运行前确认

在执行前，向用户确认以下信息（若未提供）：

CSV 文件路径（必须）
偏见检测阈值（可选，默认 2.0；评委人数较少时建议用 1.5）

输入数据格式要求

CSV 文件必须满足：

无表头，三列：评委ID, 选手ID, 分数
每个评委必须对所有选手都有打分（不允许缺失值）
分数为数值型

示例：

A,1,85
A,2,90
B,1,80
B,2,88

若用户提供的文件格式不符，直接告知错误原因，不要尝试运行。

环境准备

首次运行前，执行以下命令安装依赖（幂等，可重复执行）：

bash ${CLAUDE_SKILL_DIR}/setup.sh

Instructions

该 skill 调用评委公平性评估脚本（${CLAUDE_SKILL_DIR}/start.py）。

运行前确认

在执行前，向用户确认以下信息（若未提供）：

CSV 文件路径（必须）
偏见检测阈值（可选，默认 2.0；评委人数较少时建议用 1.5）

输入数据格式要求

CSV 文件必须满足：

无表头，三列：评委ID, 选手ID, 分数
每个评委必须对所有选手都有打分（不允许缺失值）
分数为数值型

示例：

A,1,85
A,2,90
B,1,80
B,2,88

若用户提供的文件格式不符，直接告知错误原因，不要尝试运行。

环境准备

首次运行前，执行以下命令安装依赖（幂等，可重复执行）：

bash ${CLAUDE_SKILL_DIR}/setup.sh

分数区间	解读
0.85 ~ 1.0	非常公平，打分高度一致
0.70 ~ 0.85	整体公平，存在轻微偏差
0.55 ~ 0.70	中等，需关注其打分规律
< 0.55	与整体共识差异显著，建议复核

范围	解读
0.9 ~ 1.0	与共识高度一致
0.7 ~ 0.9	基本一致
0.5 ~ 0.7	一致性一般，存在明显分歧
< 0.5	与共识相关性弱，需重点关注

错误信息	说明与建议
`CSV文件为空`	文件路径正确但内容为空
`缺少完整的评委/选手评分组合`	存在缺失打分，需补全矩阵
`FileNotFoundError`	文件路径错误，请确认绝对路径
`pearsonr` 相关报错	某评委对所有选手打分完全相同（方差为零）

Fair Score

Instructions

运行前确认

输入数据格式要求

环境准备

Fair Score

Instructions

运行前确认

输入数据格式要求

环境准备

执行命令

输出解读

1. 综合公平性排名（Final_Fairness_Score）

2. 系统性偏差（Bias_Score）

3. 一致性（Consistency_Correlation）

4. 偏差度（Deviation_MSE）

5. 特异性偏见检测

6. 综合结论与建议

错误处理

Session Logs

OpenClaw Test Heap Leaks

Node Connect

Openclaw Qa Testing

Openclaw Secret Scanning Maintainer

Flags