姿势估计数据集概述

TXT 文件中每一行的数字按空格分隔,必须严格遵循以下序列逻辑:
[类别ID] [框中心X][框中心Y] [框宽度W] [框高度H] [点1_X] [点1_Y][点1_可见度] [点2_X] [点2_Y] [点2_可见度] ...
- 第 1 项
类别ID:整数。例如 0 代表人,1 代表狗。 - 第 2~5 项
边界框 (BBox):物体的外接矩形框的归一化参数 
- 第 6 项及之后
关键点序列 (Keypoints):按每 2 个或 3 个数字为一组循环。通常为
: - x, y
:关键点的归一化坐标。 - v (Visibility, 可见度)
:通常为 0(未标注/在图外)、1(被遮挡但推测出位置)、2(清晰可见且已标注)。注:部分极简数据集可能没有 v 维度,只保留 x, y。
数据集 YAML 配置文件
除了存放图片和 txt 标签的文件夹,还必须有一个 data.yaml 文件来告诉模型如何读取这些数据。YOLO官网的数据集配置文件如下(关键点检测任务):
# 数据集路径path: ../datasets/my_pose_datasettrain: images/trainval: images/val# 姿态估计必填字段kpt_shape: [17, 3] # [关键点总数, 每个关键点的维度]。3代表(x,y,v),2代表仅有(x,y)flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]# 类别设定names:0: person# Keypoint names per classkpt_names:0:- nose- left_eye- right_eye- left_ear- right_ear- left_shoulder- right_shoulder- left_elbow- right_elbow- left_wrist- right_wrist- left_hip- right_hip- left_knee- right_knee- left_ankle- right_ankle
注意点如下:
Ultralytics 官方支持并内置了多种典型的拓扑结构,你也可以自定义任何点数的数据集:
- COCO-Pose / COCO8-Pose
:人体的标准姿态,17 个关键点。 - Hand Keypoints
:人手部骨架跟踪,21 个关键点。 - Dog-Pose
:针对狗的姿态分析,24 个关键点。 - Tiger-Pose
:针对老虎等野生动物,12 个关键点(且没有可见度维度,所以它的 shape 是 [12, 2])。
参考链接: https://docs.ultralytics.com/zh/datasets/pose/
1. Person 17 (COCO 数据集人体骨架)
目前计算机视觉中最通用的人体姿态估计标准,包含 17 个关键点,主要涵盖五官和四肢关节。
| 0 | |||
| 1, 2 | |||
| 3, 4 | |||
| 5, 6 | |||
| 7, 8 | |||
| 9, 10 | |||
| 11, 12 | |||
| 13, 14 | |||
| 15, 16 |
COCO姿态估计示意图:
2. Hand 21 (手部 21 点骨架)
通常基于 MediaPipe 或 COCO-WholeBody 的标准,精准描绘了手掌和五根手指的全部关节。
| 0 | |||
| 1, 2, 3, 4 | |||
| 5, 6, 7, 8 | |||
| 9, 10, 11, 12 | |||
| 13, 14, 15, 16 | |||
| 17, 18, 19, 20 |
参考链接: https://docs.ultralytics.com/zh/datasets/pose/hand-keypoints/#introduction

3. Dog 18 (AP-10K 动物/狗骨架)

在学术界,标准的 AP-10K(泛哺乳动物姿态估计数据集)通常定义了 17个 关键点,也可能是 18 个关键点。通常第18个点增加的是“尾尖 Tail Tip”)。
| 0, 1 | |||
| 2 | |||
| 3 | |||
| 4 | |||
| 5, 6, 7 | |||
| 8, 9, 10 | |||
| 11, 12, 13 | |||
| 14, 15, 16 | |||
| 17 | 尾巴尖 / 额外点 | Tail Tip |
参考链接: https://github.com/AlexTheBad/AP-10K

4. Face 68 (iBUG 300W 人脸 68 关键点)
最经典的人脸对齐(Face Alignment)模型,点位密集地分布在五官边缘。

| 0 ~ 16 | 17个点 | ||
| 17 ~ 21 | 5个点 | ||
| 22 ~ 26 | 5个点 | ||
| 27 ~ 35 | 9个点 | ||
| 36 ~ 41 | 6个点 | ||
| 42 ~ 47 | 6个点 | ||
| 48 ~ 59 | 12个点 | ||
| 60 ~ 67 | 8个点 |
夜雨聆风