1. 什么是算力?
算力就是计算能力(Computing Power),通常是指芯片或计算机系统执行数值计算和任务处理的能力。
算力通常由数据处理单元提供,也就是我们俗称的芯片,如CPU、GPU、FPGA、TPU等。
2. 算力的衡量
算力的单位体系庞大且存在多种维度和多重标准,其核心关系可总结为 “两大维度、四类单位、场景决定一切”。
2.1. 算力单位的两大维度
| 维度 | 定义 | 典型单位 | 应用场景 |
|---|---|---|---|
| 基础操作维度 | 每秒执行的基础计算操作数量 | FLOPS, OPS, IPS, H/s | 硬件性能标定 |
| 任务效能维度 | 每秒完成的应用层任务量 | FPS, QPS, 图像/秒 | 用户体验衡量 |
2.2. 四类核心单位详解
2.2.1. 数值计算类(底层硬件)
| 单位 | 全称 | 计算类型 | 量级换算 | 典型场景 |
|---|---|---|---|---|
| OPS | Operations Per Second | 通用操作 (整数/逻辑等) | 1 TOPS = 10¹² OPS | AI推理芯片、边缘设备 |
| FLOPS | Floating-Point Operations Per Second | 浮点运算 (小数/科学计算) | 1 TFLOPS = 10¹² FLOPS | 超算、GPU、AI训练 |
| IPS | Instructions Per Second | 指令集操作 | 1 GIPS = 10⁹ IPS | CPU架构效能评估 |
说明: OPS、FLOPS、IPS是业界最常用的三种算力衡量单位。
OPS与FLOPS的关系:
- OPS: 每秒执行的运算次数(
Operations Per Second)。 - FLOPS: 每秒执行的浮点运算次数(
Floating-Point Operations Per Second)。 FLOPS是OPS的子集。OPS 是广义的“操作”,包含:- 整数运算(如 5+3)
- 逻辑运算(如 AND/OR)
- 浮点运算(如 3.14×2.18)→ 这部分即FLOPS
- 举例:某芯片1秒内执行了200亿次操作(OPS),其中50亿次是浮点运算 → 它的算力是 50 GFLOPS + 150亿次其他操作。
2.2.2. 领域专用类(垂直场景)
| 单位 | 全称 | 含义 | 等价关系 | 应用领域 |
|---|---|---|---|---|
| H/s | Hashes Per Second | 每秒哈希计算次数 | 1 TH/s = 10¹² H/s | 比特币挖矿 |
| IPS | Inferences Per Second | 每秒推理次数 | 依赖模型复杂度 | AI推理 (如ResNet-50) |
| FPS | Frames Per Second | 每秒渲染帧数 | 受GPU+CPU共同影响 | 游戏/图形渲染 |
2.2.3. 任务吞吐类(应用层效能)
| 单位 | 含义 | 依赖因素 | 案例 |
|---|---|---|---|
| QPS | 每秒查询次数 | 数据库芯片+算法优化 | MySQL数据库性能 |
| 图像/秒 | 每秒处理图片数量 | NPU算力 (TOPS) + 图像分辨率 | 手机AI相册分类速度 |
| token/秒 | 每秒生成文本单元数 | GPU算力 (TFLOPS) + 大模型参数规模 | ChatGPT响应速度 |
2.2.4. 能效比类(综合价值)
| 单位 | 公式 | 意义 |
|---|---|---|
| FLOPS/W | 算力 (FLOPS) ÷ 功耗 (W) | 每瓦电产生多少浮点算力 (数据中心核心) |
| TOPS/W | 算力 (TOPS) ÷ 功耗 (W) | 每瓦电产生多少AI算力 (手机芯片关键) |
2.3. 常见单位的换算
2.3.1. OPS衡量单位
| 衡量单位 | 英文全称 | 换算关系 | 中文全称 |
|---|---|---|---|
MOPS |
mega OPS |
=10^6 OPS |
每秒一百万次的运算 |
GOPS |
giga OPS |
=10^9 OPS |
每秒十亿次的运算 |
TOPS |
tera OPS |
=10^12 OPS |
每秒一万亿次的运算 |
POPS |
peta OPS |
=10^15 OPS |
每秒一千万亿次的运算 |
EOPS |
exa OPS |
=10^18 OPS |
每秒一百亿亿次的运算 |
ZOPS |
zetta OPS |
=10^21 OPS |
每秒十万亿亿次进雾 |
其中TOPS和OPS是最常被提到的单位,TOPS是AI芯片常用单位。
2.3.2. FLOPS衡量单位
| 衡量单位 | 英文全称 | 换算关系 | 中文全称 |
|---|---|---|---|
KFLOPS |
Kilo FLOPS |
=10^3 FLOPS |
每秒一千次的浮点运算 |
MFLOPS |
mega FLOPS |
=10^6 FLOPS |
每秒一百万次的浮点运算 |
GFLOPS |
giga FLOPS |
=10^9 FLOPS |
每秒十亿次的浮点运算 |
TFLOPS |
tera FLOPS |
=10^12 FLOPS |
每秒一万亿次的浮点运算 |
PFLOPS |
peta FLOPS |
=10^15 FLOPS |
每秒一千万亿次的浮点运算 |
EFLOPS |
exa FLOPS |
=10^18 FLOPS |
每秒一百亿亿次的浮点运算 |
ZFLOPS |
zetta FLOPS |
=10^21 FLOPS |
每秒十万亿亿次浮点进雾 |
其中其中TFLOPS和FLOPS是最常被提到的单位。
2.3.3. 精度换算关系(以AI芯片为例)
| 精度 | 算力单位 | 换算比例 | 算力值示例 |
|---|---|---|---|
| INT8 | TOPS | 1× (基准) | 100 TOPS |
| FP16 | TFLOPS | 1 TOPS ≈ 0.5 TFLOPS | → 50 TFLOPS |
| FP32 | TFLOPS | 1 TOPS ≈ 0.25 TFLOPS | → 25 TFLOPS |
【举例】:
- 芯片型号:英伟达H100 GPU
- FP16算力:1979 TFLOPS
- INT8算力:≈ 3958 TOPS (按比例推算)
2.4. 单位选择
算力单位的选择因场景而异:
- 科学计算 → FLOPS
- AI推理 → TOPS/IPS
- 图形渲染 → FPS(帧率)+ TFLOPS
3. 算力陷阱
- 厂商宣传的TOPS/TFLOPS 通常是理论峰值,实际性能可能仅达30%~70%(受算法、软件栈、内存限制)。
- 没有“绝对最强” :适合需求的算力才是最优解(如自动驾驶芯片追求低延迟而非峰值TOPS)。
- 芯片的实际算力 不等于 理论峰值,还受 内存系统、精度与量化策略、功耗与散热、软件栈与编译器等多种因素的影响。