1. 什么是算力?
算力就是计算能力(Computing Power
),通常是指芯片或计算机系统执行数值计算和任务处理的能力。
算力
通常由数据处理单元
提供,也就是我们俗称的芯片
,如CPU、GPU、FPGA、TPU等。
2. 算力的衡量
算力的单位体系庞大且存在多种维度和多重标准,其核心关系可总结为 “两大维度、四类单位、场景决定一切”。
2.1. 算力单位的两大维度
维度 | 定义 | 典型单位 | 应用场景 |
---|---|---|---|
基础操作维度 | 每秒执行的基础计算操作数量 | FLOPS, OPS, IPS, H/s | 硬件性能标定 |
任务效能维度 | 每秒完成的应用层任务量 | FPS, QPS, 图像/秒 | 用户体验衡量 |
2.2. 四类核心单位详解
2.2.1. 数值计算类(底层硬件)
单位 | 全称 | 计算类型 | 量级换算 | 典型场景 |
---|---|---|---|---|
OPS | Operations Per Second | 通用操作 (整数/逻辑等) | 1 TOPS = 10¹² OPS | AI推理芯片、边缘设备 |
FLOPS | Floating-Point Operations Per Second | 浮点运算 (小数/科学计算) | 1 TFLOPS = 10¹² FLOPS | 超算、GPU、AI训练 |
IPS | Instructions Per Second | 指令集操作 | 1 GIPS = 10⁹ IPS | CPU架构效能评估 |
说明: OPS
、FLOPS
、IPS
是业界最常用的三种算力衡量单位。
OPS与FLOPS的关系:
- OPS: 每秒执行的运算次数(
Operations Per Second
)。 - FLOPS: 每秒执行的浮点运算次数(
Floating-Point Operations Per Second
)。 FLOPS
是OPS
的子集。OPS 是广义的“操作”,包含:- 整数运算(如 5+3)
- 逻辑运算(如 AND/OR)
- 浮点运算(如 3.14×2.18)→ 这部分即FLOPS
- 举例:某芯片1秒内执行了200亿次操作(OPS),其中50亿次是浮点运算 → 它的算力是 50 GFLOPS + 150亿次其他操作。
2.2.2. 领域专用类(垂直场景)
单位 | 全称 | 含义 | 等价关系 | 应用领域 |
---|---|---|---|---|
H/s | Hashes Per Second | 每秒哈希计算次数 | 1 TH/s = 10¹² H/s | 比特币挖矿 |
IPS | Inferences Per Second | 每秒推理次数 | 依赖模型复杂度 | AI推理 (如ResNet-50) |
FPS | Frames Per Second | 每秒渲染帧数 | 受GPU+CPU共同影响 | 游戏/图形渲染 |
2.2.3. 任务吞吐类(应用层效能)
单位 | 含义 | 依赖因素 | 案例 |
---|---|---|---|
QPS | 每秒查询次数 | 数据库芯片+算法优化 | MySQL数据库性能 |
图像/秒 | 每秒处理图片数量 | NPU算力 (TOPS) + 图像分辨率 | 手机AI相册分类速度 |
token/秒 | 每秒生成文本单元数 | GPU算力 (TFLOPS) + 大模型参数规模 | ChatGPT响应速度 |
2.2.4. 能效比类(综合价值)
单位 | 公式 | 意义 |
---|---|---|
FLOPS/W | 算力 (FLOPS) ÷ 功耗 (W) | 每瓦电产生多少浮点算力 (数据中心核心) |
TOPS/W | 算力 (TOPS) ÷ 功耗 (W) | 每瓦电产生多少AI算力 (手机芯片关键) |
2.3. 常见单位的换算
2.3.1. OPS衡量单位
衡量单位 | 英文全称 | 换算关系 | 中文全称 |
---|---|---|---|
MOPS |
mega OPS |
=10^6 OPS |
每秒一百万次的运算 |
GOPS |
giga OPS |
=10^9 OPS |
每秒十亿次的运算 |
TOPS |
tera OPS |
=10^12 OPS |
每秒一万亿次的运算 |
POPS |
peta OPS |
=10^15 OPS |
每秒一千万亿次的运算 |
EOPS |
exa OPS |
=10^18 OPS |
每秒一百亿亿次的运算 |
ZOPS |
zetta OPS |
=10^21 OPS |
每秒十万亿亿次进雾 |
其中TOPS
和OPS
是最常被提到的单位,TOPS
是AI芯片常用单位。
2.3.2. FLOPS衡量单位
衡量单位 | 英文全称 | 换算关系 | 中文全称 |
---|---|---|---|
KFLOPS |
Kilo FLOPS |
=10^3 FLOPS |
每秒一千次的浮点运算 |
MFLOPS |
mega FLOPS |
=10^6 FLOPS |
每秒一百万次的浮点运算 |
GFLOPS |
giga FLOPS |
=10^9 FLOPS |
每秒十亿次的浮点运算 |
TFLOPS |
tera FLOPS |
=10^12 FLOPS |
每秒一万亿次的浮点运算 |
PFLOPS |
peta FLOPS |
=10^15 FLOPS |
每秒一千万亿次的浮点运算 |
EFLOPS |
exa FLOPS |
=10^18 FLOPS |
每秒一百亿亿次的浮点运算 |
ZFLOPS |
zetta FLOPS |
=10^21 FLOPS |
每秒十万亿亿次浮点进雾 |
其中其中TFLOPS
和FLOPS
是最常被提到的单位。
2.3.3. 精度换算关系(以AI芯片为例)
精度 | 算力单位 | 换算比例 | 算力值示例 |
---|---|---|---|
INT8 | TOPS | 1× (基准) | 100 TOPS |
FP16 | TFLOPS | 1 TOPS ≈ 0.5 TFLOPS | → 50 TFLOPS |
FP32 | TFLOPS | 1 TOPS ≈ 0.25 TFLOPS | → 25 TFLOPS |
【举例】:
- 芯片型号:英伟达H100 GPU
- FP16算力:1979 TFLOPS
- INT8算力:≈ 3958 TOPS (按比例推算)
2.4. 单位选择
算力单位的选择因场景而异:
- 科学计算 → FLOPS
- AI推理 → TOPS/IPS
- 图形渲染 → FPS(帧率)+ TFLOPS
3. 算力陷阱
- 厂商宣传的TOPS/TFLOPS 通常是理论峰值,实际性能可能仅达30%~70%(受算法、软件栈、内存限制)。
- 没有“绝对最强” :适合需求的算力才是最优解(如自动驾驶芯片追求低延迟而非峰值TOPS)。
- 芯片的实际算力 不等于 理论峰值,还受 内存系统、精度与量化策略、功耗与散热、软件栈与编译器等多种因素的影响。