每月 1,000 美元成本下的向量搜索延迟和 QPS
数据集
P99 Latency (ms)
QPS
ZillizCloud-8cu-perf
2
13,316.23
Milvus-16c64g-sq4u-fp16-force_merge
2.3
9,575.69
Milvus-16c64g-sq8-force_merge
2.4
5,973
OpenSearch-16c128g-force_merge
7.2
3,055.01
ElasticCloud-8c60g-force_merge
17.1
2,353.89
QdrantCloud-16c64g
6.4
1,242.43
Pinecone-p2.x8-1node
13.7
1,146.53
OpenSearch-16c128g
13.2
950.63
TurboPuffer
56.7
798.33
流式性能
本图表旨在对比两种场景下的搜索性能:一是在持续稳定插入压力下的‘流式’查询(于数据量 90% 时测量),二是在数据后的‘静态’查询。测试均基于 Cohere-10M 数据集,关键指标为 串行p99 延迟和最大并发 QPS。
绘制值
  • 静态
  • 持续插入(500行/秒)
  • 持续插入(1000行/秒)

ZillizCloud

8cu-perf

7,385
2,119
1,860

Milvus

16c64g-sq8-force_merge

2,747
306
156

ElasticCloud

8c60g-force_merge

1,452
61.67
61.82

Pinecone

p2.x8-1node

1,131
367.4
369.7

TurboPuffer

2026-03-31

649.9
536
442.6

OpenSearch

16c128g

505.7
161.7
149.7

QdrantCloud

16c64g

446.9
393.8
347.6
性能 vs. 召回率
数据集
绘制值
过滤性能
数据集
绘制值

AI Assistant