每月 1,000 美元成本下的向量搜索延迟和 QPS
数据集
P99 Latency (ms)
QPS
ZillizCloud-8cu-perf
2.5
9,704.42
Milvus-16c64g-sq8
2.2
3,465.17
OpenSearch-16c128g-force_merge
7.2
3,055.01
QdrantCloud-16c64g
6.4
1,242.43
Pinecone-p2.x8-1node
13.7
1,146.53
OpenSearch-16c128g
13.2
950.63
流式性能
本图表旨在对比两种场景下的搜索性能:一是在持续稳定插入压力下的‘流式’查询(于数据量 90% 时测量),二是在数据后的‘静态’查询。测试均基于 Cohere-10M 数据集,关键指标为 串行p99 延迟和最大并发 QPS。
绘制值
  • 静态
  • 持续插入(500行/秒)
  • 持续插入(1000行/秒)

ZillizCloud

8cu-perf

3,957
2,119
1,860

Pinecone

p2.x8-1node

1,131
367.4
369.7

OpenSearch

16c128g

505.7
161.7
149.7

QdrantCloud

16c64g

446.9
393.8
347.6

Milvus

16c64g-sq8

437.2
306
156
性能 vs. 召回率
数据集
绘制值
过滤性能
数据集
绘制值

AI Assistant