白皮书

Why Vector Databases Matter for Unstructured Data

2023 年 3 月 28 日

Whitepaper cover image

学习什么是向量数据库、如何使用以及为何使用向量数据库

在信息时代,随着数据量呈指数级增长,非结构化数据正在经历爆炸式增长。图像、视频、文本、医疗数据和住房数据是高速增长的非结构化数据。此外,智能手机、物联网设备和社交媒体进一步推动了非结构化数据的快速增加。据 IDC 预测到 2025 年,80% 的数据将是非结构化数据。并且根据 IDC 的 2022 年全球数据报告,2021 年至 2022 年非结构化数据的增长预计将超过结构化数据增长的 9 倍。机器学习技术可以将非结构化数据转换为特征向量。这种技术使得分析和管理非结构化数据成为可能。

这些非结构化数据的 Embedding 向量数量通常非常庞大,可以从数十维到数百维不等。向量数据库需要能够处理此类向量,并且要具备灵活性。此外,随着非结构化数据量的增长,向量数据占比进一步上升,对数据库提出了更高的可扩展性要求。本白皮书将介绍什么是非结构化数据、非结构化数据的主流用例,并分析 Milvus 与其他向量数据管理系统的不同之处。

分享

获取白皮书