FAQ
人脸识别算法是如何工作的？

人脸识别算法是如何工作的？

分子相似性搜索识别具有相似化学结构或性质的分子。这种技术在药物发现和材料科学中至关重要，发现类似化合物可以加速创新。

该过程首先将分子表示为结构化数据，例如SMILES字符串，指纹或分子图。通常用于相似性搜索的指纹是编码分子特征 (如键、原子类型和官能团) 的二元向量。

生成查询分子的指纹并将其与数据库中的分子的指纹进行比较。相似性度量，如Tanimoto系数或Jaccard指数，测量查询和数据库指纹之间的重叠。更高的分数表示更接近的匹配。

更先进的方法使用图形神经网络 (gnn) 来生成分子的嵌入，捕获结构和功能特性。使用矢量数据库中的矢量相似性技术来比较这些嵌入，以进行可扩展和准确的搜索。

分子相似性搜索可以实现识别潜在候选药物、预测化合物活性以及将现有分子重新用于新应用等任务。其有效性取决于分子表示的质量和相似性度量的选择。

本内容由AI工具辅助生成，内容仅供参考，请仔细甄别

Zilliz Cloud 是一个高性能、易扩展的 GenAI 应用的托管向量数据库服务。

什么是文档数据库？

文档数据库是一种NoSQL数据库，旨在以文档形式存储、管理和检索数据。与传统的关系数据库不同，后者将数据组织为具有固定架构的表格，文档数据库将数据存储为独立的文档，通常采用JSON、BSON或XML等格式。每个文档可以包含嵌套结构和不同的属

在向量搜索的上下文中，向量是什么？

向量搜索通过将数据转换为称为向量的数学表示来对数据进行索引。这个过程始于通过机器学习模型将文本、图像或其他非结构化数据转换为数值向量。这些模型通常基于神经网络，生成捕获输入数据语义的嵌入。所得到的向量被存储在高维空间中，其中每个维度表示数据

在SQL数据库中，什么是规范化？

在SQL数据库中，规范化是一个用于组织数据的过程，旨在减少冗余并改善数据完整性。规范化的主要目标是将大型表分割成较小的相关表，并定义它们之间的关系。通过这种方式，每条信息只存储一次，避免了在多个地方保存相同数据所带来的复杂性。规范化通常涉及