人脸识别算法是如何工作的?

人脸识别算法是如何工作的?

分子相似性搜索识别具有相似化学结构或性质的分子。这种技术在药物发现和材料科学中至关重要,发现类似化合物可以加速创新。

该过程首先将分子表示为结构化数据,例如SMILES字符串,指纹或分子图。通常用于相似性搜索的指纹是编码分子特征 (如键、原子类型和官能团) 的二元向量。

生成查询分子的指纹并将其与数据库中的分子的指纹进行比较。相似性度量,如Tanimoto系数或Jaccard指数,测量查询和数据库指纹之间的重叠。更高的分数表示更接近的匹配。

更先进的方法使用图形神经网络 (gnn) 来生成分子的嵌入,捕获结构和功能特性。使用矢量数据库中的矢量相似性技术来比较这些嵌入,以进行可扩展和准确的搜索。

分子相似性搜索可以实现识别潜在候选药物、预测化合物活性以及将现有分子重新用于新应用等任务。其有效性取决于分子表示的质量和相似性度量的选择。

本内容由AI工具辅助生成,内容仅供参考,请仔细甄别

专为生成式AI应用设计的向量数据库

Zilliz Cloud 是一个高性能、易扩展的 GenAI 应用的托管向量数据库服务。

免费试用Zilliz Cloud
继续阅读
什么是文档数据库?
文档数据库是一种NoSQL数据库,旨在以文档形式存储、管理和检索数据。与传统的关系数据库不同,后者将数据组织为具有固定架构的表格,文档数据库将数据存储为独立的文档,通常采用JSON、BSON或XML等格式。每个文档可以包含嵌套结构和不同的属
Read Now
在向量搜索的上下文中,向量是什么?
向量搜索通过将数据转换为称为向量的数学表示来对数据进行索引。这个过程始于通过机器学习模型将文本、图像或其他非结构化数据转换为数值向量。这些模型通常基于神经网络,生成捕获输入数据语义的嵌入。所得到的向量被存储在高维空间中,其中每个维度表示数据
Read Now
在SQL数据库中,什么是规范化?
在SQL数据库中,规范化是一个用于组织数据的过程,旨在减少冗余并改善数据完整性。规范化的主要目标是将大型表分割成较小的相关表,并定义它们之间的关系。通过这种方式,每条信息只存储一次,避免了在多个地方保存相同数据所带来的复杂性。规范化通常涉及
Read Now

AI Assistant