人脸识别算法是如何工作的?

人脸识别算法是如何工作的?

分子相似性搜索识别具有相似化学结构或性质的分子。这种技术在药物发现和材料科学中至关重要,发现类似化合物可以加速创新。

该过程首先将分子表示为结构化数据,例如SMILES字符串,指纹或分子图。通常用于相似性搜索的指纹是编码分子特征 (如键、原子类型和官能团) 的二元向量。

生成查询分子的指纹并将其与数据库中的分子的指纹进行比较。相似性度量,如Tanimoto系数或Jaccard指数,测量查询和数据库指纹之间的重叠。更高的分数表示更接近的匹配。

更先进的方法使用图形神经网络 (gnn) 来生成分子的嵌入,捕获结构和功能特性。使用矢量数据库中的矢量相似性技术来比较这些嵌入,以进行可扩展和准确的搜索。

分子相似性搜索可以实现识别潜在候选药物、预测化合物活性以及将现有分子重新用于新应用等任务。其有效性取决于分子表示的质量和相似性度量的选择。

本内容由AI工具辅助生成,内容仅供参考,请仔细甄别

专为生成式AI应用设计的向量数据库

Zilliz Cloud 是一个高性能、易扩展的 GenAI 应用的托管向量数据库服务。

免费试用Zilliz Cloud
继续阅读
嵌入是如何用于聚类的?
“嵌入(Embeddings)是一种将数据点表示为连续多维空间中向量的方式。这种技术在聚类中特别有用,因为它将复杂数据(比如词语、图像或文档)转化为传达其语义意义的格式。当数据点嵌入到向量空间中时,它们的空间接近性表明相似性;在这个空间中靠
Read Now
警示措施会限制大语言模型的创造力或灵活性吗?
LLM护栏可以通过集成事实核查系统和利用实时验证工具来帮助防止错误信息的传播。这样做的一种方式是通过将生成的输出与受信任的数据库或源交叉引用。如果模型生成的语句与已验证的信息相矛盾,则护栏可以标记或修改响应。例如,使用像ClaimBuste
Read Now
Keras是什么,它与TensorFlow有什么关系?
随机梯度下降 (SGD) 是梯度下降优化算法的一种变体。与使用整个数据集计算梯度的传统梯度下降不同,SGD一次仅使用单个或几个数据点更新模型的权重,从而导致更快的更新和更快的收敛。 虽然这在梯度估计中引入了更多的噪声,但它允许模型避开局部
Read Now

AI Assistant