嵌入是数据的密集向量表示,通常用于捕获高维空间中的关系。在NLP中,像Word2Vec或GloVe这样的词嵌入将词表示为向量,编码语义和句法信息。例如,“king” 和 “queen” 具有相似的嵌入,并且具有性别差异。
通过优化任务来训练嵌入,例如预测句子中的相邻单词 (Skip-gram) 或填充缺失单词 (BERT)。然后可以针对特定应用 (如情感分析) 对这些预训练的嵌入进行微调。
除了NLP之外,嵌入在推荐系统、聚类和降维方面也很有用。例如,用户和项目嵌入可以代表协同过滤系统中的偏好,从而增强个性化推荐。