您可以尝试使用一些常用的中国向量数据库,例如: 中科院计算所发布的THUCNews数据集,该数据集包含了大量的新闻文本向量。 搜狗实验室发布的SogouCS数据集,包含了一系列的中文文本向量。 哈工大发布的人民日报数据集,包含了大量的新闻文本向量。 这些数据库都可以通过搜索引擎或者相关机构的官方网站获取到具体的信息和下载链接,希望对您有所帮助。