招聘 × 推荐:美版Boss直聘如何用Zilliz支撑超800万招聘JD的动态匹配

2025-07-28

By Jobright.ai联合创始人兼CTO: Ethan Zheng

招聘 × 推荐:美版Boss直聘如何用Zilliz支撑超800万招聘JD的动态匹配

前言

这篇文章来自Zilliz Cloud的一位资深用户Ethan Zheng的访谈整理而来,他是美版Boss直聘Jobright.ai的联合创始人兼CTO。在文中,他分享了自己在招聘软件以及海量非结构化数据高频增删改查的设计实践、数据库选型的技术取舍,对于有类似需求的企业是个很好的参考。


先给大家简单介绍一下我们是谁:

Jobright.ai,一个人工智能求职平台,也是目前行业内绝对的头部创业公司。

据 SimilarWeb 的数据,Jobright.ai 每天处理 800 万条活跃职位列表中超过 200 万次的用户互动,拥有近 5 万日活跃用户,是所有求职平台中平均用户访问时长最高的平台。

基于AI技术,我们打造了业界首创的 H-1B 签证担保筛选、AI职位推荐以及代理式求职等创新业务。也是基于以上创新,我们在细分赛道,只用了两年半,就超越了包括 LinkedIn 和 Indeed 在内的行业巨头。

很多人可能会觉得,AI求职听起来很简单,就是基于语义理解,然后把不同的职位与简历互相配对,然后居中收取中介费,这就大大低估了做AI招聘的难度。

从海量动态数据管理,到多模态内容识别,从多向量查询到弹性资源管理,行业的机会很大,但背后的技术天坑也同样不小。

以下是我们的完整项目经历复盘:

01 业务挑战:海量动态数据与复杂高并发业务

想象一下,Jobright.ai每天要处理数百万条职位数据、用户数据,并要在短短几毫秒内给出精准的个性化匹配结果。

短短的一句话描述背后,至少包含了四重挑战:

  • 海量求职数据的动态更新:不像传统静态的文档检索系统,职位数据需要实时动态更新,我们在平均800万条活跃职位的基础上,每天要处理超过40万条新增和删除的职位数据,而传统数据库根本无法应对这种动态数据流。
  • 多模态匹配、多向量查询的复杂性:平台不仅匹配关键词,还会根据职位描述、技能要求、公司文化和职业发展轨迹进行语义搜索。每个用户查询都涉及多个向量搜索,并结合复杂的筛选操作,例如地点、签证担保、经验水平以及其他数十个标准。
  • 高性能要求:用户每天平均与平台进行 40 多次互动,系统需要每天处理大约 200 万次个性化查询,同时保持 100 毫秒以下的响应时间。
  • 高并发负载挑战:招聘本身有淡旺季之外,一些大型公司也会频繁发布招聘信息,导致数据采集和用户查询量突然激增。基础设施需要能够在不影响用户体验的情况下处理这些突发模式。

传统的推荐系统,可以在一夜之间完成批量数据处理。

但在招聘场景,必须24小时实时密集进行数据的增删改查,招聘的职位供给在变,用户求职的简历内容会调整,甚至用户的求职意向也在不断变化。

企业的基础设施必须要能同时应对大规模数据和实时响应两大严苛要求。

02 技术选型:Zilliz Cloud如何成为救星

一开始,我们的内推发现系统是基于Python开发的一个简单的匹配引擎,但随着用户量的激增,它开始出现负载过重、崩溃和性能下降的现象。

用中国一个最常见的比喻来形容,就是在飞机飞行过程中,我们要换引擎了。

但越是这种紧急时候,就越不能着急,我们花了整整一周时间,对市场上的各种向量数据库进行了系统评估。从FAISS到Pinecone,再到Milvus和Zilliz Cloud,在看完文档后,我们给每个解决方案都构建真正的 MVP,然后在模拟的生产环境中进行了逐一的性能与扩展性测试,既要考核稳定性,也要考虑其真实的性能天花板。

但很可惜,向量数据库赛道看起来玩家很多,但多数产品用在生产环境都暴露了明显的局限性:

  • FAISS:最初看似前景光明,因为它抗住了 Meta 内部的长期考验。然而,当我们用它处理并发查询并不断插入和删除向量时,这个 Python 实现变得不稳定,在高峰使用期间还会出现内存峰值并崩溃。

  • Pinecone:的确有一些优点,其托管解决方案看起来也足够省时省力。但我们是一个服务全球用户的招聘平台,如果基础设施只在特定地区开放,夸张的时延会严重影响国际用户体验。

  • Elasticsearch:虽然在基本操作方面可靠,但无法有效地将向量相似度与 Jobright.ai 的数十个过滤维度(例如签证赞助、经验水平和公司规模)结合起来,最早被排除。

  • Milvus:扩展性良好、性能不错、还开源,但自托管需要我们投入大量人力和时间来进行管理,把工程资源从产品开发中转移出去,不利于我们保持小团队快速迭代。

濒临绝望之际,我们终于测到了Zilliz Cloud,只用了几个小时,我们就确定了,这是我们想要的向量数据库。

首先,Zilliz Cloud 能够无缝处理 Jobright.ai 的繁重工作负载,并始终保持稳定性能。且与自托管 Milvus 不同,Zilliz Cloud 是全托管方案, 无需额外数据库管理成本,让团队可以完全专注于产品开发。

此外,Zilliz Cloud 的动态schema支持让 Jobright.ai 实时测试并调整改进我们的职位匹配算法,而无需担心系统稳定性。

更让人惊喜的是,对于向量搜索和图谱关系分析结合,来查找公司内部的潜在推荐人的高级功能,Zilliz Cloud 也同样支持。

所以很快,我们就上线了六到七个专门的 Zilliz Cloud 实例,用于复杂匹配功能的支持。

03 如何用好Zilliz Cloud ,我们的小窍门

在业务落地上,我们每个实例都针对其用例和查询模式特性进行了优化。

以下是不同业务的核心特性梳理:

  • 核心职位匹配引擎:这个业务需要实时处理数百万个职位列表中的用户资料,同时考虑语义相似性、位置偏好、经验要求和签证赞助状态。我们选择了针对频繁更新和复杂过滤做了优化的高吞吐量实例。
  • 内推发现系统:我们会根据教育背景、工作经验和公司关系识别潜在的推荐人。相应的,这是一个典型的多向量查询场景,还需要结合向量相似性搜索和图谱关系进行分析查询。
  • 公司智能平台:这个模块主要用于处理公司简介、公司文化描述和招聘模式等信息,为用户提供超越基本职位描述的洞察,帮助他们了解公司适合度和招聘可能性。
  • 技能和职业分析:这个功能可以帮助用户做职业发展分析以及职业技能迁移,帮助用户了解他们的经验如何用于不同的职位和行业。

在所有这些内容被提取、索引和检索到 Zilliz Cloud 之前,所有数据都会使用 Jobright.ai 专门的微调embedding模型编码成高维embedding数据。值得一提的是,不同的内容与需求,我们会对应不同的微调embedding模型,比如职位描述会使用经过行业语言训练的模型,而公司文化描述则使用针对组织特征和价值观优化的模型。

此外,Jobright.ai 的匹配算法还会根据用户反馈不断改进,经常添加新的向量维度并修改过滤条件。在这一过程中,Zilliz Cloud 灵活的架构支持功能无需系统停机即可实现向量维度的更新,使团队能够在工作时间内部署算法并改进——事实证明,连续的服务保证,对于保持竞争优势至关重要。

当然,以上功能的构建,还只是使用了一些 Zilliz Cloud 的基础功能特性,优秀的团队不仅善于利用资源,更善于借力打力,将供应商的高级功能与特性,转化为自身的产品优势。

比如,Jobright.ai 还利用 了Zilliz Cloud 的高级功能——多向量检索与过滤检索,构建了一系列升级版功能。

过去,求职者要检索诸如“旧金山 50 英里范围内提供签证担保的初创公司的机器学习职位”这样将语义向量搜索与分类过滤器和地理限制结合在单个操作中,几乎是不可能的。同样的,公司要同时在多个向量空间中进行搜索——教育背景向量、工作经验向量和公司关系映射,也是难上加难。现如今,这些都已经能够很好的实现。

此外,平台位求职者做职业发展建议时,必须考虑用户的技能和兴趣会随时间演变,因此,我们还使用时间加权向量运算,来帮用户预测合适的下一步职业发展方向。

04 Zilliz Cloud 如何为 Jobright.ai 的 AI-First 架构提供支持

Zilliz Cloud的引入彻底改变了我们的平台架构,也使 Jobright.ai 从一家苦苦挣扎的初创公司转变为行业领先企业。

其影响如下:

  • 50ms 级的实时响应:系统的查询响应时间从之前的不稳定的200-500毫秒优化至稳定的100毫秒以下。核心匹配操作的 P95 延迟低于 50 毫秒。系统部署后实现了 99.9% 以上的正常运行时间,彻底解决了之前基础设施中频繁出现的中断和性能下降问题。该平台无缝扩展,从每日处理数千条查询扩展到每日处理超过 200 万次用户交互,无需进行基础设施变更,也无需担心性能下降。

  • 零数据库管理成本:_我们大约有一年的时间完全不用管理这个系统了。我甚至都忘了我们还在用它。这也是我认为对基础设施的最高评价——当你完全感觉不到它的存在时,它就是最好的。_Zilliz Cloud的托管服务让我们不用再为数据库管理而花费精力,团队可以完全专注于产品创新和用户体验的提升。

  • 更好的用户体验:Jobright.ai 用户数从第一年的 10 人飙升至近 50,000 人,月留存率还在不断提升,离不开推荐发现和 AI 驱动的申请协助等高级功能,背后则是Zilliz Cloud的高性能低成本的支撑。

  • 更快的功能部署,无需停机:Jobright.ai 团队现在每周都会发布新功能,底层基础架构却不会在更新或流量高峰期间崩溃。

  • 不断下降的单用户成本:自建基础设施到云服务,让Jobright.ai 从过去的刚性硬件成本支出,变成可预测的、基于使用量的弹性云服务定价,单用户基础设施成本也随着规模的增加而下降,支持了业务的可持续扩张。

结语

从技术上突破到行业领导者,我们的目标远不止于此。当前,Jobright.ai的日活跃用户数量已经从 当初的10 人增长至 5 万人,未来还将增加到50万人、500万人,甚至5000万人。

这背后,离不开 Zilliz Cloud 的全球基础设施,让我们实现了跨大洲的低延迟服务交付。未来,Jobright.ai还将继续扩展到欧洲、亚洲在内更多的国际市场。此外,我们还将同时为雇主增加B2B服务,力求打造全球最智能的“人才市场”。

作为AI领域的创业者,我深知这一过程的艰辛。在这里,我想分享一些我们的经验:

  1. 贴近用户比技术成熟度更重要。如果你不懂用户真正的需求,再好的技术也无济于事。Jobright.ai的成功正是因为我们始终保持与用户的紧密联系,通过每周的用户访谈和反馈来不断优化产品。

  2. 创始人要亲力亲为,核心业务 不能过早授权。技术和产品的推进离不开创始人亲自参与,这对团队的凝聚力和决策的准确性至关重要。

  3. 决策的频率比决策的速度更重要。虽然及时了解人工智能的快速发展至关重要,但过于频繁地进行战略调整可能会破坏团队的势头,并削弱用户的信任。

Jobright.ai的成长,离不开我们团队的持续努力和正确的技术决策。而Zilliz Cloud则是我们成功的背后推手之一。最初选择 Zilliz Cloud 时,我们以为只能解决扩展问题,但最终它还解决了我们的创新问题。可靠、强大的向量搜索基础架构,让我们能够大胆尝试此前无法实现的匹配算法。

这也是选择一个优秀的基础设施的意义所在,解决眼前的问题,更能赋能创新。

  • Jobright.ai联合创始人兼CTO: Ethan Zheng

    Jobright.ai联合创始人兼CTO: Ethan Zheng

    准备好开始了吗?

    立刻创建 Zilliz Cloud 集群,存储和检索您的向量。

    免费试用 Zilliz Cloud

    AI Assistant