成本降50%、准确率提升40%,美国头部地产AI 公司用Agent弯道超车

在中国,买一套房,除了要有钱,还要看居住证、看社保、看户籍地;要关注当地限购政策,关注交易税,关注银行贷款、资金审核、税率变化……各种乱七八糟的文件与政策看得人头晕眼花?
其实美国也一样。
据估算,在美国,完成一套房地产交易,前前后后涉及的文档页数高达上千,即使专业地产经纪,也常常被绕得头晕眼花。
那么,有什么办法能够简化这个流程,让买卖双方,都能将精力放在最重要的事情之上,比如选房、比如砍价?
美国头部地产交易服务商Rexera正是大模型时代,agent加速业务创新的代表性玩家。
01 为什么Agent最先在地产交易迎来aha时刻
一个有意思的故事是,Rexera的发展,有点像DeepSeek转型的美国版演绎。
其实2020年之前的时候,Rexera的创始人还在一家全球头部对冲基金工作。那时候这家基金公司已经开始用机器学习和统计数据来管理数十亿美元的投资。但很快,Rexera 首席执行官兼联合创始人 Vishrut Malhotra发现“在华尔街,你可以在几天内在启动一只 30 亿美元的基金,但购买个一居室的公寓,就算是个懂行的人,也需要前前后后花费8个礼拜的时间去处理。”
为什么就没人想到把量化对冲基金用的自动化工作流程引入房地产行业?
既然没人这么做, Vishrut Malhotra就亲自下场;然后, 2020 年 Rexera 成立了。
但与量化基金基于公开数据训练好模型,不断调参就能执行交易不同,地产交易通常会面临大量的私有数据,以及非结构化数据,一个模型无法搞定所有流程。
只有大模型不可以,那再给大模型加上向量数据库,做成RAG,不就好了?
所谓RAG,就是让AI不仅基于已有的公开知识生成答案,还能从向量数据库中检索到最新或最相关的信息来增强生成内容的质量和准确性。
如此一来,你问:“XX交易的关联方以及各自适用的交易规则都有哪些”时, 大模型无法直接回答的问题,使用RAG技术,将相关的历史资料汇集,就能生成一个足够准确又智能的回复。
靠着这个RAG搭建的agent, Rexera 成立伊始,就对美国的传统地产服务机构形成了降维打击。相比同行,Rexera 的解决方案为客户在每笔交易中节省了 至少4 小时的手动文件审查时间,并将运营成本降低了 25%。
仅用了五年多时间,Rexera 就服务了超350+机构客户,几乎覆盖了美国所有主流的:产权与托管公司(Title & Escrow)、贷款机构(Lenders)、单户住宅投资者(SFR Investors)、房地产律师事务所(如 Hankin & Pack),每天处理的任务数超10,000+。
02 高效的基础设施,如何加速创新?
当然,Rexera的AI之路走的并非一帆风顺。
一开始, Rexera 处理的文档相对简单——比如少于 10 页的发票和证书,可以直接输入到大型语言模型(LLM)中,做内容提取,以及基础问答。
但很快,与客户的合作进一步加深,客户直接将数千页的所有房地产文档一股脑交给了 Rexera。这个长度远远超过了 LLM 的上下文窗口限制。
因此, Rexera简单评测之后,选择了比较容易上手的向量数据库解决方案 Deep Lake,然后将embedding数据存储在 S3 存储桶中。但很快,性能瓶颈就出现了,系统需要先下载整个向量数据集到服务器上,然后进行相似性计算,过程中的时延高到足以把每个客户等到崩溃。
于是,Rexera决定上线专业的向量数据库产品。而在GitHub上star数量在同类型产品中排第一的Milvus,自然就成为了Rexera选型时候的第一优先级。
果不其然,在 Kubernetes 集群上的自托管 Milvus,存的快、搜的快、成本低,稳定性也高。
唯一的美中不足是,流量高峰期,一天处理的任务数万笔的情况下,Rexera的客户量还在不断增长——这需要一个极致弹性的架构。
与此同时,客户的要求也越来越多,比如交易完成,所有的embedding数据就要删除,来保护客户隐私——高频的数据增删,对索引的构建与维护能力,提出了巨大的要求。
Rexera很快意识到,对高增长企业来说,向量数据库,不仅要高性能,还要可扩展,还要0运维,公司需要把精力放在最重要的事情上。
是时候,再来一次转型了。
03 为什么是Zilliz Cloud
在对包括 Weaviate 和 Chroma 在内的多个向量数据库行全面评估后,Rexera 最终选择 Zilliz Cloud 作为其RAG系统的基础设施。
为什么选择Zilliz Cloud?
Rexera 的工程师们给出了很多原因,比如:
Zilliz Cloud可以做到低延迟、高扩展,比其他方案延迟低 30%:Zilliz Cloud 可以毫秒级完成文档检索和上传,让Rexera 实现了近乎实时的交易处理。而其高扩展性,也让Rexera 足以应对随时到来的流量洪峰,避免了自托管解决方案所面临的成本与运维问题。
Milvus迁移过渡到Zilliz Cloud丝滑到几乎无感:工程师可以快速启动本地 Milvus Docker 容器进行测试,然后在生产环境中无缝连接到 Zilliz Cloud。
完善的社区服务:使用开源Milvus期间,Milvus团队提供的各种高效应答、无偿帮助以及先进案例分享,让Rexera 感受到了更多的信任。
除此之外,Rexera 特地提到了Zilliz Cloud混合搜索功能对Rexera 基础设施架构的优化:Rexera在Zilliz Cloud混合搜索功能正式发布前大约两个月就抢先做了体验,他们发现与很多同类产品只能做语义搜索相比,Zilliz Cloud的混合检索功能即使横跨数千页面,也能将检索准确率提高40%。
而基于混合检索,企业从此无需为不同的搜索类型维护单独的数据库,总成本能降低至少 50%。几乎在Zilliz Cloud混合搜索功能上线的同一时间,Rexera 就彻底淘汰了 Elasticsearch,改为使用 Zilliz Cloud 进行向量搜索和全文搜索,极大降低了运营开销并简化了其基础设施。
基于更优的性能、更简的运维、更低的成本, Rexera 得以将精力集中在最重要的事情之上,专注于创新。而基于Zilliz Cloud,Rexera还推出了三大创新功能
- Iris——从复杂的房地产文件中提取并验证数据
- Mia——根据通信历史生成智能电子邮件自动回复
- Ria——提供自动短信回复,让各方随时了解情况
在Rexera看来,这些功能的推出,不仅完善了Rexera的产品能力,同时也让Rexera的客户付费率有了进一步的提升。
而Zilliz Cloud不仅是Rexera的基础设置构成,更是加速创新的助力。
04 地产agent究竟要怎么做?
当然,一个完善的地产交易agent,并不是搞定产品选型就一切高枕无忧了的。
在Rexera ,一个完整的agent落地会分为以下几个环节:
第一步:文档提取与嵌入
随着新的交易文档的不断涌现,从抵押贷款还款单据到业主协会(HOA)的电子邮件,Rexera 会利用 OpenAI的text-embedding-3-large 或 AWS Bedrock 模型(通过 OpenRouter)对这些文档进行编码,生成embedding数据。这些embedding数据连同元数据(如订单 ID、文档类型、组织 ID 等)一起存储在 Zilliz Cloud 中,确保高效的管理与检索。
这些embedding数据会随着文档内容的变化而不断更新,确保系统始终使用最新信息。
第二步:agent 编排(整个系统的核心)
Rexera 的 AI agent架构是一个模块化、生产级系统,专为大规模交易自动化而构建。其核心是Agent One,这是一个由 LangChain 的可组合工具和 LangGraph 的动态工作流驱动的集中式编排器,并由 LangSmith 提供跨链可观察性。这一分层架构支持在自动化任务(如呼叫自动化、Web 自动化、文档分析等)中实现可调优、可解释的agent行为。
第三步:上下文检索与混合搜索
当agent(如 Max、Mia、Iris)需要获取上下文以做出决策或生成输出时,Agent One 会使用 Zilliz Cloud 提供的混合搜索功能,在几毫秒内检索出最相关的内容。该混合搜索结合了向量相似性搜索、全文搜索以及结构化元数据过滤,确保获取到准确、及时的信息。
第四步:多模型验证
针对关键交易,检索到的上下文会通过多个大型语言模型(如 Claude 或 OpenAI GPT)进行验证,以确保信息的准确性与多视角的理解,从而增强系统的稳健性和可信度。过程中,会对答案进行排序,并确定是否需要人工干预。
第五步:流式更新至 Zilliz Cloud
随着交易生命周期的推进,文档内容不断更新,新的嵌入将实时流式传输至 Zilliz Cloud。通过这种方式,检索结果始终反映最新的文档状态,确保信息的时效性和准确性。
Rexera 与 Zilliz Cloud 和其他 AI 工具的集成工作流程大致如下:
图:Zilliz Cloud 如何支持 Rexera 的 AI Agents 系统
结语
实际上,Zilliz Cloud与Rexera 的合作才刚刚起步。随着企业客户需求的增长,Rexera 团队还计划:
启用完全多租户功能:虽然基于元数据的分离目前有效,但 Rexera 将采用 Zilliz Cloud 的多租户功能来支持大型客户的严格数据隔离。
持续评估新模型:embedding和 LLM 模型不断根据实际工作负载进行基准测试,以确保顶级性能。
扩展agent功能:以可扩展向量搜索为基础,Rexera 正在探索新的agent行为——从动态摘要到预测合规工作流程。
在Rexera 看来,在AI时代,一个高速发展的组织和公司,赢得胜利的秘诀就两个:
第一,善于降维打击、跨行业资源与数据整合,比如Rexera将过去量化对冲的思路用于地产交易;
第二,加速、加速、再加速。AI时代,技术进步的速度一日千里,企业必须将精力放在最重要的事情,以及最新的技术趋势上,而选择合适的合作伙伴、优化基础设施,是加速与专注的必要条件。
技术干货
打磨 8 个月、功能全面升级,Milvus 2.3.0 文字发布会现在开始!
七大变化详解 Milvus 2.3.0
2023-9-1技术干货
向量数据库发展迎里程碑时刻!Zilliz Cloud 全新升级:超高性价比,向量数据库唾手可得
升级后的 Zilliz Cloud 不仅新增了诸如支持 JSON 数据类型、动态 Schema 、Partition key 等新特性,而且在价格上给出了史无前例的优惠,例如推出人人可免费使用的 Serverless cluster 版本、上线经济型 CU 等。这意味着,更多的开发者可以在不考虑预算限制的情况下畅用云原生向量数据库。
2023-6-15技术干货
一次解决三大成本问题,升级后的 Zilliz Cloud 如何造福 AIGC 开发者?
对于应用开发而言,成本问题向来是企业和开发者关注的重点,更迭迅速、变化莫测的 AIGC 时代更是如此。这里的成本既指软件开发成本,也包括硬件成本、维护成本。Zilliz Cloud 可以一次性解决这三大问题,帮助开发者降低开发成本、优化硬件成本、减少维护成本。
2023-7-6