降本50%以上,Zilliz助力豆神打造因材施教的AI教育平台
随着AI技术的不断发展,在线教育公司正积极寻求突破传统学习方式的创新手段。向量数据库作为处理非结构化数据的关键技术,正逐渐成为在线教育行业实现智能化、个性化教学的重要工具。
近日,AI教育领域的新锐企业豆神教育宣布进一步拓展其业务版图,进军人工智能软硬件领域,这一战略举措在业界引起了广泛关注。今年11月,豆神教育推出了集成大模型技术和全语文学科知识图谱的豆神AI,旨在提供定制化的个性化学习体验。通过使用向量数据库和知识图谱技术,豆神教育有效解决了大模型的幻觉问题,显著提升了教育产品的精准度。这些连续的创新行动不仅推动了豆神教育向科技型教育公司的快速转型,也促进了整个教育行业智能化进程的加速。
躬身入局:AI时代的突围者
时间进入2024年,大模型落地应用如雨后春笋,但在AI+教育领域,如何通过大模型来实现个性化的“因材施教”,如何保证内容输出的“准确性”?如何将时空上宏观上的历史规律性、微观历史故事性、局部冲突的博弈性还原给学生?这些都在考验所有业内参与者,而提出“大语文教育”模式的豆神教育无疑是出色的突围者。
同样,在AI浪潮中脱颖而出的还有 Zilliz—— 向量数据库全球领导者。Zilliz在今年由全球知名的IT咨询和评估机构Forrester发布的第三季度“Wave™ 向量数据库报告”中被评定为行业领导者。Zilliz并未选择在传统数据库基础上增加向量搜索功能的渐进式发展路径,而是采取了创新的“换道超车”战略,直接开辟了向量数据库这一全新领域,引领了数据库技术的新潮流。
而在“AI+教育”的赛道上,大语文教育的创造者豆神则选择牵手向量数据库的开拓者Zilliz,实现个性化的“因材施教”。
因材施教:通识+个性
教育的难点在于因材施教,既要给予通用的知识,又要尊重个体化的差异。
豆神教育CTO阎鹏介绍道:“语文好的诀窍是激发孩子对世界的兴趣,每个孩子的认知习惯和偏好的都有差异性,有人喜欢抽丝剥茧,有人喜欢宏观叙事,这与互联网的课程推荐是不一样的。
因此,豆神教育从去年开始引入大模型,通过向量数据库解决大模型的幻觉问题以提升准确性,同时结合知识图谱技术,高效、低成本的为每个学生定制自己的知识库、自己的学习助理。
1.png
这里有两层数据逻辑:
共性的认知存在图谱社区,图谱社区里面做符合教育心理学的认知逻辑,包括常识、知识、惯性思维。知识摘要部分embedding后存入Zilliz Cloud 向量数据库中。
个性的信息则进行独立管理和查询,这里面包括各自的数据,如学情、认知偏好甚至MBTI的存储。Zilliz Cloud支持将每个用户的全部数据保存在不同的数据分区(Partition)中,让数据操作只发生在各自的数据分区,在保证数据安全的同时,也能有更高的查询效率。
通过这两层逻辑的操作,相当于为每个学生构建了个人RAG图谱和自己的向量数据库。
AI时代向量数据库的难点在于需要理解用户的需求,不仅要有一揽子的方案,更要具有灵活性,符合业务实际需求。**而以下几点则是豆神教育在做向量数据库选型时的着重考虑:
生态开放性:“我们注意到Zilliz 长期与向量和AI上下游生态有深度合作”,一位来自豆神的开发工程师说,“有30多款AI平台工具和产品集成了Zilliz,可见他们的技术自由度”,这也是豆神教育选择Zilliz Cloud的核心原因。有行业深度的公司在RAG应用开发过程中,embedding、 reranking等阶段都有个性化的定制开发场景,因此向量数据库需要有技术自由度,Zilliz Cloud强大的生态能力非常适配当前豆神的技术方案。
实践的效率:豆神的Agent在每一至两周就会迭代,云厂商的产品节奏很难跟得上。Zilliz Cloud不断上新的产品能力能够匹配豆神的产品版本需求,比如二次压缩需要稀疏向量支持,多租户需要partition Key来寻址,“当我们需要的时候,Zilliz Cloud正好就有,而且Zilliz 经常听取我们对于功能上的需求,新feature的上线节奏也很稳健,这对我们的稳定性和先进性都很有价值。”
成熟度和稳定性:豆神技术团队考察了很多向量检索相关的项目,“发现Zilliz技术非常扎实,即使是开源产品Milvus也有强大的产品能力”。而其开箱即用的向量数据库服务Zilliz Cloud则帮助豆神减轻了运维、调优、高可用等方面的工作负担,帮助豆神轻装上阵。
全自研:才能走得更远
纵观豆神教育的创新旅程,也是埋头苦干的全自研之路。
而Zilliz自2019年推出首款Milvus单机版以来,基本保持了每两周发布一个新版本的快速迭代节奏,并与全球数以万计的企业用户紧密合作,不断优化产品。如今,Milvus已在Github社区获得了31K的高星评价,Docker下载量已超过6700万次,成为了全球备受欢迎的向量数据库产品。
Zilliz Cloud作为Milvus原厂Zilliz开发的全托管的 Milvus 向量数据库服务,在提供Milvus全部能力的基础上,具备更强的能力,为豆神AI的应用提供助力:
稳定性好、运维效率高——“Zilliz Cloud能应付自由和大动作的业务操作,基本就没出过问题,够稳、耐造!”阎总总结道。
提供 99.95% 的正常运行时间 SLA,通过内置的故障转移机制实现这种高可用性;
提供Time Travel 和丰富的RBAC权限管理等特性以确保更高灵活性和更细粒度的数据恢复能力;
支持全面的资源监控系统,使运维团队能够提前发现潜在问题,确保即使在发生变化时向量数据库也能继续良好运行。
成本逻辑清晰且灵活——“在使用Zilliz Cloud后,我们的业务实现了近50%以上的成本降低。”
- Zilliz Cloud提供灵活的技术选择及服务类型选择,业务总能找到最具性价比的选项。比如采用稀疏向量,可以实现高效的存储降低内存占用,同时也减少了计算资源消耗。Zilliz Cloud还根据企业发展的不同阶段和业务特性,提供了多种服务类型选择,并可以弹性扩展至支持百亿规模数据,业务不会为未使用的资源支付过多费用,也不会出现关键工作负载资源不足的问题。
安全性高——“Zilliz Cloud 特别适合异构数据,我们要确保模型的安全,就要从Gragh到embedding到个性化的算法支持进行全方位的数据加密”
- Zilliz Cloud 通过其全面的安全和合规特性将数据保护提升到一个新的水平。Zilliz Cloud 通过了 SoC 2 Type II、ISO27001、GDPR等一系列的合规认证,同时提供更细粒度的 RBAC,允许组织实施更细粒度的访问策略。Zilliz Cloud 提供数据传输加密和静态加密,全面的安全技术为向量数据库提供了更全面的保护。
而性能是Zilliz Cloud人尽皆知的优势了,其自研Cardinal索引算法比云厂商RAG和开源向量数据库产品性能(QPS)提升 10 倍以上,并能根据给定的数据集、查询和硬件配置自动择最佳索引策略...
革故鼎新,享受时间的复利
技术革故鼎新的力量在于其能够不断打破传统边界,而这种创新随着时间的推移能够累积并产生复利效应。
一如云计算的普及为大数据提供了存储和计算的平台,大数据分析又推动了机器学习模型的优化,而这些优化后的模型进一步增强了云服务的智能化水平。这样的循环不断发生,每一次迭代都建立在前一次的基础上,使得整个系统的性能和能力呈指数级增长。
而技术进步的脉搏,归根结底是由人类智慧所驱动。
未来,豆神教育计划为每个学生做全息建模,“人的数据本身可以是下一代的通信方式,我们要把对人的认可和引导都还原出来,把对人的脸谱化的任务、对人的情绪价值的索取通过Agent来实现,用AI来代替流程化的东西,这是我们长远的产品愿景”阎总描述道。
而Zilliz则会坚持在技术的探索之路上千里奔袭,将行业领先的优势持续扩大,让每一次技术的突破为下一次的AI应用飞跃奠定基础。