Zadig 携手乐檬软件:打通新零售 BizOps,优化客户服务体验

原创
07/05 10:29
阅读数 2.5K
 
在新零售的竞技场中,乐檬软件以其革命性的线上线下融合方案和前沿的数据分析技术,迅速跻身行业前列。服务众多知名品牌如零食很忙、好想来、杰记水果,乐檬以卓越的技术实力和创新服务理念,赢得了市场的一致认可。
随着业务的蓬勃发展,乐檬软件面临提升研发和运维效率的新挑战。在这一关键时刻,Zadig 云原生 DevOps 平台的引入,成为乐檬软件提升服务质量、优化软件交付流程的关键。这一战略举措不仅简化了内部流程,更极大提升了研发效率,增强了终端客户的服务体验。
Zadig 平台的助力,让乐檬软件在数字化转型的道路上迈出了坚实的步伐,实现了从传统 DevOps 到云原生助力业务发展的成功转型。这不仅巩固了乐檬在新零售领域的领先地位,更彰显了其在行业变革中的卓越实力和前瞻视野。

乐檬的产研场景和痛点

随着业务的扩展和市场需求的增长,乐檬软件面临着一系列挑战,尤其是在提高研发效率、优化运维流程和增强业务稳定性方面。作为企业服务平台,我们为众多大型客户提供服务,包括公有云 SaaS 服务和私有化 PaaS 平台部署。然而,在服务过程中,团队常常面临繁重的人工操作和频繁的变更发布,这些问题不仅增加了工作负担,也影响了客户服务的满意度。

 
研发困境:
· 发布登记繁琐 :研发团队需在 Confluence、钉钉日历、钉钉群等多个平台上手动登记和协调发布信息,这一流程不仅耗时长,而且容易出错。
· 功能与版本追踪困难 :上线功能与制品版本的追踪不明确,导致功能更新可能未能如期上线。
运维难处:
· 发布流程复杂 :运维团队需要在 Confluence 和 Jenkins 之间手动同步信息,这一过程效率低下且存在出错风险。
· 服务状态可视化不足 :Jenkins 发布后,运维团队难以直观查看应用容器组的状态,包括镜像版本和 pod 状态,这影响了发布后的风险评估。
· 发布更新人力投入高 :频繁的发布更新导致运维人力投入巨大,打断率高,时间碎片化严重。
业务稳定性影响:
· 发版异常回滚困难 :在发版过程中一旦发生异常,回滚操作复杂,需要手动查找信息和执行替换操作。
· 运维人力保障风险 :在非工作日,运维响应可能不及时,这增加了故障恢复时间,对业务稳定性构成风险。

DevOps 方案选型之路

在构建我们的 DevOps 方案过程中,我们审慎评估了两种策略:自主研发与采购商业解决方案。深入分析后,自主研发不仅成本较高,而且与我们的核心业务关联度有限。鉴于此,我们决定采用市场上经过验证的成熟商业 DevOps 方案。
面对我们复杂的客户交付需求,我们对一系列云厂商 DevOps 平台和云原生 DevOps 解决方案进行了详尽的评估。我们的评估侧重于以下几个关键维度:
1. 发布编排能力 :评估平台对复杂客户场景的发布编排支持能力。
2. 多云与多集群支持 :考察平台对多云架构、多集群以及不同客户环境的适应性。
3. 网络与部署灵活性 :评估平台在复杂网络环境和私有化部署方面的表现。
经过严格的比较和深入分析,我们选择了一个专注于 DevOps 领域的中立云原生平台 Zadig。这一选择基于其在上述评估标准上的卓越表现,以及对客户需求的深刻理解。

Zadig 平台解决方案

我们通过以下几个关键能力将 Zadig 运用起来:
多集群接入管理 :利用 Zadig 多集群管理能力接入 9 个集群,实现统一的资源层接入;通过 Zadig 环境管理将公有云及客户环境进行合理业务分组,使得所有环境透明化,服务状态和稳定性状况一目了然。

简化发布流程 :通过 Zadig 发布计划模块,我们实现了发布流程的绝大多数的自动化,减少了大量手动登记和协调的工作量。Zadig 的集中化管理界面帮助我们统筹发布计划和跟踪过程。

版本追踪与可视化 :Zadig 提供了清晰的版本管理和追踪功能,确保研发团队能够明确查看每个客户上线功能对应的制品版本。同时,容器状态的可视化大大减少了发布后的风险。

自动化与协同 :Zadig 的自动化工作流减少了运维团队的手动操作,降低了出错风险。研发与运维团队的协同作业变得更加高效。

快速回滚与风险降低 :Zadig 的快速回滚功能确保了在发版异常时能够迅速恢复到正常状态,减少了业务中断时间。同时,Zadig 的使用降低了对运维人力的依赖,提高了非工作日的业务稳定性。

我们如何一步步实施 Zadig

首先,做 基础准备和配置 :通过 Zadig 的文档完成私有化的安装部署和高可用调优,将现有工具链和基础设施集成到 Zadig 中,比如 GitLab、Kubernetes、多家云厂商的镜像仓库,整个过程仅耗时 1 天。
其次,在 典型项目实施新流程 :在不影响现有流程的前提下,我们为开发、测试、发布过程创建了 Zadig CI/CD 自动化工作流,这些工作流在数量上远少于传统的 Jenkins 流水线,并且能够快速转化为可复用的工作流模板。关键在于,我们结合现状和流程优化点,提前梳理并设计了自动化流程,确保了实施过程在大约 1 周内顺利完成。
最后,进行 全面推广和团队培训 :我们着重于知识的传递和团队能力的建设。通过组织培训会议,我们确保了研发和运维团队对 Zadig 平台的熟悉度。在首个项目成功接入后,我们更加自信地将 Zadig 应用于更多项目中。由于我们处于客户生产环境,我们采取了十分谨慎的态度,这一步虽然花费了接近两周时间,但它为团队的长期成功奠定了坚实的基础。

成果展示

目前已经接入 8 个项目,9 个集群,实现 125 个环境和 103 个服务的自动化运维和客户部署。

通过引入 Zadig,客户服务效率大大提升,减少了频繁的客户发布中的手忙脚乱。同时随着项目的稳定运行,Zadig 系统自动收集大量工程数据,帮助我们更好洞察当前的项目运行状况。

相比过去,内部运维管理效率也得到极大的提升:

· 预计每年通过节省损耗释放 1200+ 人天 ,优化人力资源配置。
· 通过发布流程的优化,人力投入降低约 65% ,时间碎片化和打断率显著减少。
· 快速回滚能力,使得故障恢复时间缩短 50% ,增强业务的弹性。
· 大幅减少了因版本混淆导致的发布出错问题,发布准确性大幅提高
· 因为改进交付流程,使得客户满意度和对外服务体验稳步提升

未来展望与结语

乐檬软件将持续挖掘 Zadig 平台的潜力,致力于自动化测试和部署流程的深度优化。我们相信,通过 Zadig 的先进 DevOps 理念及强大的自动化功能,能够显著提高研发效率并优化产品质量。我们的目标是将这些成果扩展至更多团队和项目,同时,我们也期望乐檬的转型经验能够激励并指导其他团队顺利实现 BizOps 转型。
Zadig 的引入已为乐檬带来了研发和运维效率的飞跃,加强了业务流程的稳定性与连续性。我们对 Zadig 的综合评价是“高效、可靠、易用”,这不仅满足了我们的当前需求,更为未来的技术演进提供了坚实基础。我们对与 Zadig 进一步深化合作充满期待,携手共创更加辉煌的未来。
展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
1 收藏
0
分享
返回顶部
顶部