加载中
DeepFlow 智能体发布!开启业务连续性保障新时代

随着大型语言模型(LLM)日臻成熟,AI 智能体(AI Agent)从概念走向实际应用的时代已然到来。在众多的智能体使用场景中,可观测性天然具备智能体成功落地的三大要素:高质量的结构化数据、功...

可观测性与AI:双引擎驱动IT系统迈向自动化与智能

在 IT 领域,可观测性指的是通过 IT 系统的外部输出,我们能够推断出其内部状态的程度,这一特性对于现代软件的运行、维护以及优化工作至关重要。 同样的,在 IT 领域,AI 代表 IT 系统所展现...

慢调用排查实录:高效定界服务网格 Sidecar 性能瓶颈

某车企在测试新业务时,发现某测试集群(A-Test-Cluster)的请求响应时间异常,而业务 POD 内部响应正常,初步排除业务逻辑问题后,故障被定位为网络层面性能瓶颈。本次案例揭示了复杂异构测...

慢调用排查实录:高效定界服务网格 Sidecar 性能瓶颈

某车企在测试新业务时,发现某测试集群(A-Test-Cluster)的请求响应时间异常,而业务 POD 内部响应正常,初步排除业务逻辑问题后,故障被定位为网络层面性能瓶颈。本次案例揭示了复杂异构测...

深度解析 DeepFlow 如何采集大模型服务的业务指标

为高质量支撑 2024 年客服大模型商用,中国移动构建了客服大模型“混合云”生产环境,确保大模型应用安全稳定运行、智算资源高效利用。面对当前跨云调用拓扑的复杂性,以及运维保障与业务运营...

3 分钟诊断 金融分布式核心交易系统 概率性交易失败

摘要:某银行分布式核心交易系统运行过程中,遇到了偶发性、无规律的交易失败,由于交易请求海量、通信关系复杂、应用实例动态等系统特点,传统监控工具的诊断能力受限,此类故障诊断极其困难...

eBPF 可观测性技术 3 分钟锁定银行信创云垃圾文件罪魁祸首

摘要:在某国有银行的信创云日常运维中,发现大量未知的垃圾文件,存在严重的系统运行隐患,其承载的分布式核心交易系统的运行稳定性随时可能受到影响,运维人员尝试寻找产生垃圾文件的源程序...

故障诊断 3 分钟锁定分布式核心数据库,加速金融科技信创开发、测试、迁移

摘要: 金融行业信创迁移过程中,故障定界困难、定位周期长、开发测试速度缓慢、生产运行风险高等因素正在不断地拖慢相关工作的效率和速度。如何让金融科技部门的业务信创迁移更快、更高效、...

蓝鲸观测平台:统一观测数据关联模型探索

前 言 本文为蓝鲸观测平台数据模块负责人 在 蓝鲸智云 和 DeepFlow 社区 合办的第六场 eBPF 零侵扰可观测性 Meetup 上的演讲,原来题为根因定位关键:统一观测数据关联模型探索 概 述 根因分...

eBPF 零侵扰分布式追踪 3 分钟锁定 Java 程序 I/O 线程阻塞

摘要: I/O 线程阻塞是Java 程序经常出现的问题之一,此类故障发生时 Java 程序的请求、响应在 I/O 线程向操作系统 Socket Buffer 读/写过程中发生阻塞,由于在业务代码插桩无法观测到 I/O ...

可观测性实战:从拨云见日到抽丝剥茧快速定位业务响应时延高问题

本文分享借助 DeepFlow 在某头部劵商业务压测场景中通过调用链追踪快速定位问题的过程。解决在容器云内等复杂调用场景中解决传统监控手段覆盖不全面、排障定位无手段等痛点。分享利用 DeepFl...

金山办公基于 DeepFlow 的零侵扰可观测性实践

作者:肖圆,高级研发工程师,负责金山办公私有化产品运维平台研发、监控告警体系建设、可观测性体系建设。 金山私有化项目在可观测性建设中,面临数据孤岛和缺乏全局视图的挑战,影响了问题...

云杉网络 DeepFlow & 必示RiskSeer 应用性能智能监控预警方案

随着云原生技术的广泛应用,社会数字化快速发展,政府、金融、通信、电力、制造、消费等各行各业正在不断的被数字化、智能化改变,涌现出越来越多的大型、超大型 IT 业务。随之而来的是 IT 业...

使用 DeepFlow 五分钟构建 Kubernetes 可观测性能力

DeepFlow 是一个基于 eBPF 技术的云原生监控平台。它不需要修改现有代码,就能展示应用的性能指标、访问路径和调用链等信息。使用 DeepFlow,云原生应用可以自动获得详细的监控能力,减少开发...

从部署到优化:富途证券的 DeepFlow 探索之旅

作者:姜远川,后端研发工程师,来自富途技术工程部 本文分享了富途证券引入基于 eBPF 的可观测性方案 DeepFlow,以应对传统 APM 所面临的诸如代码侵入性强和覆盖不全面等挑战的过程。在 TK...

DeepFlow 大模型智能体 3 分钟定位 Java 程序 Hang 故障

摘要:Java 程序 Hang 是应用运维中经常遇到的故障类型,由于此类故障与操作系统调度、应用代码逻辑等均有复杂的相互催化关系,故障触发条件极难确定,因此也是故障诊断中最难啃的骨头之一。...

DeepFlow 最佳实践 —— NVIDIA GPU 指标数据集成及统一观测

DeepFlow 可观测性平台以 eBPF 技术实现的零侵扰(Zero Code)分布式追踪为核心,不仅实现了面向应用的全栈(Full Stack)观测能力,同时通过开放的数据集成接口和智能标签(SmartEncoding)...

DeepFlow 最佳实践 —— Blackbox 拨测能力集成及统一观测

DeepFlow 可观测性平台以 eBPF 技术实现的零侵扰(Zero Code)分布式追踪为核心,不仅实现了面向应用的全栈(Full Stack)观测能力,同时通过开放的数据集成接口和智能标签(SmartEncoding)...

DeepFlow 最佳实践 —— 主机指标数据集成及统一观测

DeepFlow 可观测性平台以 eBPF 技术实现的零侵扰(Zero Code)分布式追踪为核心,不仅实现了面向应用的全栈(Full Stack)观测能力,同时通过开放的数据集成接口和智能标签(SmartEncoding)...

DeepFlow 零侵扰数据能力构建 AIOps 的基石

本文整理自云杉网络 DeepFlow 解决方案负责人李飞在“智能可观测运维技术 MeetUp”的演讲内容,主题为「DeepFlow 零侵扰数据能力构建 AIOps 的基石」。 感谢中兴通讯和龙蜥社区的邀请,今天非...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部