加载中
写在国庆前

9.11号在f公司最后一天,9.14号入职了t公司,截止到现在从f离开已经过去半个月,想写一些自己的心情和感受。 实话对f是很不舍,综合来说,f是一个很不错的公司,幸运的是在那里我也遇到了一个...

09/26 15:25
104
mongodb集群崩溃问题

2020-08-28 13:44-13:45 某mongodb分片集群、路由服务是三个节点mongos进程几乎同时coredump运行崩溃。 查看系统日志发现mongos进程coredump的信息、由于操作系统默认没有打开保存coredump文...

NTP服务导致的dubbo服务停止后无法摘除节点

2020-06-30 晚上 22:40左右出现大量的dubbo接口超时。 原因是NTP服务出现时间差,与真实的北京时间差了正好8小时,开始出问题的时间段,NTP服务由VM虚拟机切换到PVE虚拟机,但是切换机器之后...

07/08 16:39
42
野路子走法-shell脚本管道命令捞日志有感

捞日志和日志过滤分析几乎是家常便饭,但是因为shell脚本的命令每次都是用完就扔,没有在脑子里做过停留,所以想写个博客记录下,免得下次用又得查使用的正确姿势。 运营人员想要一批数据,这...

06/22 18:51
51
shardingJdbc3.x版本的分页问题

shardingJdbc 改名为 shardingsphere ,同时项目也已经毕业并成为 Apache 顶级项目,但是这是发现它的第二个重大BUG,说明还是有很大的进步空间。 上次发现的重大BUG可以看我的博客: https:...

ES某节点CPU增长至100%的诡异问题

这是一个从事发到目前为止我没有从根本上解决的技术问题,也是我心中的一个非常大的疑惑。 写于: 2020-06-14 周日,下午14:00 问题已解决,解决过程和方案可以看文章最末尾,解决方案写于 ...

实际需求中使用区间合并算法

一直以来都觉得算法源于生活,这次有个核心计费算法,有个同事用正常的思维逻辑写的,写的蛮不错的。但是代码审核的时候我们几个初次看都没太看懂,因为计费逻辑稍微复杂些,代码长度就比较长...

06/14 14:31
29
修改jvm-sandbox源码导致的线程安全问题

今天收到运维同事的消息,广告组某应用cpu从5月29号下午16:30开始陡增不下,本着对问题的好奇心帮忙排查了下这个问题。 首先看了下java进程的线程cpu使用情况,有四个处理线程每一个几乎一直...

06/04 00:33
48
redis6.0正式版的一些新特性之我见

两年前redis5刚出来的时候写过一篇 redis5.0正式版的一些新特性之我见 这次的文章参考redis的github仓库更新记录: https://github.com/antirez/redis/blob/6.0/00-RELEASENOTES 这次的大版本...

代码漏洞和风险

这几天在检查各个老项目的代码情况,本来是准备CodeReview用的,没想到越看越多的问题,一发不可收拾。。。 1. 随机数问题 可以参考: https://stackoverflow.com/questions/11051205/diffe...

03/19 20:31
98
kafka获取时间戳所在时间的偏移量

这是 kafka获取时间戳所在时间的偏移量 的小白文,哈,类似的这种骚操作很容易忘记,所以记录下。 当生产环境遇到问题的时候,我们需要从某时间段开始消费消息补充数据,类似于旁路脚本进行数...

03/10 19:58
973
这一年来(2019总结)

本来是早就想写2019年的总结,前段时间忘记了,这几天肺炎疫情严重,在家办公,正好抽空写个给自己的总结,也没有做什么格式编辑,想到哪里写到哪里,就当作随笔写的年终总结吧。 2019年对于...

02/10 17:39
129
深入探讨布隆过滤器

看了很多网上的文章好像对布隆过滤器有什么误解,不是抄袭就是拷贝来的文章,没有说到根本和真正的生产实践,还有的就是只说原理,但是你会发现合适的实现和原理有时候并不完全一样。 就以谷...

jvm-sandbox内存泄漏的严重BUG

我们的A应用第一次出现宕机是4号节点,时间在2019-11-24 晚上19点 原因是发生了fullGC,根本原因是元数据空间爆了。 2019-12-05T09:43:14.678+0800: 126777.294: [GC concurrent-root-region...

2019/12/05 20:14
1.4K
循环调用导致的OOM问题分析解决

问题背景: 2019-11-26 14:30左右我们的对外的web应用出现RPC调用超时的异常告警,查了日志下是调用内部广告系统超时,马上联系运维的同事去跟踪排查,因为不是自己项目组的东西,很多是没有...

2019/11/27 16:15
74
2019年双十一高峰感想

今年的2019双十一高峰基本上落下帷幕了,一般情况下是为期一周,到今天17号,我们做到了2019年双十一高峰期间核心业务0故障,稳如山,从双十一前一个礼拜到今天,半个月的时间,相比去年,今...

2019/11/17 13:14
179
双十一期间查询服务某节点OOM原因分析

背景: 因为双十一期间,物流在双十一之后的压力是巨大的,在之前我们的某ES集群已经扩了三个数据节点,今天11.12号发现集群的机械硬盘的机器根本扛不住, 决定临时就两个压力大的节点进行迁...

2019/11/13 15:29
171
大型kafka集群平滑迁移

我们有一套kafka集群属于比较大的业务量在用的,里面的消息很重要且量大,因为历史原因,部署在虚拟机上,现在想在双十一高峰来临前完全迁移到物理机。 迁移之前还是很担心数据是否丢失或者对...

2019/11/13 00:27
449
shardingsphered的线程安全问题

shardingsphere版本 3.1.0 ,也是目前的最新的正式版,项目并发量很高很笨重(启动较慢),且使用了按天分表策略,在使用shardingsphere的过程中发现其存在分表策略的线程安全问题,会导致分...

2019/11/12 18:06
154
记一次字符类型转换发生的生产事故

我们有很多套kafka集群,其中大致可以划分为一级队列kafka集群和二级队列kafka集群,消息发送到一级队列kafka集群,消费一级队列进行逻辑处理后入库再加入一些包装的字段统一扔到二级队列供其...

2019/11/06 20:43
65

没有更多内容

加载失败,请刷新页面

返回顶部
顶部