本周工作思考
- 排查log问题的简单总结
- 最近每天会抽点时间关注线上log问题,坦白来说,近一年来,log采集的及展示的基础设施建设上我们已经越过了0的阶段,现在正在往1的方向上奔
- 目前最大的痛点是对线上问题来说,用户反馈比我们自己发现比例大, 如何前置bug的发现,就是如何缩短发版后到线上bug被发现的时间是我们需要解决的问题;
- 我们现有已经拥有了sentry和kibana的能力,对web端来说,如何利用好这两个能力,可能是未来半年内我们要解决的问题;
- 稳定的服务质量对我们来说非常重要,随着客户使用的持续扩大和深入,需要更深入的思考质量建设,从设计开发到上线后持续跟进,都要纳入整个质量建设体系的考虑;
- 在日常的log跟进中,有一些关键log确实存在欠缺的情况,对于发现有欠缺的业务,可以随时补充,另外也要多想办法规避log不足带来的问题,最近在排查log的时候也有一些感触;kibana的监控里经常报BJ_report未定义的问题,其实在代码里是找不到直接引用BJ_report对象的情况,但是有if(BJ_report)的类似使用,虽然在chrome上没有报错,但是在一些低版本的浏览器里,对全局变量的使用可能会有差异,我们觉得大部分的时间都使用chrome,所有对兼容性的认识并不深刻,基于这些例子,我总结基本思路是大胆假设,认真推导和求证,log里总会有一些蛛丝马迹供我们参考和旁证,另外一个感触就是,自己的知识和经验还是太欠缺了,知识的欠缺就会导致推导和分析过程是错误的,还需要更加的深入学习,思考和沉淀;