本周工作思考
- 上传流程的日志优化
- 在文档小节,视频小节,AI作业,语音微课,uShow,Chatbot等内容类产品中都会涉及到一个基础功能-上传功能,作为基础功能它的稳定性和可靠性是其上层功能的可靠性的坚实基础,一些此类线上问题,因为缺乏必要的关键性日志,从而导致反馈问题找不到root case,也就没有彻底根除,另外的问题是上传功能涉及到浏览器本身流处理、网络异常管理、资源管理等本身的能力,我们也需要有必要的监控能力从而制定针对性策略来规避此类情况。本周结合线上反馈问题和Sentry issue,针对上传组件调整了日志策略,丰富了日志内容,在关键环节、关键方法中增加了日志,区分了错误、异常、日志记录等三种情况,同时对增加了网络异常和网络状态的监控。
- 考虑到线上稳定性要求、功能成本ROI和工作优先级安排,对现有流程和功能没有做深入优化,特别是本计划对分片逻辑优化,断网重试,弱网重试,分片重试,上传成功验证,异步调整为promise和await/sync等工作,我们放在6月份按照计划展开。
- 在开发设计中,监控的设计要需要予以特别的重视,特别是在AI类应用和基础功能的设计中,这类技术课题涉及如,如何保持日志的合理密度而保持最大的程序运行特征,如何准确的反馈异常情况,如何克服所在环境自身问题也就是如何极大的提高稳定性和可靠性,如何设计日志和业务逻辑的低耦合。在AI应用中通过基于监控能力的设计,是提高产品质量的重要保证,如设计评估系统保持AI的稳定可靠的输出,设计AI输出的安全防线(一旦AI输出了破坏我们安全防线的输出,系统如何做出应急措施),随着客户对AI应用的可靠性和安全性的要求的提高,监控能力会也会变得愈发重要,所以如何做好和应用好监控是我们日常开发中需要不断总结和实践的重要课题。