Sidekiq "ActionMailer::MailDeliveryJob" worker error rate violating SLO
问题、需求描述
这是一个持续了较长时间的问题,问题现象如下:
-
Sentry 错误
Net::SMTPSyntaxError
:错误消息为:500 Bad request (syntax error or unrecognized) [@sm190201] - 监控系统中也有相关的告警(thanos graph)
需要分析原因,并适当处理。
提案
查看日志,发现几个现象:
- 大部分是在以下调用的过程中发生的
- 相关用户的用户名都是
blankxxx
的
- 这些用户可以在这里查看。
- 部分用户的邮箱名称不对,比如
temp-email-for-oauth-中文名字@gitlab.localhost
,这样的用户有一批;不过也有用户的邮箱地址是正常的。 - 似乎都是有 dingtalk 的 identities provider,不过这一点并不完全确定,因为用户名为
blankxxx
的用户有 1000+。
- 部分用户的邮箱名称不对,比如
@shreychen 可能需要研发同学帮忙分析一下。
验收标准
分析问题原因,并处理。
由 Kang Liu 编辑于