-
Notifications
You must be signed in to change notification settings - Fork 329
Labels
Milestone
Description
现象
- 在用户完整部署 ModelEngine 的场景下,单独重启数据库实例,重启完成之后,在 Python Runtime 上运行的 Code 节点会无法调用。
- 重启 Code 节点所在的 Python Runtime 之后,一切恢复正常。
分析
- 无法调用 Code 节点,推测在注册中心中,该服务已经下线
- 因为注册中心的持久化数据目前强依赖数据库服务,当数据库重启时,存在短时间心跳断链的情况,正常情况下,各个 Runtime 可以在心跳恢复后重新注册上,也就是说,正常情况下,调用失败应该也是偶发,是可以自恢复的
- 但是当前情况下,Python Runtime 没有自恢复,推测 Python Runtime 在心跳逻辑中可能存在 bug
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
Type
Projects
Status
Done