有一批数据在数据库中,分 128 表按小时增量存储,现在有多个机器 每一小时处理一次,这些机器是消费者角色, 每个小时生产数据后,及时消费处理这些数据,待这个小时的数据全部处理完成后 汇总这一个小时的数据,这里面涉及多个分布式协调问题, 请教一个比较好的解决方案?
注意点
- 这一个小时产生的数据消费者不可以重复处理
- 这一个小时产生的数据消费者必须处理完,如果其中一台机器处理失败或者自己挂掉那么应该释放资源交给其他机器处理
- 这个方案中需要能够知道全部机器都已经处理完这个小时的数据
谢谢大家啦!麻烦大家推荐案例或者书籍或者大致思路, 不甚感激!!