NDB盘数据:当日志文件组中有超过18个undo日志时,无法重新启动集群。(错误# 251155785)
参考文献:参见Bug #28922609。
当本地检查点(LCP)在除一个节点外的所有数据节点上完成,而该节点失败时,
NDB
没有继续完成LCP所需的步骤。这导致了以下问题:没有新的LCPs可以启动。
重做和撤消日志没有被修剪,因此变得非常大,导致从磁盘恢复的时间增加。这导致了写服务失败,当重做日志的头和尾相遇时,最终导致集群关闭。这限制了集群的正常运行时间。
节点不再可能重新启动,因为数据节点重新启动需要节点的状态在磁盘上保持持久,然后节点才能在加入集群时提供冗余。对于具有两个数据节点和两个片段副本的集群,这意味着需要重新启动整个集群(系统重新启动)来修复问题(对于具有两个片段副本和四个或更多数据节点的集群,这是不必要的)。(Bug #28728485, Bug #28698831)
参考文献:参见Bug #11757421。
在某些情况下,节点可能在初始重启期间挂起。(错误# 28698831)
参考文献:参见Bug #27622643。
当表与
团
列被删除,然后用不同数量的团
列中的用于监视表更改的事件定义在某些涉及通信错误的错误情况下可能不一致,因为没有执行相应事件的预期清除。特别是,当新版本的表有更多团
列与原始表相比,一些事件可能丢失。(错误# 27072756)当在非常高的负载下运行具有4个或更多数据节点的集群时,数据节点有时会出现错误899Rowid已经分配好了.(错误# 25960230)
启动时,数据节点复制元数据,而本地检查点更新元数据。为了避免任何冲突,在复制元数据时暂停任何正在进行的LCP活动。当一个给定节点上的本地检查点暂停,而另一个也在重新启动的节点检查该节点上的一个完整LCP时,会出现问题;检查实际上导致LCP在元数据复制完成之前完成,因此提前结束了暂停。现在,在这种情况下,LCP完成检查等待完成一个暂停的LCP,直到元数据的复制完成,暂停在它开始的LCP中按预期结束。(错误# 24827685)
异步断连mysqld会导致后续任何启动NDB API事务的尝试失败。如果在批量删除操作期间发生这种情况,则SQL层调用
哈哈::end_bulk_delete ()
,其实现方法为ha_ndbcluster
假设事务已经启动,如果不是这样,可能会失败。通过在引用此方法使用的事务指针之前检查其是否已设置,可以解决此问题。(错误# 20116393)