[MySQL Bug] 在RBR复制模式上使用Merge引擎导致备库Crash的bug

[MySQL Bug] 在RBR复制模式下使用Merge引擎导致备库Crash的bug

转载请署名:印风

———————————————

最近碰到一个很蛋疼的BUG,使用merge引擎,row模式下复制,极大的概率crash备库。

我的测试环境是5.1的主库,5.5的备库

test case:

create table m1 (a int primary key, b int) engine=myisam; create table m2 (a int primary key, b int) engine=myisam; create table mm (a int primary key , b int) engine=mrg_myisam INSERT_METHOD=LAST UNION=(m1,m2); insert into mm values (1,2);

crash的原因非常简单,实际上在很早之前这个bug就fix了(MySQL Bug#47103), 可能是官方疏忽,又或者是Merge存储引擎用的人少,没有将这个patch backport到5.5中。

以下是个简单的介绍。

我们知道每个Binlog的行事件都有一个table_map_event。

在函数Table_map_log_event::do_apply_event中,会根据table map event的内容初始化table_list结构体,并构建table_list->m_tabledef。

这里的table_list->m_tabledef.m_field_metadata是被分配内存的。然后将该table_list挂到rli->tables_to_lock上

而在函数Rows_log_event::do_apply_event中,当调用open_and_lock_tables实际打开表时,还会打开相依赖的子表,并将这些table_list挂到rli->tables_to_lock之后(链接指针为next_global),但要注意,这里打开的依赖字表时,其table_list->m_tabledef.m_field_metadata实0x0,并没有分配空间

随后,在打开表后,要检查table map里的定义和实际打开表的定义是否相容。

7663 RPL_TABLE_LIST *ptr= rli->tables_to_lock; 7664 for ( ; ptr ; ptr= static_cast<RPL_TABLE_LIST*>(ptr->next_global)) 7665 { 7666 TABLE *conv_table; 7667 if (!ptr->m_tabledef.compatible_with(thd, const_cast<Relay_log_info*>(rli), 7668 ptr->table, &conv_table))

而在table_def::compatible_with中:

can_convert_field_to(field, type(col), field_metadata(col), rli, m_flags, &order)

其中type和field_metadata都会涉及到对m_field_metadata的引用,因此直接产生段错误,导致crash。

官方的fix见http://lists.mysql.com/commits/86326

[MySQL Bug] 在RBR复制模式上使用Merge引擎导致备库Crash的bug

相关文章:

你感兴趣的文章:

标签云: