在一个使用sybase数据库的遗留系统中,存在一个用于生成增量id的存储过程getid。该存储过程首先更新一个记录最新id值的表id_table,然后查询更新后的值并返回。java应用程序通过spring的transactiontemplate调用此存储过程,并明确设置了serializable的事务隔离级别。然而,在每日约1万次的调用频率下,偶尔会出现id冲突,即生成重复的id。
CREATE PROC getId (@val int = -1 output) AS BEGIN UPDATE ID_TABLE SET LAST_VALUE = LAST_VALUE + 1 SELECT @val = LAST_VALUE FROM ID_TABLE RETURN @val END
Java应用层的调用逻辑如下:
public Integer getId() { TransactionTemplate txTemplate = new TransactionTemplate(txManager); txTemplate.setIsolationLevel(TransactionDefinition.ISOLATION_SERIALIZABLE); txTemplate.setTimeout(-1); return (Integer) txTemplate.execute((TransactionCallback) status -> idDao.generateId()); }
尽管应用层设置了SERIALIZABLE隔离级别,ID重复的问题依然存在,这让开发者感到困惑。问题症结在于,事务隔离级别是在客户端(Java应用)层面设置的,但如果数据库存储过程内部的操作本身没有被事务包裹,或者客户端事务未能正确传播并覆盖存储过程的全部逻辑,那么存储过程中的UPDATE和SELECT操作就可能在独立的、非事务性的上下文中执行。在这种情况下,UPDATE和SELECT之间会存在一个竞态条件:一个会话更新了LAST_VALUE,但在其SELECT到新值之前,另一个会话可能已经更新了LAST_VALUE,导致第一个会话读取到旧的或已被其他会话读取过的值,从而产生重复ID。事务隔离级别对这种“存储过程内部未事务化”的问题是无效的。
解决方案一:在存储过程内部显式管理事务最直接的解决方案是在存储过程内部显式地使用事务包裹UPDATE和SELECT操作。这样可以确保这两个操作作为一个原子单元执行,即要么都成功,要么都失败,从而避免竞态条件。
CREATE PROC getId (@val int = -1 output) AS BEGIN BEGIN TRAN -- 开启事务 UPDATE ID_TABLE SET LAST_VALUE = LAST_VALUE + 1 SELECT @val = LAST_VALUE FROM ID_TABLE COMMIT TRAN -- 提交事务 RETURN @val END
注意事项:
- 通过BEGIN TRAN和COMMIT TRAN,确保了UPDATE和SELECT的原子性。在一个事务中,其他并发事务将无法看到中间状态或干扰这些操作。
- 这种方法解决了存储过程内部的竞态问题,即使外部Java应用程序的事务没有完全覆盖存储过程内部的细节,存储过程自身的事务也能保证ID生成的唯一性。
- 在Sybase ASE中,如果数据库或会话配置了autocommit=false或set chained on,则每个SQL语句都会自动启动一个事务,直到显式提交或回滚。但在未明确配置的情况下,显式BEGIN/COMMIT TRAN是最稳妥的做法。
更优化的方法是重写UPDATE语句,使其在一个操作中完成ID的递增和新值的返回。这样可以完全消除UPDATE和SELECT之间的竞态窗口,使操作本身成为原子性的。
CREATE PROC getId (@val int = -1 output) AS BEGIN UPDATE ID_TABLE SET @val = LAST_VALUE + 1, LAST_VALUE = LAST_VALUE + 1 RETURN @val END
优点:
- 高度原子性: 这条UPDATE语句在一个单一的数据库操作中完成了值的更新和返回,无需显式事务包裹即可保证其原子性(对于Sybase ASE而言,一个单独的UPDATE语句本身就是原子操作)。
- 性能提升: 减少了一次数据库操作(移除了独立的SELECT),可能带来轻微的性能提升。
- 代码简洁: 存储过程逻辑更简洁明了。
注意事项:
- 此方案假定UPDATE语句在Sybase ASE中是原子性的。对于大多数现代关系型数据库系统,单条UPDATE语句通常被视为原子操作。
- 这种方法是解决此类ID生成问题最推荐的方式,因为它从根本上消除了竞态条件。
除了事务管理,数据库的锁定机制也对并发性能和数据完整性至关重要,尤其是在Sybase ASE这类数据库中。对于ID_TABLE这种高并发更新的表,其锁定粒度配置会直接影响ID生成的效率和冲突的可能性。
Sybase ASE的表锁定粒度主要有以下几种:
- allpages locking (全页锁定): 对数据页和索引页都使用页级锁定。在高并发更新少量行时,可能导致大量等待,因为即使只更新一行,也可能锁定整个数据页。
- datapages locking (数据页锁定): 只对数据页使用页级锁定,对索引使用行级或键级锁定。比allpages有所改善,但数据页锁仍然可能成为瓶颈。
- datarows locking (数据行锁定): 对数据行和索引都使用行级锁定。这是最细粒度的锁定,能够最大程度地提高并发性,因为它只锁定实际被修改的行,而不是整个数据页或索引页。
建议: 对于ID_TABLE这种专门用于计数器或ID生成的表,强烈建议将其配置为使用datarows锁定。这将确保在更新LAST_VALUE时,只锁定包含该值的具体数据行和相关的索引条目,从而最大限度地减少与其他并发事务的冲突和等待,避免因索引更新导致的竞态条件或死锁风险。
可以通过以下SQL命令检查或修改表的锁定方案:
-- 检查表ID_TABLE的锁定方案 sp_help ID_TABLE -- 修改表ID_TABLE为datarows锁定 (需要DBA权限) sp_chgattribute ID_TABLE, "lock scheme", "datarows"总结
在并发环境下生成唯一ID是数据库应用中的常见需求。当遇到ID重复问题时,即使应用层设置了高级别的事务隔离,也应首先审视数据库操作(尤其是存储过程)内部的事务管理和操作原子性。
- 确保数据库操作的原子性: 通过在存储过程内部显式BEGIN/COMMIT TRAN来包裹相关操作,或更优地,将多个操作重写为单条原子性SQL语句。
- 理解事务隔离级别: SERIALIZABLE隔离级别能有效防止幻读和不可重复读,但它依赖于整个操作链条(包括数据库内部)都处于同一个受控事务中。如果存储过程自身不遵循事务,则外部隔离级别可能无法完全生效。
- 优化数据库锁定机制: 对于高并发更新的计数器表,配置最细粒度的datarows锁定方案,可以显著提高并发性能并减少冲突。
通过以上策略,可以构建一个健壮、高效且能够可靠生成唯一ID的系统。
以上就是Sybase存储过程并发生成唯一ID的优化与事务管理实践的详细内容,更多请关注资源网其它相关文章!
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。