当前位置: 首页 > news >正文

Java线程安全利器:CopyOnWriteArraySet详解

一、一句话理解

CopyOnWriteArraySet是一个线程安全的、基于“写时复制”策略实现的 Set,内部使用CopyOnWriteArrayList存储元素,因此具备与之相同的并发特性:读操作无锁高效,写操作昂贵但安全。


二、核心设计原理

1.底层结构

privatefinalCopyOnWriteArrayList<E>al;
  • 所有操作都委托给内部的CopyOnWriteArrayList
  • 因为List允许重复,而Set不允许,所以:
    • 添加元素时调用al.addIfAbsent(e)(确保唯一性)
    • 批量添加调用al.addAllAbsent(c)

✅ 这样既复用了CopyOnWriteArrayList的线程安全机制,又通过“仅添加不存在元素”实现了 Set 的语义。


2.关键特性(继承自 COW 思想)

特性说明
线程安全所有修改操作加锁,读操作无锁(依赖 volatile 数组快照)
写操作昂贵每次add/remove都可能复制整个底层数组(O(n) 时间 + 内存)
迭代器快照调用iterator()时捕获当前数组状态,遍历时不受其他线程修改影响
不支持Iterator.remove()UnsupportedOperationException
允许 null 元素CopyOnWriteArrayList一致
元素顺序按插入顺序(因为底层是 List)

3.构造函数的优化

publicCopyOnWriteArraySet(Collection<?extendsE>c){if(c.getClass()==CopyOnWriteArraySet.class){// 如果传入的是另一个 CopyOnWriteArraySet,直接复制其内部 listal=newCopyOnWriteArrayList<E>(cc.al);}else{// 否则逐个去重添加(使用 addAllAbsent)al=newCopyOnWriteArrayList<E>();al.addAllAbsent(c);}}
  • 避免重复去重:如果源集合已经是CopyOnWriteArraySet,说明它本身无重复,可直接拷贝底层数组。
  • 否则安全去重:通过addAllAbsent确保新集合中无重复。

4.equals()方法的特殊实现

publicbooleanequals(Objecto){// ...// 使用 O(n²) 算法比较两个集合是否相等// 因为假设集合很小(COW 适用场景),所以可以接受}
  • 为什么不用HashSet那种 O(n) 的方式?
    • 因为CopyOnWriteArraySet不提供哈希表结构,只能通过遍历比较。
    • 作者明确注释:“This algorithm is only appropriate for small sets”
  • 逻辑:对目标集合每个元素,在本集合中找一个未匹配过的相等元素,全部匹配且数量一致才算相等。

5.Spliterator 支持(Java 8+)

publicSpliterator<E>spliterator(){returnSpliterators.spliterator(al.getArray(),Spliterator.IMMUTABLE|Spliterator.DISTINCT);}
  • IMMUTABLE:遍历时底层数组不会变(快照)
  • DISTINCT:Set 天然无重复,告诉流框架可以做优化
  • 适用于并行流(parallel stream),但注意:由于是快照,看不到后续修改

三、适用场景(和CopyOnWriteArrayList一致)

读多写少
集合规模小(通常几十个元素以内)
需要在遍历时避免ConcurrentModificationException
不能或不方便在遍历时加锁

典型用例:

  • 事件监听器集合(如 GUI 回调、消息订阅)
  • 白名单/黑名单配置(偶尔更新,频繁检查)
  • 状态观察者列表
// 示例:注册回调处理器privatefinalCopyOnWriteArraySet<Callback>callbacks=newCopyOnWriteArraySet<>();publicvoidregister(Callbackcb){callbacks.add(cb);}publicvoidnotifyAll(){// 安全遍历,即使其他线程正在注册/注销for(Callbackcb:callbacks){cb.onEvent();}}

四、与ConcurrentHashMap.newKeySet()Collections.synchronizedSet(new HashSet())对比

方案读性能写性能内存是否有序适用场景
CopyOnWriteArraySet⭐⭐⭐ 极高(无锁)⭐ 极低(复制数组)高(写时双倍)✅ 插入顺序小集合、高频读、低频写
Collections.synchronizedSet(HashSet)⭐ 需加锁⭐⭐ 中等❌ 无序通用同步,但遍历需手动同步
ConcurrentHashMap.newKeySet()⭐⭐ 高(分段锁/CAS)⭐⭐⭐ 高❌ 无序高并发读写、大集合

💡 如果你不需要顺序,且写操作较频繁,ConcurrentHashMap.newKeySet()通常是更好的选择


五、注意事项

  1. 不要用于大数据量:写操作复制整个数组,GC 压力大。
  2. add()返回值有意义:只有当元素原本不存在时才返回true
  3. 组合操作非原子:例如if (!set.contains(x)) set.add(x)不是线程安全的(虽然add本身去重,但中间可能被其他线程插入)。
  4. 迭代器是“过期”的:它反映的是创建时刻的状态,不是实时视图。

六、总结

CopyOnWriteArraySetCopyOnWriteArrayList的 Set 封装版,通过委托 + 去重逻辑,实现了线程安全的无重复集合。它的设计哲学是:

“牺牲写性能,换取极致的读性能和遍历安全性”

在合适的场景下(小、读多、写少),它是优雅且高效的解决方案;但在高写频或大数据场景下,应考虑其他并发 Set 实现。


如果你正在处理回调注册、监听器管理、配置项缓存等场景,CopyOnWriteArraySet很可能就是你要找的工具。

http://www.cnnetsun.cn/news/182991.html

相关文章:

  • Bypass Paywalls Clean完整教程:轻松突破付费内容限制
  • 如何免费访问受限内容:面向普通用户的解决方案
  • 碧蓝航线Alas脚本终极指南:5步实现游戏自动化,彻底告别手动操作
  • Arduino控制舵机转动:核心要点之PWM周期设置
  • 5分钟掌握RePKG:Wallpaper Engine资源提取终极指南
  • 轻松3步掌握Wallpaper Engine资源提取:RePKG完整实战指南
  • TranslucentTB中文界面配置方法:轻松实现任务栏透明化
  • 如何轻松突破付费墙:Bypass Paywalls Clean 完全使用教程
  • 从 0 到爆单:Shopee 自养号测评精细化运营,快速打造高权重产品
  • 为什么顶尖AI团队都在关注Open-AutoGLM?(90%人还不知道的黑科技)
  • Blender 3MF插件终极指南:快速掌握3D打印工作流核心技巧
  • RePKG:解锁Wallpaper Engine壁纸资源的终极利器
  • 智慧树刷课插件:解放双手的智能学习助手
  • 还在手动调参?Open-AutoGLM开源地址发布,一键实现大模型自主推理与优化
  • 智慧树刷课插件终极指南:3步实现自动化学习
  • 【Open-AutoGLM技术深度解析】:揭秘下一代自动化大模型推理引擎核心原理
  • TranslucentTB中文界面设置完全指南:轻松实现任务栏透明美化
  • RePKG完全指南:解锁Wallpaper Engine壁纸资源提取的3大技巧
  • 还在等邀请码?Open-AutoGLM白名单申请技巧大公开,90%的人都忽略了这一步
  • elementUI的select下拉框如何下拉加载数据?
  • 5步彻底解决TranslucentTB安装失败:从诊断到完美运行全攻略
  • 教你使用服务器搭建一款基于 Rust 开发的跨平台文件管理器 Spacedrive
  • 深度拆解人机协同三大架构设计,教你打造高可用交互系统
  • 解放Dell G15散热潜能:轻量级开源控制中心完全指南
  • 为什么99%的团队在Open-AutoGLM部署上失败?真相令人震惊
  • 智慧树学习助手:自动化网课管理解决方案
  • B站视频转文字工具:3分钟实现智能内容提取的完整指南
  • Blender3mfFormat插件:3D打印工作流的智能升级指南
  • Blender 3MF插件终极指南:从零开始掌握3D打印文件格式转换
  • 强力解锁:3步搞定Wallpaper Engine壁纸资源提取终极方案