当前位置: 首页 > news >正文

defaultdict详细解释

defaultdict是 Python 标准库collections模块中的一个特殊字典类,它为不存在的键提供默认值,避免KeyError异常。

基本概念

普通字典的问题

# 普通字典访问不存在的键会报错 d = {} # print(d['不存在的键']) # KeyError! # 需要先检查键是否存在 if '键' not in d: d['键'] = [] d['键'].append('值')

defaultdict的解决方案

from collections import defaultdict # 创建 defaultdict,指定默认工厂函数 d = defaultdict(list) # 默认值为空列表 d['水果'].append('苹果') # 自动创建列表并添加

主要特性

1.指定默认值类型

from collections import defaultdict # 整数类型,默认值为 0 计数器 = defaultdict(int) 计数器['苹果'] += 1 计数器['香蕉'] += 2 # 结果: {'苹果': 1, '香蕉': 2} # 列表类型,默认值为 [] 分组 = defaultdict(list) 分组['水果'].append('苹果') 分组['水果'].append('香蕉') # 结果: {'水果': ['苹果', '香蕉']} # 集合类型,默认值为 set() 标签 = defaultdict(set) 标签['文章1'].add('Python') 标签['文章1'].add('编程') # 结果: {'文章1': {'Python', '编程'}} # 字典类型,默认值为 {} 配置 = defaultdict(dict) 配置['用户']['姓名'] = '张三' 配置['用户']['年龄'] = 25

2.使用 lambda 自定义默认值

from collections defaultdict # 默认值为 100 d = defaultdict(lambda: 100) print(d['分数']) # 输出: 100 # 默认值为 "未知" d = defaultdict(lambda: "未知") print(d['姓名']) # 输出: "未知" # 复杂默认值 d = defaultdict(lambda: {"计数": 0, "总分": 0}) d['学生1']['计数'] += 1

实用示例

示例1:统计单词频率

from collections import defaultdict 文本 = "苹果 香蕉 苹果 橙子 香蕉 苹果 苹果" 单词列表 = 文本.split() 词频 = defaultdict(int) for 单词 in 单词列表: 词频[单词] += 1 print(词频) # {'苹果': 4, '香蕉': 2, '橙子': 1}

示例2:按类别分组

from collections import defaultdict 商品列表 = [ ('水果', '苹果'), ('水果', '香蕉'), ('蔬菜', '胡萝卜'), ('水果', '橙子'), ('蔬菜', '西兰花') ] 分类库 = defaultdict(list) for 类别, 商品 in 商品列表: 分类库[类别].append(商品) """ 结果: { '水果': ['苹果', '香蕉', '橙子'], '蔬菜': ['胡萝卜', '西兰花'] } """

示例3:创建树形结构

from collections import defaultdict def 树(): return defaultdict(树) 文件系统 = 树() 文件系统['home']['user']['docs']['file.txt'] = "内容" 文件系统['home']['user']['pictures']['photo.jpg'] = "图片" # 访问不存在的路径会自动创建 路径 = 文件系统['var']['log']['apache']['access.log']

示例4:统计学生成绩

from collections import defaultdict 成绩表 = [ ('张三', '数学', 90), ('张三', '英语', 85), ('李四', '数学', 95), ('李四', '英语', 88), ('张三', '物理', 92) ] # 按学生分组成绩 学生成绩 = defaultdict(list) for 姓名, 科目, 分数 in 成绩表: 学生成绩[姓名].append((科目, 分数)) # 计算每个学生的平均分 平均分 = defaultdict(float) for 姓名, 成绩列表 in 学生成绩.items(): 总分 = sum(分数 for _, 分数 in 成绩列表) 平均分[姓名] = 总分 / len(成绩列表)

与普通字典的对比

特性

普通dict

defaultdict

访问不存在的键

抛出KeyError

返回默认值

初始化复杂度

需要手动初始化

自动初始化

代码简洁性

需要条件判断

代码更简洁

内存使用

相同

相同

性能

相似

相似,但减少条件判断

使用场景

适合使用defaultdict的场景:

  1. 计数器:统计频率、计数

  2. 分组操作:将数据按某个键分组

  3. 构建嵌套结构:树形结构、图结构

  4. 避免重复的条件检查:减少if key in dict的代码

  5. 配置管理:多层级的配置项

示例:构建邻接表(图结构)

from collections import defaultdict # 图的邻接表表示 图 = defaultdict(list) 边 = [('A', 'B'), ('A', 'C'), ('B', 'D'), ('C', 'D')] for 起点, 终点 in 边: 图[起点].append(终点) # 如果是无向图 图[终点].append(起点)

注意事项

  1. 工厂函数是调用的defaultdict(int)中的int是构造函数,不是值

  2. 默认值占用内存:即使不存在的键也会返回默认值,可能占用额外内存

  3. 判断键是否存在:使用in操作符时,不存在的键不会自动添加

  4. 转换为普通字典

    d = defaultdict(int, {'a': 1, 'b': 2}) 普通字典 = dict(d) # 转换为普通字典
  5. 复制问题

    d1 = defaultdict(list, {'a': [1, 2]}) d2 = d1.copy() # 浅拷贝,列表是共享的 d2['a'].append(3) print(d1['a']) # [1, 2, 3]
http://www.cnnetsun.cn/news/107912.html

相关文章:

  • SourceGit:现代化Git图形化客户端的革命性体验
  • ZeroBot-Plugin:开启智能对话机器人的云服务新篇章
  • ModEngine2 完整指南:如何为魂系游戏配置和调试模组系统
  • EmotiVoice语音合成耗时分析:影响响应速度的关键因素
  • AMD GPU在ComfyUI中无法识别的完整解决方案
  • 大厂Java面试故事:微服务、分布式缓存与AI场景全链路技术深挖
  • EmotiVoice支持RESTful API吗?集成方式详解
  • Mac效率革命:用Pearcleaner告别繁琐的Homebrew命令行操作
  • Windows安卓子系统终极指南:MagiskOnWSALocal完整安装教程
  • 从GitHub到生产环境:EmotiVoice项目落地全流程拆解
  • 终极解锁:如何用Edge插件快速获得Netflix 4K影院级画质体验
  • 突破移动端瓶颈:YOLOv10在iOS平台的极致优化实践
  • EmotiVoice语音合成合规审查机制:防范滥用风险
  • 第2章 安装 Manjaro 操作系统
  • 如何免费自动生成音频字幕?OpenLRC:音频字幕一键生成全攻略
  • EmotiVoice前端文本预处理模块详解
  • Midscene革命:用AI视觉技术重新定义浏览器自动化的未来
  • ImageOptim跨版本兼容性终极指南:从macOS 10.13到最新系统的完整适配方案
  • Juicebox完整指南:Hi-C数据可视化终极解决方案
  • 9个AI论文工具,MBA轻松搞定毕业论文!
  • LSPosed迁移实战:解决Xposed开发者的7大核心痛点
  • 暗影精灵笔记本终极离线控制方案:完全隐私保护的性能优化完全指南
  • 计算机眼中的图像
  • 10 个AI论文工具,自考本科轻松搞定毕业写作!
  • 设计工具与UI组件库无缝集成:3步提升团队协作效率
  • CST软件的广泛应用
  • EmotiVoice情感分类体系揭秘:六种基础情绪如何建模?
  • JVET-AL0106
  • EmotiVoice语音合成自动化标注辅助系统开发
  • 数据安全无死角:云服务器筑牢企业数字资产 “防护墙”