当前位置: 首页 > news >正文

各种排序算法时间复杂度分析和实现和优势

以下是各种排序算法的时间复杂度详细对比:

  1. 比较排序算法

O(n²) 复杂度算法

算法 平均情况 最好情况 最坏情况 空间复杂度 稳定性 说明
冒泡排序 O(n²) O(n) O(n²) O(1) ✓ 通过相邻元素交换
选择排序 O(n²) O(n²) O(n²) O(1) ✗ 每次选最小/最大值
插入排序 O(n²) O(n) O(n²) O(1) ✓ 适合小规模或基本有序
希尔排序 O(n log n) - O(n²) O(n log n) O(n²) O(1) ✗ 改进的插入排序
梳排序 O(n log n) O(n) O(n²) O(1) ✗ 冒泡排序的改进

O(n log n) 复杂度算法

算法 平均情况 最好情况 最坏情况 空间复杂度 稳定性 说明
快速排序 O(n log n) O(n log n) O(n²) O(log n) ✗ 分治,实际最快
归并排序 O(n log n) O(n log n) O(n log n) O(n) ✓ 稳定,适合外排序
堆排序 O(n log n) O(n log n) O(n log n) O(1) ✗ 原地排序,不稳定
TimSort O(n log n) O(n) O(n log n) O(n) ✓ Python/Java内置

  1. 非比较排序算法

线性复杂度算法

算法 平均情况 最好情况 最坏情况 空间复杂度 稳定性 适用条件
计数排序 O(n + k) O(n + k) O(n + k) O(k) ✓ k是数值范围
桶排序 O(n + k) O(n) O(n²) O(n + k) ✓ 数据均匀分布
基数排序 O(d·(n + k)) O(d·(n + k)) O(d·(n + k)) O(n + k) ✓ d是最大位数

  1. 详细分析

快速排序

""" 时间复杂度分析: - 最优情况:每次分区都能均匀划分 T(n) = 2T(n/2) + O(n) = O(n log n) - 最坏情况:每次选到最小或最大值作为枢纽 T(n) = T(n-1) + O(n) = O(n²) - 平均情况:O(n log n) 空间复杂度:递归栈深度 O(log n) """

归并排序

""" 时间复杂度分析: - 分治递归:T(n) = 2T(n/2) + O(n) - 用主定理求解:O(n log n) - 稳定且总是 O(n log n) 空间复杂度:需要额外数组 O(n) """

堆排序

""" 时间复杂度分析: - 建堆:O(n) - 每次堆调整:O(log n) - 总复杂度:O(n) + n·O(log n) = O(n log n) 空间复杂度:原地排序 O(1) """
  1. 实际性能对比

小规模数据 (n < 50)

插入排序 > 选择排序 ≈ 冒泡排序 > 快速排序

原因:插入排序在小数据上常数因子小

中等规模数据 (50 < n < 1000)

快速排序 > 归并排序 > 堆排序 > 希尔排序

大规模数据 (n > 10000)

快速排序 > TimSort > 归并排序 > 堆排序

特定情况

· 基本有序数据:插入排序 O(n),TimSort O(n)
· 范围小的整数:计数排序 O(n + k)
· 外排序(内存不足):归并排序
· 需要稳定性:归并排序、TimSort

  1. Python中的排序实现

内置排序

# Python的sorted()使用TimSortsorted_list=sorted(data)# O(n log n), 稳定# list.sort()也是TimSortdata.sort()# 原地排序

TimSort特点

""" TimSort = 归并排序 + 插入排序 + 优化 1. 将数组分成多个run(有序子序列) 2. 对小的run使用插入排序 3. 使用归并排序合并run 4. 自适应:利用已有顺序 复杂度: - 最好:O(n)(已基本有序) - 平均:O(n log n) - 最坏:O(n log n) - 空间:O(n) """
  1. 各算法代码实现
defbubble_sort(arr):"""冒泡排序 O(n²)"""n=len(arr)foriinrange(n):swapped=Falseforjinrange(0,n-i-1):ifarr[j]>arr[j+1]:arr[j],arr[j+1]=arr[j+1],arr[j]swapped=Trueifnotswapped:breakreturnarrdefselection_sort(arr):"""选择排序 O(n²)"""n=len(arr)foriinrange(n):min_idx=iforjinrange(i+1,n):ifarr[j]<arr[min_idx]:min_idx=j arr[i],arr[min_idx]=arr[min_idx],arr[i]returnarrdefinsertion_sort(arr):"""插入排序 O(n²) - 最好O(n)"""foriinrange(1,len(arr)):key=arr[i]j=i-1whilej>=0andkey<arr[j]:arr[j+1]=arr[j]j-=1arr[j+1]=keyreturnarrdefmerge_sort(arr):"""归并排序 O(n log n)"""iflen(arr)<=1:returnarr mid=len(arr)//2left=merge_sort(arr[:mid])right=merge_sort(arr[mid:])result=[]i=j=0whilei<len(left)andj<len(right):ifleft[i]<=right[j]:result.append(left[i])i+=1else:result.append(right[j])j+=1result.extend(left[i:])result.extend(right[j:])returnresultdefheap_sort(arr):"""堆排序 O(n log n)"""defheapify(arr,n,i):largest=i left=2*i+1right=2*i+2ifleft<nandarr[left]>arr[largest]:largest=leftifright<nandarr[right]>arr[largest]:largest=rightiflargest!=i:arr[i],arr[largest]=arr[largest],arr[i]heapify(arr,n,largest)n=len(arr)# 建堆foriinrange(n//2-1,-1,-1):heapify(arr,n,i)# 一个个取出元素foriinrange(n-1,0,-1):arr[i],arr[0]=arr[0],arr[i]heapify(arr,i,0)returnarrdefcounting_sort(arr):"""计数排序 O(n + k)"""ifnotarr:return[]max_val=max(arr)min_val=min(arr)range_size=max_val-min_val+1count=[0]*range_size output=[0]*len(arr)# 计数fornuminarr:count[num-min_val]+=1# 累加foriinrange(1,range_size):count[i]+=count[i-1]# 输出foriinrange(len(arr)-1,-1,-1):idx=arr[i]-min_val output[count[idx]-1]=arr[i]count[idx]-=1returnoutput
  1. 算法选择指南

根据需求选择:

· 通用排序:快速排序或TimSort
· 需要稳定:归并排序或TimSort
· 原地排序(内存少):堆排序或快速排序
· 小数据量:插入排序
· 整数,范围小:计数排序
· 数据基本有序:插入排序或TimSort
· 链表结构:归并排序

根据数据特征:

数据特征 | 推荐算法 ----------------------|------------ 随机 | 快速排序 基本有序 | 插入排序/TimSort 范围小的整数 | 计数排序 需要稳定排序 | 归并排序/TimSort 内存受限 | 堆排序 分布式/外排序 | 归并排序
  1. 性能测试示例
importtimeimportrandomimportmatplotlib.pyplotaspltdefbenchmark_algorithms():"""性能基准测试"""algorithms={'冒泡排序':bubble_sort,'选择排序':selection_sort,'插入排序':insertion_sort,'快速排序':quick_sort_simple,'归并排序':merge_sort,'堆排序':heap_sort,}sizes=[100,500,1000,5000,10000]results={name:[]fornameinalgorithms}forsizeinsizes:arr=random.sample(range(size*10),size)forname,funcinalgorithms.items():ifsize>5000andnamein['冒泡排序','选择排序','插入排序']:# O(n²)算法太慢,跳过results[name].append(None)continuearr_copy=arr.copy()start=time.time()func(arr_copy)end=time.time()results[name].append(end-start)# 可视化plt.figure(figsize=(12,6))forname,timesinresults.items():valid_times=[tfortintimesiftisnotNone]valid_sizes=[sizes[i]fori,tinenumerate(times)iftisnotNone]ifvalid_times:plt.plot(valid_sizes,valid_times,marker='o',label=name)plt.xlabel('数据量')plt.ylabel('时间 (秒)')plt.title('排序算法性能对比')plt.legend()plt.grid(True)plt.show()# benchmark_algorithms() # 取消注释运行测试

这个总结应该能帮助你根据具体情况选择合适的排序算法!

http://www.cnnetsun.cn/news/62838.html

相关文章:

  • C#AI系列(6): C#离线实现高效OCR
  • 山东高校申请专利的难点
  • 淄博市发明专利与实用新型专利的转换
  • 基于Python的河南天气数据分析与可视化
  • 【Linux系统编程】(十五)揭秘 Linux 环境变量:从底层原理到实战操作,一篇吃透命令行参数与全局变量!
  • 轨道交通专业相关证书推荐
  • PaperXie AI毕业论文写作功能深度拆解:从选题到成稿,一个被低估的学术效率加速器如何重塑你的科研流程
  • 2026年,你希望公司更离不开你,还是你更离不开公司?
  • YOLOv10优化:注意力魔改 | 新颖的卷积轴向注意力和谱空间注意力助力涨点,适用高分辨率场景,2025.12
  • 35、gawk调试器命令全解析
  • 41、gawk扩展功能全解析
  • Java Web 核心全解析
  • 7、远程服务安全攻防全解析
  • 18、网络安全防护:psad与fwsnort的应用与集成
  • 30、深入探索fwknop:安全访问与防护机制详解
  • 31、编程技巧与实用程序解析
  • 38、深入探索 gawk 扩展开发:性能优化与功能定制
  • 数据结构之递归-如何巧妙利用递归函数的返回值
  • 46、深入探索编程符号、函数与操作:从基础到高级应用
  • 论AI时代下 “马扁” 子的趋势分析(一)
  • 7天拿下微软PowerBI证书真的太香了
  • JSP中如何设计大文件上传的交互界面与用户体验?
  • wangEditor粘贴ppt幻灯片转存网页兼容处理
  • 从 paperxie 到工具矩阵:AI 开题报告工具如何帮你突破 “学术启动瓶颈”?
  • 工具矩阵:开题报告写作的 “规范效率工具箱”——9款 AI 工具的场景化适配实践
  • 咱们唠一下:单例Bean的“出生记”——从“零”到“成品”的全过程
  • Qt快速检测Ubuntu进程状态
  • 73、Sendmail配置参数详解
  • 【超全】基于SSM的企业客户管理系统【包括源码+文档+调试】
  • 数据点的“社交距离”:衡量它们之间的相似与差异