当前位置：首页 > news >正文

各种排序算法时间复杂度分析和实现和优势

news 2026/5/31 2:28:20

以下是各种排序算法的时间复杂度详细对比：

比较排序算法

O(n²) 复杂度算法

算法平均情况最好情况最坏情况空间复杂度稳定性说明
冒泡排序 O(n²) O(n) O(n²) O(1) ✓ 通过相邻元素交换
选择排序 O(n²) O(n²) O(n²) O(1) ✗ 每次选最小/最大值
插入排序 O(n²) O(n) O(n²) O(1) ✓ 适合小规模或基本有序
希尔排序 O(n log n) - O(n²) O(n log n) O(n²) O(1) ✗ 改进的插入排序
梳排序 O(n log n) O(n) O(n²) O(1) ✗ 冒泡排序的改进

O(n log n) 复杂度算法

算法平均情况最好情况最坏情况空间复杂度稳定性说明
快速排序 O(n log n) O(n log n) O(n²) O(log n) ✗ 分治，实际最快
归并排序 O(n log n) O(n log n) O(n log n) O(n) ✓ 稳定，适合外排序
堆排序 O(n log n) O(n log n) O(n log n) O(1) ✗ 原地排序，不稳定
TimSort O(n log n) O(n) O(n log n) O(n) ✓ Python/Java内置

非比较排序算法

线性复杂度算法

算法平均情况最好情况最坏情况空间复杂度稳定性适用条件
计数排序 O(n + k) O(n + k) O(n + k) O(k) ✓ k是数值范围
桶排序 O(n + k) O(n) O(n²) O(n + k) ✓ 数据均匀分布
基数排序 O(d·(n + k)) O(d·(n + k)) O(d·(n + k)) O(n + k) ✓ d是最大位数

详细分析

快速排序

""" 时间复杂度分析： - 最优情况：每次分区都能均匀划分 T(n) = 2T(n/2) + O(n) = O(n log n) - 最坏情况：每次选到最小或最大值作为枢纽 T(n) = T(n-1) + O(n) = O(n²) - 平均情况：O(n log n) 空间复杂度：递归栈深度 O(log n) """

归并排序

""" 时间复杂度分析： - 分治递归：T(n) = 2T(n/2) + O(n) - 用主定理求解：O(n log n) - 稳定且总是 O(n log n) 空间复杂度：需要额外数组 O(n) """

堆排序

""" 时间复杂度分析： - 建堆：O(n) - 每次堆调整：O(log n) - 总复杂度：O(n) + n·O(log n) = O(n log n) 空间复杂度：原地排序 O(1) """

实际性能对比

小规模数据 (n < 50)

插入排序 > 选择排序 ≈ 冒泡排序 > 快速排序

原因：插入排序在小数据上常数因子小

中等规模数据 (50 < n < 1000)

快速排序 > 归并排序 > 堆排序 > 希尔排序

大规模数据 (n > 10000)

快速排序 > TimSort > 归并排序 > 堆排序

特定情况

· 基本有序数据：插入排序 O(n)，TimSort O(n)
· 范围小的整数：计数排序 O(n + k)
· 外排序（内存不足）：归并排序
· 需要稳定性：归并排序、TimSort

Python中的排序实现

内置排序

# Python的sorted()使用TimSortsorted_list=sorted(data)# O(n log n), 稳定# list.sort()也是TimSortdata.sort()# 原地排序

TimSort特点

""" TimSort = 归并排序 + 插入排序 + 优化 1. 将数组分成多个run（有序子序列） 2. 对小的run使用插入排序 3. 使用归并排序合并run 4. 自适应：利用已有顺序 复杂度： - 最好：O(n)（已基本有序） - 平均：O(n log n) - 最坏：O(n log n) - 空间：O(n) """

各算法代码实现

defbubble_sort(arr):"""冒泡排序 O(n²)"""n=len(arr)foriinrange(n):swapped=Falseforjinrange(0,n-i-1):ifarr[j]>arr[j+1]:arr[j],arr[j+1]=arr[j+1],arr[j]swapped=Trueifnotswapped:breakreturnarrdefselection_sort(arr):"""选择排序 O(n²)"""n=len(arr)foriinrange(n):min_idx=iforjinrange(i+1,n):ifarr[j]<arr[min_idx]:min_idx=j arr[i],arr[min_idx]=arr[min_idx],arr[i]returnarrdefinsertion_sort(arr):"""插入排序 O(n²) - 最好O(n)"""foriinrange(1,len(arr)):key=arr[i]j=i-1whilej>=0andkey<arr[j]:arr[j+1]=arr[j]j-=1arr[j+1]=keyreturnarrdefmerge_sort(arr):"""归并排序 O(n log n)"""iflen(arr)<=1:returnarr mid=len(arr)//2left=merge_sort(arr[:mid])right=merge_sort(arr[mid:])result=[]i=j=0whilei<len(left)andj<len(right):ifleft[i]<=right[j]:result.append(left[i])i+=1else:result.append(right[j])j+=1result.extend(left[i:])result.extend(right[j:])returnresultdefheap_sort(arr):"""堆排序 O(n log n)"""defheapify(arr,n,i):largest=i left=2*i+1right=2*i+2ifleft<nandarr[left]>arr[largest]:largest=leftifright<nandarr[right]>arr[largest]:largest=rightiflargest!=i:arr[i],arr[largest]=arr[largest],arr[i]heapify(arr,n,largest)n=len(arr)# 建堆foriinrange(n//2-1,-1,-1):heapify(arr,n,i)# 一个个取出元素foriinrange(n-1,0,-1):arr[i],arr[0]=arr[0],arr[i]heapify(arr,i,0)returnarrdefcounting_sort(arr):"""计数排序 O(n + k)"""ifnotarr:return[]max_val=max(arr)min_val=min(arr)range_size=max_val-min_val+1count=[0]*range_size output=[0]*len(arr)# 计数fornuminarr:count[num-min_val]+=1# 累加foriinrange(1,range_size):count[i]+=count[i-1]# 输出foriinrange(len(arr)-1,-1,-1):idx=arr[i]-min_val output[count[idx]-1]=arr[i]count[idx]-=1returnoutput

算法选择指南

根据需求选择：

· 通用排序：快速排序或TimSort
· 需要稳定：归并排序或TimSort
· 原地排序（内存少）：堆排序或快速排序
· 小数据量：插入排序
· 整数，范围小：计数排序
· 数据基本有序：插入排序或TimSort
· 链表结构：归并排序

根据数据特征：

数据特征 | 推荐算法 ----------------------|------------ 随机 | 快速排序 基本有序 | 插入排序/TimSort 范围小的整数 | 计数排序 需要稳定排序 | 归并排序/TimSort 内存受限 | 堆排序 分布式/外排序 | 归并排序

性能测试示例

importtimeimportrandomimportmatplotlib.pyplotaspltdefbenchmark_algorithms():"""性能基准测试"""algorithms={'冒泡排序':bubble_sort,'选择排序':selection_sort,'插入排序':insertion_sort,'快速排序':quick_sort_simple,'归并排序':merge_sort,'堆排序':heap_sort,}sizes=[100,500,1000,5000,10000]results={name:[]fornameinalgorithms}forsizeinsizes:arr=random.sample(range(size*10),size)forname,funcinalgorithms.items():ifsize>5000andnamein['冒泡排序','选择排序','插入排序']:# O(n²)算法太慢，跳过results[name].append(None)continuearr_copy=arr.copy()start=time.time()func(arr_copy)end=time.time()results[name].append(end-start)# 可视化plt.figure(figsize=(12,6))forname,timesinresults.items():valid_times=[tfortintimesiftisnotNone]valid_sizes=[sizes[i]fori,tinenumerate(times)iftisnotNone]ifvalid_times:plt.plot(valid_sizes,valid_times,marker='o',label=name)plt.xlabel('数据量')plt.ylabel('时间 (秒)')plt.title('排序算法性能对比')plt.legend()plt.grid(True)plt.show()# benchmark_algorithms() # 取消注释运行测试