当前位置: 首页 > news >正文

GPT-5.2被Gemini 3 Pro碾压?真实编程场景实测,结果出人意料!

本文对比测试了GPT-5.2与Gemini 3 Pro在编程任务上的表现,通过烟花前端效果、学术论文分析和RAG代码重构三个场景进行评测。结果显示,Gemini 3 Pro在理解指令和代码重构方面表现更佳,而GPT-5.2在处理复杂任务时遇到困难。文章提示程序员在选择大模型辅助编程时需谨慎,建议根据具体需求选择合适工具。


前两天GPT-5.2发布,奥特曼说很强,GPT‑5.2 Thinking在 SWE-bench Pro 测试取得了 55.6% 的新SOTA成绩。

于是,今天在Cursor中用一些真实Coding场景测了下Gemini 3 proGPT-5.2,结果,谷歌:写代码就这?

1、烟花盛宴

前端能力不少博主都测过,这里也测一个烟花盛宴,GPT-5.2效果有好有坏,大家来细评:

OpenAI GPT-5.2,效果酷炫,控制台也不错,细看好像差点意思,视频中最后的单个仙女棒效果不符合指令

Google Gemini 3 Pro效果

2、5000篇Paper分析

AI顶会NeurIPS 2025上周开完会,今年有近6000篇文章,热点是啥?是不是很想知道,用Cursor分析下,这也是大家日常高频场景。

paper的摘要、作者、类型都有

  • Gemini 3 pro

指令:

thinking之后,写了一段100+行的analyze_neurips.py脚本,拿到统计数据。

一份简单报告出来了:《NeurIPS 2025 技术分析报告:从生成到推理,智能体的全面崛起

NeurIPS 2025最热门的技术关键词分布:

  • GPT-5.2

一顿thinking之后,开始收集收据:类型分布、关键词等…

这里,GPT-5.2没写入py file,用python -c cmd执行,结果上来,python执行失败

分析之后,改用powershell执行成功

继续分析,写了一段很长的cmd

powershell竟然不支持,脚本太长,它又把任务拆分:短命令分段跑…

估计还得折腾一会,等不了,困死了,把任务kill了,睡觉~

3、RAG代码重构

做过RAG的小伙伴应该听过RAPTOR(索引树状RAG和递归推理检索系统),代码已开源,核心包括tree构建与检索

https://github.com/parthsarthi03/raptor/tree/master/raptor

现在又这么一个需求:检索逻辑用不上,将层次树构建的代码全部都抽取出来,形成一个独立的文件:

基于 @raptor 项目将层次树构建的逻辑抽出来成一个独立文件
  • Gemini 3 pro

将tree构建依赖的代码聚拢合并到一个新的文件:raptor_tree_builder.py,核心的Node、Tree模型都没有丢失。

Tree bulders的主逻辑也完整:

  • GPT-5.2

也开始一顿分析,但好像意图没理解对:然后把 tree_builder.py 与 cluster_tree_builder.py 改成“只负责导入并导出”的兼容层。这样外部代码完全不用改 import,但构建逻辑集中在一个文件里。真实的意图:是一个独立文件,不需要import依赖

全用的import,核心的Node、Tree还在源文件中

最后,还把源文件tree_builder.py给改了

这个任务丢给claude 4.5也能理解对。

​最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

http://www.cnnetsun.cn/news/95701.html

相关文章:

  • 金融行业广告投放:在合规的赛道上,实现精准增长
  • 长安汽车11月销量28.3万辆,同比增长2.3%
  • 1688 商品详情接口深度解析:从百川签名突破到供应链数据重构
  • LobeChat心理情绪日记分析工具
  • 一文搞懂纸老虎-布隆过滤器
  • LobeChat周年庆感恩回馈活动
  • 运维系列数据库系列【仅供参考】:DM JOB作业的邮件发送
  • 当AI面临伦理投诉时,AI应用架构师该怎么办?这5个解决步骤
  • 主存编址是什么
  • Python 整合 Redis 哨兵(Sentinel)与集群(Cluster)实战指南
  • HLS技术的局限性说明
  • 水文监测站:水资源管理的“千里眼”与“顺风耳”
  • 白银波动幅度大于黄金的原因:市场规模与属性差异深度解析
  • 【2026版】Spring Boot面试题
  • 办公小程序开发----提高工作效率
  • Jmeter 命令行压测生成HTML测试报告
  • AI编程系列——mcp与skill
  • 技术文章大纲:当云原生遇见VMware
  • AI Agent开发全攻略:2025年核心技术栈与学习资源,从新手到专家的蜕变之路!
  • LobeChat实体抽取能力在CRM中的应用
  • Java毕设项目:基于springboot天气预报查询系统(源码+文档,讲解、调试运行,定制等)
  • Netcode for GameObjects Boss Room 多人RPG战斗(6)
  • Java毕设项目:基于JavaWeb的心聘求职平台的设计与实现(源码+文档,讲解、调试运行,定制等)
  • Java毕设项目:基于JavaEE的电子印章管理系统的设计与实现(源码+文档,讲解、调试运行,定制等)
  • 5分钟梳理银行测试,文末附带实战项目,0经验入行so easy
  • 数据库基础
  • 基于单片机的家居净化器设计与实现
  • LeetCode 热题 100——图论——实现 Trie (前缀树)
  • 揭秘Java:深度解析线程调度算法!
  • 三大电商API应用对比:淘宝京东拼多多谁能笑到最后?