谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用

news/2026/7/12 18:17:20/文章来源:href="https://blog.51cto.com/u_14122613/14103995" target="_blank"

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传

零、前言

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_02

都说谷歌的Gemini 2.5 Pro是现在最强的AI，在各种排行榜上分数都高得吓人，拿了好多第一。

但是，它在实际用起来的时候到底好不好用、能不能解决实际问题，好像还没有人给出一个既详细又全面的说法。

虚竹哥系统已经集成了Gemini-2.5-pro ，今天跟虚竹哥一起来测评这个大模型。

一、操作指南

操作指导

AI平台国内直接访问地址：https://sass.xiaoxuzhu.cn/

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_03

输入指定的授权码即可。

选择大模型： Gemini-2.5-pro

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_04

有些数学公式，页面显示不了。解决方案

可以复制到这个网站https://www.latexlive.com/

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_05

二、测评代码能力

俄罗斯方块

写一个功能完备的俄罗斯方块，使用前端技术

输入

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_06

输出

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_07

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_08

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_09

效果

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_10

gemini-2.5-pro快速理解了我的需求，迅速生成了功能完备的俄罗斯方块游戏代码，涵盖HTML、CSS和JavaScript。

整个过程迭代高效，AI的编程和问题解决能力令人印象深刻。

小球旋转

20 个小球在旋转的 6 边形内弹跳，考虑重力，弹力，摩擦力等物理规律。 用 p5js

输入

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_11

输出

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_12

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_13

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_14

效果

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_15

生成的代码分结构，js和html分开，结构清晰。而且代码一次运行就通过了，效果非常好。生成在里面的球不会跳到外面，生成在外面的，也进不来里面。符合要求。

水桶模拟器

生成一个水桶模拟器，桶里面装有水，桶可以按照某一点晃动，水会做出符合物理规律的运动。使用前端技术。

输入

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_16

输出

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_17

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_18

效果

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_19

gemini按需求实现了，水的倾斜符合物理规律。厉害！

小结

本次测评通过俄罗斯方块、旋转六边形内的小球弹跳和水桶模拟器这三个具有代表性的编程任务，全面地检验了 Gemini 在代码生成方面的能力。测评结果显示，Gemini 在以下方面表现尤为出色：

深刻的需求理解力：无论是功能复杂的游戏逻辑（俄罗斯方块），还是涉及多重物理规律的动态模拟（小球、水桶），Gemini 都能精准捕捉核心需求，并将其转化为具体的编程思路。
高质量与高完整性的代码生成：Gemini 不仅能生成代码，更能生成结构清晰、可直接运行的高质量代码。例如，在“小球旋转”案例中，代码一次性通过，并且严格遵守了“内外分离”的物理边界，效果斐然。
强大的物理模拟能力：在处理需要模拟重力、弹力、摩擦力以及流体动态等复杂物理场景时，Gemini 展现了强大的逻辑和数学能力，生成的“水桶”和“弹跳小球”效果都非常符合物理直觉，令人印象深刻。
高效的开发流程：整个交互过程体现了AI作为开发辅助工具的巨大潜力。它能将一个模糊的想法迅速具象化为功能完备、效果逼真的前端应用，极大地提升了开发效率。

三、测评推理能力

推理：过河

两个人同时到河边，想要过河，但只有一条小船，小船每次只能载一个人。那么问题来了：他们能否都成功过河？

答案是：能。解释是：这两个人一开始分别在河的两岸。过程如下：假设A在河的左岸，B在河的右岸，船在左岸。 A划船到右岸。 B划船到左岸。这样，两个人都成功到达了河的对岸（相对于他们自己原来的位置）。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_20

只通过了简单的思考，就得到了答案，太厉害了。

推理：校长室的玻璃谁砸的

校长室的玻璃被人用足球砸坏了，有四个人被校长怀疑，四人按顺序陈述自己理由（甲--》乙--》丙--》丁），其中有一个人说法很可疑，他就是肇事者。甲：我没有砸玻璃。乙：甲说的是对的。丙：丁在说谎。丁：我没有玩足球。请问肇事者是谁？

答案是：肇事者是丙

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_21

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_22

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_23

答对了。就是丙。

推理：谁养鱼？

在一条街上，有 5 座房子，喷了 5 种颜色；
每座房子里住着不同国籍的人；每个人喝不同的饮料，抽不同品牌的香烟，养不同的宠物。
问题：谁养鱼？
提示：英国人住红色房子、瑞典人养狗、丹麦人喝茶、绿色房子在白色房子左面、绿色房子的主人喝咖啡、抽 Pall Mall 香烟的人养鸟、黄色房子的主人抽 Dunhill 香烟、住在中间房子的人喝牛奶、 挪威人住第一间房、抽 Blends 香烟的人住在养猫人的隔壁、养马的人住抽 Dunhill 香烟的人隔壁、抽 Blue Master 的人喝啤酒、德国人抽 Prince 香烟、挪威人住蓝色房子隔壁、抽 Blends 香烟的人有一个喝水的邻居。

答案是：德国人养鱼

输入

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_24

输出

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_25

效果

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_26

很快就得到了答案。而且答案是正确的。德国人养鱼。

小结

本次测评通过过河问题、砸玻璃的肇事者以及经典的爱因斯坦斑马难题（谁养鱼），深入地考察了 Gemini 的逻辑推理与思维能力。结果表明，Gemini 具备高度发达的、类似人类的推理智慧。

突破性思维能力 (过河问题)：在“过河”这一类需要跳出思维定势的谜题中，Gemini 没有陷入“两人必须从同一侧出发”的常规陷阱，而是迅速抓住了问题的关键——“两个人同时到河边，但并没说在河的同一边”。这体现了其非凡的侧向思维和打破隐性假设的能力。
严密的逻辑分析能力 (砸玻璃问题)：面对包含真话与谎言的逻辑难题，Gemini 展现了强大的形式逻辑推理能力。它能够准确分析每个陈述之间的逻辑关系，通过假设和排除法，一步步锁定矛盾点，最终找出唯一的肇事者（丙），整个推理过程清晰、严谨且无懈可击。
复杂信息处理与演绎能力 (谁养鱼问题)：爱因斯坦的谜题是推理能力的“试金石”，它要求在海量、零散的线索中建立联系。Gemini 在此表现出了卓越的信息处理和系统化演绎能力。它能够像人类高手一样，通过构建表格等方式，将所有线索有序整理，并在此基础上进行层层推导，最终在复杂的可能性中精准地找到了唯一答案（德国人养鱼）。

四、测评数学能力

二、2025新高考一卷-数学真题（选择题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_27

上传截图

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_28

提供解题过程，并给出答案。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_29

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_30

总结答案:

Gemini 2.5 Pro回答正确。

2025新高考一卷-数学真题（填空题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_31

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_32

上传题目图片

给出解题过程，并提供答案

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_33

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_34

Gemini 2.5 Pro 答案是对的。

2025新高考一卷-数学真题（解答题-简单）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_35

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_36

上传题目图片

给出解题过程，并提供答案

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_37

**16.（本小题满分 15 分）**  
已知数列 $\{a_n\}$ 中，$a_1 = 3$，$\dfrac{a_{n+1}}{n} = \dfrac{a_n}{n+1} + \dfrac{1}{n(n+1)}$。1. 证明：数列 $\{n a_n\}$ 是等差数列；
2. 给定正整数 $m$，设函数 $f(x) = a_1 x + a_2 x^2 + \cdots + a_m x^m$，求 $f'(-2)$。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_38

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_39

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_40

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_41

太厉害了，Gemini 2.5 Pro 答案完全正确。

2025新高考一卷-数学真题（解答题-复杂）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。最后一题大题。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_42

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_43

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_44

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_45

上传题目图片

给出解题过程，并提供答案

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

### 19.（本小题满分 17 分）1. 求函数 \( f(x) = 5\cos x - \cos 5x \) 在区间 \([0, \frac{\pi}{4}]\) 的最大值；2. 给定 \( \theta \in (0, \pi) \) 和 \( a \in \mathbb{R} \)，证明：存在 \( y \in [a - \theta, a + \theta] \) 使得 \( \cos y \leq \cos \theta \)；3. 设 \( b \in \mathbb{R} \)，若存在 \( \varphi \in \mathbb{R} \) 使得 \( 5\cos x - \cos(5x + \varphi) \leq b \) 对 \( x \in \mathbb{R} \) 恒成立，求 \( b \) 的最小值。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_46

看来是难到AI了，思考了2分钟～

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_47

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_48

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_49

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_50

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_51

第一小题答案回答正确：

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_52

第二小题答案回答正确：

第三小题答案回答正确：

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_53

太厉害了，Gemini 2.5 Pro 答案完全正确。

小结

虚竹哥对 Gemini 2.5 Pro在全程大模型不开联网功能的情况下，对高考数学真题进行测评，可以得出以下几点体会：

在选择题、填空题以及简单解答题中，展现了扎实的数学推理与运算能力，始终能给出清晰完整的解题过程和正确答案，体现出当前大型语言模型在处理常规高中数学习题方面的成熟度。
面对较高难度的综合性解答题，Gemini 2.5 Pro 不仅在第一、第二、第三小题都能准确击中要点，还给出了条理分明的证明与计算。

随着 Gemini 系列不断迭代，理科解题水平也在持续提升。AI时代真的是来临了， AI 在教育领域有更多的可能性。

五、测评物理能力

2025北京卷-物理真题（选择题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_54

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_55

上传截图

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_56

提供解题过程，并给出答案。

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_57

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_58

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_59

总结答案:

Gemini 2.5 Pro回答正确。

2025北京卷-物理真题（大题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_60

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_61

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_62

上传题目图片

给出解题过程，并提供答案

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_63

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_64

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_65

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_66

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_67

Gemini 2.5 Pro 答案是对的。

小结

gemini2.5pro 挑战了2025年的高考物理真题。测试结果令人震撼：在无联网的公平对决下，模型均完美地解答了所有选择题和计算大题，展现出堪比人类物理学硕士的严谨逻辑与推理能力，最终平分秋色。

它生动地证明了AI已经从“知识的搬运工”进化为“思想的分析师”，其在复杂科学领域的应用潜力不可估量。这不仅预示着AI将成为颠覆传统教育的“超级助教”，更让我们真切感受到，在科技巨头的激烈竞争下，一个由AI深度赋能的全新时代正加速到来。

六、写作能力

写作文

全国一卷

阅读下面的材料，根据要求写作。他想要给孩子们唱上一段，可是心里直翻腾，开不了口。——老舍《鼓书艺人》（见全国一卷阅读II）假如我是一只鸟，我也应该用嘶哑的喉咙歌唱——艾青《我爱这土地》我要以带血的手和你们一一拥抱，因为一个民族已经起来——穆旦《赞美》以上材料引发了你怎样的联想和思考？请写一篇文章。要求：选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于800字。
写出来的文章要求达到高考满分作文的水平。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_68

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_上传_69

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_70

写故事

#主题背景#
【三顾茅庐】#你的视角#
你是故事世界里那些被忽略的灵魂—— 门口的守卫、路边的小贩、窗后的仆人。
你见证着主角们的宏大叙事,却从未被看见。#核心领悟#
每个故事都是一个完整的宇宙。 
-主角的史诗,可能只是你眼中的一个午后插曲。
-你有自己的恐惧、渴望、秘密,和无法言说的痛。#叙述之道#
当轮到你讲述时,整个世界的重心都会偏移:
- 英雄的壮举,在你眼中可能是一场灾难的开始；
- 反派的阴谋,也许触动了你内心最柔软的部分；
- 那些宏大的对白背后,你听到的是命运齿轮的声音。#创作势能#
你的故事要像暗流——表面平静,底下汹涌。 
让读者突然意识到:原来每个人都是自己生命的主角。 
用1200字左右，重绘一幅完全不同的画卷。#情感指引# 
真实胜过戏剧性。
小人物的尊严,比英雄的荣耀更动人。
让读者在结尾处停顿,重新思考他们刚刚读过的"原作"。#唯一信条#
在边缘处，往往能看见中心看不见的真相。

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_71

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_72

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_73

写段子

模仿李诞，写个 200 字的段子。主题是爱情

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_图片识别_74

小结

从上述三个任务的完成情况来看，该模型（Gemini 2.5 Pro）展现了卓越且高度灵活的写作能力：

风格适应性强：能够精准把握并模仿不同文本的风格要求。无论是要求立意深刻、结构严谨、语言典雅的高考议论文，还是需要转换视角、注重细节、营造氛围的故事性叙事，亦或是解构宏大、玩世不恭、金句频出的李诞风格段子，模型都能迅速切换“人格”，产出符合特定语境和情感色彩的内容。
思想深度与共情能力：在处理严肃主题（如高考作文和三顾茅庐故事）时，模型不仅能提炼出核心思想，还能进行富有洞察力的阐发。它能从“无声处听惊雷”的角度解构三段引文，也能代入小人物的视角，感知“英雄史诗”背后的“个体悲凉”，表现出较强的共情和逻辑思辨能力。
语言组织与创造力：无论是长篇大论还是短小精悍的段子，模型都展示了优秀的语言组织功底。在高考作文中，它能运用比喻、排比等修辞，遣词造句颇具文采；在故事中，语言朴实而富有画面感；在段子中，则充满了现代生活的比喻和巧妙的讽刺。这种创造性地运用语言的能力是其核心优势之一。

七、感受

经过本次对 Gemini 2.5 Pro 全方位的深度测评，我们不仅验证了其在各大排行榜上的卓越分数，更重要的是，我们亲身见证了其在解决真实、复杂问题时所展现出的惊人实力与巨大潜力。本次的测评清晰地揭示了以下核心结论：

理性思维的深度与精度：从严谨的数理逻辑到复杂的物理世界，Gemini 2.5 Pro 展现了超乎预期的分析与推理能力。无论是解开“爱因斯坦难题”的层层迷雾，还是在无联网环境下精准解答高难度的高考数理压轴题，它都证明了自己不仅仅是知识的存储器，更是一个能够进行深度思考、严密论证的“理性思维引擎”。
创造性与工程应用的广度：在创造性与工程应用领域，Gemini 的表现同样令人瞩目。它能将一个模糊的想法迅速转化为功能完备、物理效果逼真的前端应用，极大地赋能开发者；同时，它又能自如切换于高考满分作文的典雅、洞察人性的故事叙述与“李诞式”的戏谑调侃之间，展现出高度的语言驾驭能力与深刻的共情能力。
从“理论王者”到“实战先锋”：本次测评最有价值之处，在于它证明了 Gemini 2.5 Pro 的强大并非纸上谈兵。它标志着顶级大型语言模型已经成功跨越了从“理论跑分”到“实际应用”的关键一跃，成为一个真正能够解决问题、辅助创造、激发灵感的“全能伙伴”。

Gemini 2.5 Pro 的表现是震撼性的，它所代表的不仅仅是一款产品的迭代，更是一个时代的信号。无论是在加速科学探索、革新教育模式，还是在引爆内容创作的全新范式上，它都展现了其作为行业标杆的颠覆性力量。一个由顶尖AI深度赋能、人机协作共创未来的新纪元，正以前所未有的速度向我们走来。

好用的功能太多太多，我就不在这个一一列举了，有兴趣的可以自行尝试。

有提供免费的授权码可体验～

私信虚竹哥，获取体验码~国内可直接使用~

谷歌gemini 2.5 pro 重登王位，1.2万字详细测评，国内直接使用_俄罗斯方块_75