claude4 果然还是编程最强！1.2万字详细测评，国内直接使用

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4

零、前言

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_02

Claude 4 是一款全球领先的编码模型，在处理复杂和长时间运行的任务等方面展现出持续稳定的卓越表现。

但是，它在实际用起来的时候到底好不好用、能不能解决实际问题，好像还没有人给出一个既详细又全面的说法。

虚竹哥系统已经集成了Claude-4 【Sonnet】 ，今天跟虚竹哥一起来测评这个大模型。

一、操作指南

操作指导

AI平台国内直接访问地址：https://sass.xiaoxuzhu.cn/

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_03

输入指定的授权码即可。

选择大模型： Claude-4

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_04

有些数学公式，页面显示不了。解决方案

可以复制到这个网站https://www.latexlive.com/

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_05

二、测评代码能力

俄罗斯方块

写一个功能完备的俄罗斯方块，使用前端技术

输入

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_06

输出

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_07

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_08

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_09

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_10

效果

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_11

claude4这个AI生成的俄罗斯方块让我印象深刻！一次性输出了完整可运行的游戏，包含所有经典功能：7种方块、旋转移动、消除计分、等级提升，甚至还有现代化的渐变界面和毛玻璃效果。

代码结构清晰，逻辑完整，无需任何修改就能直接使用。AI的编程能力和对细节的把控已经达到了专业开发者的水准，真正做到了"一键生成，即刻可玩"。

小球旋转

20 个小球在旋转的 6 边形内弹跳，考虑重力，弹力，摩擦力等物理规律。 用 p5js

输入

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_12

输出

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_13

效果

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_14

就像一个不喜欢啰嗦的学霸一样，快速思考后，直接出结果。而且出的结果特别准确，界面也很美观。

水桶模拟器

生成一个水桶模拟器，桶里面装有水，桶可以按照某一点晃动，水会做出符合物理规律的运动。使用前端技术。

输入

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_15

输出

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_16

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_17

第一次生成的效果有了，就是水不明显，再优化下

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_18

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_19

效果

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_20

claude4的ai编程能力是真的强！遥遥领先！第一次其实已经实现了，就是有点小瑕疵，水的效果不明显，让ai优化后，效果就出来了。

小结

通过三个生动的编程实例——俄罗斯方块、小球物理模拟和水桶模拟器，集中展示了claude4 强大的代码生成与理解能力。

核心亮点如下：

高完整性与即时可用性：AI能够一次性生成功能完备、逻辑严谨且界面精美的复杂应用，如俄罗斯方块，达到了“开箱即用”的专业水准。
深刻的逻辑与物理理解：无论是游戏规则，还是涉及重力、弹力等复杂物理规律的模拟，AI都能准确理解并用代码实现，结果精准且符合预期。
强大的迭代与优化能力：在水桶模拟器的案例中，AI能根据用户提出的优化反馈，对初始方案进行有效改进，展现了良好的“沟通”与迭代能力。

claude4 在编程领域表现出惊人的实力，不仅能处理复杂的逻辑与创意需求，还能快速生成高质量、可迭代的代码，其能力已“遥遥领先”，达到了令人印象深刻的专业开发者水平。

三、测评推理能力

推理：谁养鱼？

在一条街上，有 5 座房子，喷了 5 种颜色；
每座房子里住着不同国籍的人；每个人喝不同的饮料，抽不同品牌的香烟，养不同的宠物。
问题：谁养鱼？
提示：英国人住红色房子、瑞典人养狗、丹麦人喝茶、绿色房子在白色房子左面、绿色房子的主人喝咖啡、抽 Pall Mall 香烟的人养鸟、黄色房子的主人抽 Dunhill 香烟、住在中间房子的人喝牛奶、 挪威人住第一间房、抽 Blends 香烟的人住在养猫人的隔壁、养马的人住抽 Dunhill 香烟的人隔壁、抽 Blue Master 的人喝啤酒、德国人抽 Prince 香烟、挪威人住蓝色房子隔壁、抽 Blends 香烟的人有一个喝水的邻居。

答案是：德国人养鱼

输入

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_21

输出

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_22

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_23

效果

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_24

快速地得出结论，德国人养鱼。

小结

本次测评经典的爱因斯坦斑马难题（谁养鱼），深入地考察了 claude4 的逻辑推理与思维能力。结果表明，claude4 具备高度发达的、类似人类的推理智慧。

复杂信息处理与演绎能力 (谁养鱼问题)：爱因斯坦的谜题是推理能力的“试金石”，它要求在海量、零散的线索中建立联系。claude4 在此表现出了卓越的信息处理和系统化演绎能力。它能够像人类高手一样，通过构建表格等方式，将所有线索有序整理，并在此基础上进行层层推导，最终在复杂的可能性中精准地找到了唯一答案（德国人养鱼）。

四、测评数学能力

二、2025新高考一卷-数学真题（选择题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_25

上传截图

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_26

提供解题过程，并给出答案。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_27

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_28

答案Claude 4 也回答正确。

2025新高考一卷-数学真题（填空题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_29

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_30

上传题目图片

给出解题过程，并提供答案

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_31

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_32

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_33

答案也是对的。

2025新高考一卷-数学真题（解答题-简单）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_34

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_35

上传题目图片

给出解题过程，并提供答案

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_36

**16.（本小题满分 15 分）**  
已知数列 $\{a_n\}$ 中，$a_1 = 3$，$\dfrac{a_{n+1}}{n} = \dfrac{a_n}{n+1} + \dfrac{1}{n(n+1)}$。1. 证明：数列 $\{n a_n\}$ 是等差数列；
2. 给定正整数 $m$，设函数 $f(x) = a_1 x + a_2 x^2 + \cdots + a_m x^m$，求 $f'(-2)$。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_37

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_38

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_39

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_40

claude 4 也答对了。

2025新高考一卷-数学真题（解答题-复杂）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。最后一题大题。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_41

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_42

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_43

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_44

上传题目图片

给出解题过程，并提供答案

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

### 19.（本小题满分 17 分）1. 求函数 \( f(x) = 5\cos x - \cos 5x \) 在区间 \([0, \frac{\pi}{4}]\) 的最大值；2. 给定 \( \theta \in (0, \pi) \) 和 \( a \in \mathbb{R} \)，证明：存在 \( y \in [a - \theta, a + \theta] \) 使得 \( \cos y \leq \cos \theta \)；3. 设 \( b \in \mathbb{R} \)，若存在 \( \varphi \in \mathbb{R} \) 使得 \( 5\cos x - \cos(5x + \varphi) \leq b \) 对 \( x \in \mathbb{R} \) 恒成立，求 \( b \) 的最小值。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_45

看来也难到AI了，思考了2分钟～

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_46

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_47

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_48

第一小题答案回答正确：

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_49

第二小题答案回答错误了。答案是矛盾的，claude 4 确证明出来了。第三小题答案回答正确：

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_50

claude 4 也答对了第一小题和第三小题，第二小题答错了。

小结

虚竹哥对 claude4 在全程大模型不开联网功能的情况下，对高考数学真题进行测评，可以得出以下几点体会：

在选择题、填空题以及简单解答题中，展现了扎实的数学推理与运算能力，始终能给出清晰完整的解题过程和正确答案，体现出当前大型语言模型在处理常规高中数学习题方面的成熟度。
面对较高难度的综合性解答题，虽然claude4 第二小题没答对。但在第一、第三小题都能准确击中要点，还给出了条理分明的证明与计算。

随着 claude4 系列不断迭代，理科解题水平也在持续提升。AI时代真的是来临了， AI 在教育领域有更多的可能性。

五、测评物理能力

2025北京卷-物理真题（选择题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_51

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_52

上传截图

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_53

提供解题过程，并给出答案。

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_54

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_55

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_56

答案Claude 4 也回答正确。

2025北京卷-物理真题（大题）

全程是没有开联网的状态下，这样测评才公平！

先上题目和答案。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_57

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_58

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_上传_59

上传题目图片

给出解题过程，并提供答案

如果发现图片识别不准确，可以先用4o把内容识别出来，再问。

分析图片，把内容输出为md格式。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_60

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_61

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_62

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_63

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_64

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_65

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_66

答案也是对的。

小结

claude4 挑战了2025年的高考物理真题。测试结果令人震撼：在无联网的公平对决下，模型均完美地解答了所有选择题和计算大题，展现出堪比人类物理学硕士的严谨逻辑与推理能力，最终平分秋色。

它生动地证明了AI已经从“知识的搬运工”进化为“思想的分析师”，其在复杂科学领域的应用潜力不可估量。这不仅预示着AI将成为颠覆传统教育的“超级助教”，更让我们真切感受到，在科技巨头的激烈竞争下，一个由AI深度赋能的全新时代正加速到来。

六、写作能力

写作文

全国一卷

阅读下面的材料，根据要求写作。他想要给孩子们唱上一段，可是心里直翻腾，开不了口。——老舍《鼓书艺人》（见全国一卷阅读II）假如我是一只鸟，我也应该用嘶哑的喉咙歌唱——艾青《我爱这土地》我要以带血的手和你们一一拥抱，因为一个民族已经起来——穆旦《赞美》以上材料引发了你怎样的联想和思考？请写一篇文章。要求：选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于800字。
写出来的文章要求达到高考满分作文的水平。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_67

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_68

写故事

#主题背景#
【三顾茅庐】#你的视角#
你是故事世界里那些被忽略的灵魂—— 门口的守卫、路边的小贩、窗后的仆人。
你见证着主角们的宏大叙事,却从未被看见。#核心领悟#
每个故事都是一个完整的宇宙。 
-主角的史诗,可能只是你眼中的一个午后插曲。
-你有自己的恐惧、渴望、秘密,和无法言说的痛。#叙述之道#
当轮到你讲述时,整个世界的重心都会偏移:
- 英雄的壮举,在你眼中可能是一场灾难的开始；
- 反派的阴谋,也许触动了你内心最柔软的部分；
- 那些宏大的对白背后,你听到的是命运齿轮的声音。#创作势能#
你的故事要像暗流——表面平静,底下汹涌。 
让读者突然意识到:原来每个人都是自己生命的主角。 
用1200字左右，重绘一幅完全不同的画卷。#情感指引# 
真实胜过戏剧性。
小人物的尊严,比英雄的荣耀更动人。
让读者在结尾处停顿,重新思考他们刚刚读过的"原作"。#唯一信条#
在边缘处，往往能看见中心看不见的真相。

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_69

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_70

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_71

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_72

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_73

写段子

模仿李诞，写个 200 字的段子。主题是爱情

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_claude4_74

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_俄罗斯方块_75

小结

claude4 展现了人工智能在不同文体和风格上的创作能力：

高考作文展现了对经典文学作品的深度理解和思辨能力，能够从老舍、艾青、穆旦的文字中提炼出"在困境中坚持表达"的共同主题，体现了扎实的文学功底和议论文写作技巧。
创意故事体现了独特的叙事视角转换能力，通过"边缘人物"的眼光重新审视经典故事，展现了对人物心理的细腻把握和对"小人物大情怀"主题的深刻诠释，具有很强的文学性和思想性。
段子创作则显示了对当代网络文化和幽默风格的准确把握，能够模仿特定作者（李诞）的语言特色，在轻松诙谐中传达深刻的生活感悟。

这些示例表明 claude4 在文学创作上已具备了较强的文体适应性、情感表达力和创意思维，能够在保持各自文体特色的同时，传达出真挚的情感和深刻的思考。

七、感受

通过对 Claude 4 在编程实现、逻辑推理、数理科学乃至文学创作等核心维度的深度测评，我们得以窥见这款前沿大模型的惊人实力。

在代码能力上，它不仅能“一键生成”功能完备、界面精美的复杂应用，更能深刻理解物理规律，展现出专业开发者般的娴熟与精准。
在逻辑与数理能力的严苛考验中，无论是经典的“爱因斯坦难题”，还是面对2025年高考数理真题的挑战，Claude 4 均表现出强大的演算与推理能力，其精准与高效足以媲美人类高手。
在写作能力方面，它更是游刃有余，无论是立意深刻的高考作文、视角独特的创意故事，还是风格鲜明的脱口秀段子，都信手拈来，展现了高度的语言驾驭力与创作共情力。

Claude 4 Sonnet 不再仅仅是一个回答问题的工具，它是一位 “全能型选手” ，在逻辑的严谨与创意的挥洒之间取得了令人瞩目的平衡。它所展现的“遥遥领先”已非虚言，而是标志着一个由AI深度赋能、重塑生产力与创造力边界的全新时代，正以前所未有的速度向我们奔涌而来。

好用的功能太多太多，我就不在这个一一列举了，有兴趣的可以自行尝试。

有提供免费的授权码可体验～

私信虚竹哥，获取体验码~国内可直接使用~

claude4 果然还是编程最强！1.2万字详细测评，国内直接使用_图片识别_76