零、前言
Claude 4 是一款全球领先的编码模型,在处理复杂和长时间运行的任务等方面展现出持续稳定的卓越表现。
但是,它在实际用起来的时候到底好不好用、能不能解决实际问题,好像还没有人给出一个既详细又全面的说法。
虚竹哥系统已经集成了Claude-4 【Sonnet】 , 今天跟虚竹哥一起来测评这个大模型。
一、操作指南
操作指导
AI平台 国内直接访问地址:https://sass.xiaoxuzhu.cn/
输入指定的授权码即可。
选择大模型: Claude-4
有些数学公式,页面显示不了。解决方案
可以复制到这个网站https://www.latexlive.com/
二、测评代码能力
俄罗斯方块
写一个功能完备的俄罗斯方块,使用前端技术
输入
输出
效果
claude4这个AI生成的俄罗斯方块让我印象深刻!一次性输出了完整可运行的游戏,包含所有经典功能:7种方块、旋转移动、消除计分、等级提升,甚至还有现代化的渐变界面和毛玻璃效果。
代码结构清晰,逻辑完整,无需任何修改就能直接使用。AI的编程能力和对细节的把控已经达到了专业开发者的水准,真正做到了"一键生成,即刻可玩"。
小球旋转
20 个小球在旋转的 6 边形内弹跳,考虑重力,弹力,摩擦力等物理规律。 用 p5js
输入
输出
效果
就像一个不喜欢啰嗦的学霸一样,快速思考后,直接出结果。而且出的结果特别准确,界面也很美观。
水桶模拟器
生成一个水桶模拟器,桶里面装有水,桶可以按照某一点晃动,水会做出符合物理规律的运动。使用前端技术。
输入
输出
第一次生成的效果有了,就是水不明显,再优化下
效果
claude4的ai编程能力是真的强!遥遥领先!第一次其实已经实现了,就是有点小瑕疵,水的效果不明显,让ai优化后,效果就出来了。
小结
通过三个生动的编程实例——俄罗斯方块、小球物理模拟和水桶模拟器,集中展示了claude4 强大的代码生成与理解能力。
核心亮点如下:
- 高完整性与即时可用性:AI能够一次性生成功能完备、逻辑严谨且界面精美的复杂应用,如俄罗斯方块,达到了“开箱即用”的专业水准。
- 深刻的逻辑与物理理解:无论是游戏规则,还是涉及重力、弹力等复杂物理规律的模拟,AI都能准确理解并用代码实现,结果精准且符合预期。
- 强大的迭代与优化能力:在水桶模拟器的案例中,AI能根据用户提出的优化反馈,对初始方案进行有效改进,展现了良好的“沟通”与迭代能力。
claude4 在编程领域表现出惊人的实力,不仅能处理复杂的逻辑与创意需求,还能快速生成高质量、可迭代的代码,其能力已“遥遥领先”,达到了令人印象深刻的专业开发者水平。
三、测评推理能力
推理:谁养鱼?
在一条街上,有 5 座房子,喷了 5 种颜色;
每座房子里住着不同国籍的人;每个人喝不同的饮料,抽不同品牌的香烟,养不同的宠物。
问题:谁养鱼?
提示:英国人住红色房子、瑞典人养狗、丹麦人喝茶、绿色房子在白色房子左面、绿色房子的主人喝咖啡、抽 Pall Mall 香烟的人养鸟、黄色房子的主人抽 Dunhill 香烟、住在中间房子的人喝牛奶、 挪威人住第一间房、抽 Blends 香烟的人住在养猫人的隔壁、养马的人住抽 Dunhill 香烟的人隔壁、抽 Blue Master 的人喝啤酒、德国人抽 Prince 香烟、挪威人住蓝色房子隔壁、抽 Blends 香烟的人有一个喝水的邻居。
答案是:德国人养鱼
输入
输出
效果
快速地得出结论,德国人养鱼。
小结
本次测评经典的爱因斯坦斑马难题(谁养鱼),深入地考察了 claude4 的逻辑推理与思维能力。结果表明,claude4 具备高度发达的、类似人类的推理智慧。
复杂信息处理与演绎能力 (谁养鱼问题):爱因斯坦的谜题是推理能力的“试金石”,它要求在海量、零散的线索中建立联系。claude4 在此表现出了卓越的信息处理和系统化演绎能力。它能够像人类高手一样,通过构建表格等方式,将所有线索有序整理,并在此基础上进行层层推导,最终在复杂的可能性中精准地找到了唯一答案(德国人养鱼)。
四、测评数学能力
二、2025新高考一卷-数学真题(选择题)
全程是没有开联网的状态下,这样测评才公平!
先上题目和答案。
上传截图
提供解题过程,并给出答案。
答案Claude 4 也回答正确。
2025新高考一卷-数学真题(填空题)
全程是没有开联网的状态下,这样测评才公平!
先上题目和答案。
上传题目图片
给出解题过程,并提供答案
答案也是对的。
2025新高考一卷-数学真题(解答题-简单)
全程是没有开联网的状态下,这样测评才公平!
先上题目和答案。
上传题目图片
给出解题过程,并提供答案
如果发现图片识别不准确,可以先用4o把内容识别出来,再问。
分析图片,把内容输出为md格式。
**16.(本小题满分 15 分)**
已知数列 $\{a_n\}$ 中,$a_1 = 3$,$\dfrac{a_{n+1}}{n} = \dfrac{a_n}{n+1} + \dfrac{1}{n(n+1)}$。1. 证明:数列 $\{n a_n\}$ 是等差数列;
2. 给定正整数 $m$,设函数 $f(x) = a_1 x + a_2 x^2 + \cdots + a_m x^m$,求 $f'(-2)$。
claude 4 也答对了。
2025新高考一卷-数学真题(解答题-复杂)
全程是没有开联网的状态下,这样测评才公平!
先上题目和答案。最后一题大题。
上传题目图片
给出解题过程,并提供答案
如果发现图片识别不准确,可以先用4o把内容识别出来,再问。
分析图片,把内容输出为md格式。
### 19.(本小题满分 17 分)1. 求函数 \( f(x) = 5\cos x - \cos 5x \) 在区间 \([0, \frac{\pi}{4}]\) 的最大值;2. 给定 \( \theta \in (0, \pi) \) 和 \( a \in \mathbb{R} \),证明:存在 \( y \in [a - \theta, a + \theta] \) 使得 \( \cos y \leq \cos \theta \);3. 设 \( b \in \mathbb{R} \),若存在 \( \varphi \in \mathbb{R} \) 使得 \( 5\cos x - \cos(5x + \varphi) \leq b \) 对 \( x \in \mathbb{R} \) 恒成立,求 \( b \) 的最小值。
看来也难到AI了,思考了2分钟~
第一小题答案回答正确:
第二小题答案回答错误了。答案是矛盾的,claude 4 确证明出来了。第三小题答案回答正确:
claude 4 也答对了第一小题和第三小题,第二小题答错了。
小结
虚竹哥对 claude4 在全程大模型不开联网功能的情况下,对高考数学真题进行测评,可以得出以下几点体会:
- 在选择题、填空题以及简单解答题中,展现了扎实的数学推理与运算能力,始终能给出清晰完整的解题过程和正确答案,体现出当前大型语言模型在处理常规高中数学习题方面的成熟度。
- 面对较高难度的综合性解答题,虽然claude4 第二小题没答对。但在第一、第三小题都能准确击中要点,还给出了条理分明的证明与计算。
随着 claude4 系列不断迭代,理科解题水平也在持续提升。AI时代真的是来临了, AI 在教育领域有更多的可能性。
五、测评物理能力
2025北京卷-物理真题(选择题)
全程是没有开联网的状态下,这样测评才公平!
先上题目和答案。
上传截图
提供解题过程,并给出答案。
如果发现图片识别不准确,可以先用4o把内容识别出来,再问。
分析图片,把内容输出为md格式。
答案Claude 4 也回答正确。
2025北京卷-物理真题(大题)
全程是没有开联网的状态下,这样测评才公平!
先上题目和答案。
上传题目图片
给出解题过程,并提供答案
如果发现图片识别不准确,可以先用4o把内容识别出来,再问。
分析图片,把内容输出为md格式。
答案也是对的。
小结
claude4 挑战了2025年的高考物理真题。测试结果令人震撼:在无联网的公平对决下,模型均完美地解答了所有选择题和计算大题,展现出堪比人类物理学硕士的严谨逻辑与推理能力,最终平分秋色。
它生动地证明了AI已经从“知识的搬运工”进化为“思想的分析师”,其在复杂科学领域的应用潜力不可估量。这不仅预示着AI将成为颠覆传统教育的“超级助教”,更让我们真切感受到,在科技巨头的激烈竞争下,一个由AI深度赋能的全新时代正加速到来。
六、写作能力
写作文
全国一卷
阅读下面的材料,根据要求写作。他想要给孩子们唱上一段,可是心里直翻腾,开不了口。——老舍《鼓书艺人》(见全国一卷阅读II)假如我是一只鸟,我也应该用嘶哑的喉咙歌唱——艾青《我爱这土地》我要以带血的手和你们一一拥抱,因为一个民族已经起来——穆旦《赞美》以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。
写出来的文章要求达到高考满分作文的水平。
写故事
#主题背景#
【三顾茅庐】#你的视角#
你是故事世界里那些被忽略的灵魂—— 门口的守卫、路边的小贩、窗后的仆人。
你见证着主角们的宏大叙事,却从未被看见。#核心领悟#
每个故事都是一个完整的宇宙。
-主角的史诗,可能只是你眼中的一个午后插曲。
-你有自己的恐惧、渴望、秘密,和无法言说的痛。#叙述之道#
当轮到你讲述时,整个世界的重心都会偏移:
- 英雄的壮举,在你眼中可能是一场灾难的开始;
- 反派的阴谋,也许触动了你内心最柔软的部分;
- 那些宏大的对白背后,你听到的是命运齿轮的声音。#创作势能#
你的故事要像暗流——表面平静,底下汹涌。
让读者突然意识到:原来每个人都是自己生命的主角。
用1200字左右,重绘一幅完全不同的画卷。#情感指引#
真实胜过戏剧性。
小人物的尊严,比英雄的荣耀更动人。
让读者在结尾处停顿,重新思考他们刚刚读过的"原作"。#唯一信条#
在边缘处,往往能看见中心看不见的真相。
写段子
模仿李诞,写个 200 字的段子。主题是爱情
小结
claude4 展现了人工智能在不同文体和风格上的创作能力:
- 高考作文展现了对经典文学作品的深度理解和思辨能力,能够从老舍、艾青、穆旦的文字中提炼出"在困境中坚持表达"的共同主题,体现了扎实的文学功底和议论文写作技巧。
- 创意故事体现了独特的叙事视角转换能力,通过"边缘人物"的眼光重新审视经典故事,展现了对人物心理的细腻把握和对"小人物大情怀"主题的深刻诠释,具有很强的文学性和思想性。
- 段子创作则显示了对当代网络文化和幽默风格的准确把握,能够模仿特定作者(李诞)的语言特色,在轻松诙谐中传达深刻的生活感悟。
这些示例表明 claude4 在文学创作上已具备了较强的文体适应性、情感表达力和创意思维,能够在保持各自文体特色的同时,传达出真挚的情感和深刻的思考。
七、感受
通过对 Claude 4 在编程实现、逻辑推理、数理科学乃至文学创作等核心维度的深度测评,我们得以窥见这款前沿大模型的惊人实力。
- 在代码能力上,它不仅能“一键生成”功能完备、界面精美的复杂应用,更能深刻理解物理规律,展现出专业开发者般的娴熟与精准。
- 在逻辑与数理能力的严苛考验中,无论是经典的“爱因斯坦难题”,还是面对2025年高考数理真题的挑战,Claude 4 均表现出强大的演算与推理能力,其精准与高效足以媲美人类高手。
- 在写作能力方面,它更是游刃有余,无论是立意深刻的高考作文、视角独特的创意故事,还是风格鲜明的脱口秀段子,都信手拈来,展现了高度的语言驾驭力与创作共情力。
Claude 4 Sonnet 不再仅仅是一个回答问题的工具,它是一位 “全能型选手” ,在逻辑的严谨与创意的挥洒之间取得了令人瞩目的平衡。它所展现的“遥遥领先”已非虚言,而是标志着一个由AI深度赋能、重塑生产力与创造力边界的全新时代,正以前所未有的速度向我们奔涌而来。
好用的功能太多太多,我就不在这个一一列举了,有兴趣的可以自行尝试。
有提供免费的授权码可体验~
有提供免费的授权码可体验~
有提供免费的授权码可体验~
私信虚竹哥,获取体验码~国内可直接使用~
我是虚竹哥,目标是带十万人玩转AI。