Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

点击上方“蓝色字体”关注我,每天推送“AI干货”!




claude3.7介绍

Claude 3.7 Sonnet 是 Anthropic 最新的 AI 模型,定位为推理、编码和现实世界问题解决方面的重大进步。最大的变化是 Claude 3.7 Sonnet 现在支持思考模式,让我们可以看到模型的逐步推理过程。下面从代码能力测试和svg卡片生成两个维度跟最近火热发布的两个模型deepseek-R1和grok3做一下对比测试。

代码能力测试

1. Claude3.7 think

使用claude3.7实现一个前端页面,响应时长基本是秒回

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3
创建一个包含CSS和JavaScript的单个HTML文件,用于生成一个带有动画的天气卡片。卡片应通过不同的动画直观地展示以下天气情况:
风:例如移动的云、摇摆的树木或风线。
雨:例如下落的雨滴、积水形成。
晴:例如闪烁的阳光、明亮的背景。
雪:例如飘落的雪花、积雪。
将所有天气卡片并排放置。卡片应有一个深色背景。提供所有HTML、CSS和JavaScript代码,全部包含在同一个文件中。JavaScript应包含一种方式,用于在不同的天气条件下切换(例如一个函数或一组按钮),以展示每种天气的动画效果。
Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

2.Deepseek-R1 think

切换到Deepseek-R1

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

响应时长111s,生成的html通过在线解析工具中看一下渲染效果

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

3. grok3 think

思考响应时长114s

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

看下代码效果:

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

三个前端代码能力相比哪个更强不言而喻

svg卡片能力测试

先让deepseek-r1生成一个关于MOE大模型的工作原理,然后绘制成svg图

  • claude3.7
Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3
  • Deepseek-r1
Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3
  • grok3
Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

总结

以上就是跟大家分享的关于claude3.7、deepseek-r1以及grok3的代码能力和svg卡片生成能力的对比测试。总的来说claude3.7完胜另外两个大模型,这也能解释为什么现在最火的Cursor代码编辑器为什么会集成claude3.5的原因。当然以上的测试仅仅是从两个维度来做对比,还有其他维度比如逻辑推理、数学测试、语义理解、图文生成、性能等等。感兴趣的小伙伴可以自己再去上手体验。

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

 DeepSeek-V3大模型逆向API不止为了免费

● 开发者必须掌握的小技巧!如何将DeepSeek集成到IDEA和VS Code?

● 5分钟教程:轻松搞定DeepSeek R1大模型本地化部署!纯免费

 2个安装包1条命令搞定:DeepSeek-R1最佳本地部署+知识库+联网搜索






Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3



如果本文对您有帮助,也请帮忙点个 赞? + 在看 哈!❤️

在看你就赞赞我!
Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

欢迎加入「小智AI陪伴」社群?每天分享AI最新资讯

希望大家在这里有所收获,进群就送deepseek学习资源?

智能体免费课程?小智AI知识库?RPA实战源码分享?

更有几个T的AI网盘资源电子书培训课可以领取[Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3]

Claude 3.7实测:代码能力完胜Deepseek-R1和Grok3

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片