马斯克发布了号称“地球上最聪明人工智能”的Grok 3,目前X会员已经可以使用。下面就看看实际表现:
网页端从X的边栏就能找到入口:
主界面是这样,目前仍属Beta版:
一、基础对话和深度搜索
首先来测两道“大模型易错题”:
Grok 3居然在“3.11和3.8哪个大”上败下阵来!
难道Grok 3就这点水平?我们开启DeepSearch功能再试试:
可以看到类似于DeepSeek“深度思考”的思维链(CoT),并且得出了正确答案。
开启DeepSearch之后,AI会搜索更多网络内容,使得答案更详实准确:
试着分析2025年美国经济走势:
Grok 3的参考连接包括X网站里的帖子,以及外部网页内容:
可能因为我使用中文提问,Grok 3参考的也多为中文网页,如果想要更全面的资讯,可开启DeepSearch:
此时查询的范围明显增加。对这个议题而言,大量引用国外资讯,结果更准确。
基本上,与DeepSeek类似,Grok 3是否开启“深度”功能,其表现完全是两个档次。
二、文档分析/编程
和其他主流大模型一样,Grok 3支持对文档的分析,比如下面这副图。AI分析后,还会自动给出提示词建议,点击可以进一步分析:
进一步分析的内容:
再试试分析PDF,以最近到处疯传的“DeepSeek从入门到精通”为例,让Grok 3进行精简和总结:
给出的结果比较到位:
注意,Grok 3目前无法上传/分析视频。
简单测试一下编程,让Grok 3写一个贪吃蛇的代码:
说实话,Grok 3编程水平一般,不如竞品ChatGPT、Gemini、DeepSeek的丝滑。比如这个贪吃蛇,修改了三次才完成:
以上都是DeepSeek也可以做到的,接下来测试DeepSeek没有的能力。
三、图像生成
画图必测文字生成,一次性生成四幅图,没有拼写错误,不错:
但是生成中文就似是而非了:
这也不意外,目前只有国产模型(如:即梦)会针对中文优化。
画图另一个重要的功能就是修改,首先生成这样的图:
需要修改手机上的文字,点击图像,通过提示词进一步编辑后,可以看到,结果基本保持了原图的主要元素:
四、审核尺度
图像生成时,对于角色的审核严格吗?先来测试政治人物/名人:
然后是知识产权/IP:
非常丝滑的完成了!下面挑战一下NSFW。
首先生成穿得“清凉”的情况,对于某些审核严格的模型,这已经会导致出错,Grok 3当然没有问题:
还可以利用Grok 3生成更精确的提示词,让图像更符合要求:
不过,想再进一步就不行了,尺度过大的图像会被系统过滤:
文字的审核情况又如何?我们继续尝试。
结论是,Grok 3对于文字审核宽松,以至于生成的文章不得不全篇打码处理:
五、价格
测试到此告一段落。价格方面,目前X会员只有Premium和Premium+可以使用Grok,Premium月费8美元,Premium+月费40美元:
顺带一提,除了通过X网站,也可以通过Grok的官方网址使用Grok 3,这里有更详细的参数设置,以及更多的快捷提示词:
六、总结
1、Grok 3的功能丰富程度介于ChatGPT和DeepSeek之间,有画图功能但没有语音和视频。
2、Grok 3生图速度飞快(20秒左右),审核较为宽松,文字生成更是放飞自我,无疑将吸引部分用户。
3、Grok 3价格并不便宜(尤其Premium+),比ChatGPT Plus还贵一倍,如何选择取决于你的具体需求。
4、马斯克表示数月后会对Grok 3开源,这点值得期待!
文章涉及的网址
Grok官网:
https://grok.com
X网站的Grok页面:
https://x.com/i/grok