Skip to content

6. 利用Grok解决这三个问题

6.1. 引言

 
  • 在[1]中,xAI旗下Grok AI的URL为[https://x.ai/company];
  • 在[2]中,是您的对话记录。要访问它,您需要创建一个账户;
  • 在[3]中,提出您的问题;
  • 在[4]处,您可以上传文件;
  • 在 [5] 中,运行 AI;

与Gemini和ChatGPT不同,我尚未遇到过关于提问数量、时间或附件数量的限制。但这并不意味着这些限制不存在。

6.2. 问题 1

 

Grok 正确回答了这个问题。

6.3. 问题 2

我们要求 Grok 根据 ChatGPT 生成的 PDF 计算税款,并将操作说明写入文本文件中。

 

该文本文件与之前测试的两款AI所用的文件相同,但我们已加入了经ChatGPT和Gemini验证的25项测试。所使用的PDF文件是由ChatGPT生成的:

Grok随后提供了一个非常简洁的脚本,但移植到PyCharm后,几乎没有任何测试能通过。于是我向其提供了错误日志:

这次,Grok 通过了全部 25 个测试。在 [1-3] 中,我们展示了生成的 [grok1] 脚本以及问题中附带的两个文件。

6.4. 问题 3

这次,没有提供计算规则的 PDF 文件。Grok 必须在线查找这些规则。文本说明 [instructionsSansPDF5.txt] 给出了与之前相同的 25 个测试用例供其验证。

 

Grok 第一次尝试就几乎成功了。它生成的脚本在 25 个测试中通过了 24 个。我们向它提供了日志。

第二次尝试时,它成功了。在 [1] 中,是 Grok 生成的脚本;在 [2] 中,是需要遵循的操作说明。

现在,我们要求它生成一份 PDF 文档,说明其通过全部 25 个测试所采用的计算规则:

 

Grok 生成的并非 PDF 文件,而是一个 [Markdown] 文件。我使用了一个免费工具将其转换为 PDF。此外,PyCharm 也能读取 [Markdown] 文件:

 

6.5. 问题 4

为了验证之前生成的PDF文件,我们将它输入到Grok中。

 

它的第一个版本是正确的。该脚本通过了全部25个测试。事实上,人工智能似乎并不具有确定性。 你可以向它们提出相同的问题两次,会发现它们的答案各不相同。Grok在此处就是如此。第一次,我忘记了它本不该上网,而应该仅使用其PDF文件。结果它生成了一个错误的脚本。我向它提供了日志,这才发现它是在上网查资料。在上面的问题中,我要求它不要这样做。因此,总体而言,Grok表现良好。