今天看到的这篇文章是我在  LinkedIn 上一直关注的 SEO 专家之一。

最近,他发表了一些优秀研究成果,我给大家分享一下。

感兴趣的可以去看一下原文:(https://nectivdigital.com/new-data-study-what-queries-is-chatgpt-using-behind-the-scenes)

例如,在研究了 8500 多个提示后,他发现 ChatGPT 每 3 次就会执行 1 次搜索来获取训练数据。

而且,77% 的扇出查询都包含五个或五个以上的单词……

正文开始:

ChatGPT 搜索的背景

我们知道用户正在通过 ChatGPT 获取信息,但 ChatGPT 实际上通过两种不同的方式获取这些信息:

  1. 它运用自身的知识来回答问题。
  2. 它不知道答案,所以会进行搜索。这里它利用搜索结果来确定它正在寻找的信息。

这是一个非常简单的提示示例,ChatGPT 本身无法提供答案,因此它会进行搜索:

图片

关于 ChatGPT 是否使用谷歌搜索索引进行推广,一直存在很多争论。我个人认为它确实使用了(这里有一篇很棒的文章),但这又是另一个话题了。重要的是要理解,当 ChatGPT 使用搜索功能时,SEO 人员就能更好地控制其展示的信息。ChatGPT 本质上是搜索引擎的一个封装层。因此,如果我们能够弄清楚 LLM 的搜索频率和搜索内容,就能更轻松地进行优化。

ChatGPT 最酷的地方在于,你实际上可以看到它内部的查询语句。你可以通过一些方法找到它返回的 JSON 文件,该文件会显示特定搜索过程中使用的查询语句。

图片

 

数据就在那里,只是不太容易获取。虽然有一些工具,比如ChatGPT Search Capture,可以让你通过简单的点击操作找到特定聊天记录的查询词,但我们一直没有大规模提取数据的方法……直到现在。

提取 ChatGPT 扇出数据

在这里,我必须好好夸夸我的联合创始人 Jason Melman。他既是出色的 SEO 专家,又是优秀的开发者,这让我们能够实现一些非常棒的功能。

前几天他找到我说,他可能找到了一种大规模提取 ChatGPT 查询的方法。仅仅一个下午,他就为我们的AI Tracker添加了新功能,使我们能够分析 ChatGPT 使用的查询。

图片

我们立刻意识到必须扩大规模。这样做能让我们更好地识别趋势,从而准确了解 ChatGPT 搜索查询的运作方式。在 Slack 上不断催促 Jason 之后,我们通过 AI 追踪器上传了 8500 个提示,并大规模提取了 ChatGPT 的分流查询。

方法论

在本研究中,我们分析了 Nectiv 人工智能追踪器中的 8500 多个搜索提示。 

我们分析了这些提示是否记录了搜索,并提取了所有记录了搜索的提示的搜索查询。

我们针对 9 个不同的垂直领域分析了这些提示:美容、电商、信用卡、时尚、求职与职业、本地服务、软件、房地产和旅游。在分析过程中,我们既考察了总体数据集的总体趋势,也考察了这些关键垂直领域特有的趋势。

请注意,提示跟踪本身就存在模糊性。本研究旨在分析当用户具有商业/购买意图(例如“最佳女装”、“纽约到洛杉矶的航班”)时,ChatGPT 的搜索行为。通过这种方式,我们可以确定需要哪些内容才能与这些底层搜索建立联系。

ChatGPT 扇出查询关键发现

好的,接下来我们来看看分析的一些发现。首先,我们可以看一下 ChatGPT 的汇总数据:

  • 搜索总次数:2,648
  • 搜索实例占比:31%
  • 平均搜索次数:2.17
  • 平均每次查询词数:5.48

因此,ChatGPT 几乎有三分之一的时间会根据该数据集中的提示执行搜索。

图片

在所有垂直领域,ChatGPT 通常需要执行两次左右的搜索才能找到所需信息。此外,ChatGPT 的搜索查询平均长度也更长,每次搜索平均使用 5-6 个词。

例如,它会搜索“土耳其最佳租车评价”或“顶级飞行员夹克品牌”之类的内容。因此,它的搜索查询长度比我们通常用于跟踪和优化的查询要长一些。

ChatGPT 使用了多少个扇出查询?

“查询扇出”的概念意味着 LLM(生命周期管理)并非总是只执行一次搜索,而是可以执行多次搜索。

例如,谷歌正在展示其系统如何跨 8 个以上的查询进行搜索,从而为用户找到所需信息。

正如我们之前提到的,整个数据集的平均搜索次数为 2 次。然而,有趣的是,如果按搜索次数进行分组,3 次搜索实际上是最常见的情况,共记录到 1279 次。

图片


虽然数据中看不到,但确实记录到过一次四次查询的情况。这让我相信ChatGPT 最多只能发出 4 次查询

扇形查询使用多少个词?

因此,我们知道 ChatGPT 的搜索查询平均长度为 5-6 个单词,平均每次查询包含 5.48 个单词。Semrush的一项研究估计,美国用户的平均 Google 搜索长度为 3.4 个单词。这意味着 ChatGPT 的搜索查询平均比标准的 Google 搜索长 61%。

但我觉得,当你查看数据集时,这种说法并不能完全反映实际情况。事实上,当你查看数据时,你会发现查询长度可能更长。

图片

事实上,如果像这样将查询分组,你会发现大多数查询都比较长。实际上, 77% 的查询都包含 5 个或更长的单词 

值得注意的是,该数据集的最大查询长度为 12。以下是一些示例:

  • Rooms to Go 信用卡预审批 Rooms to Go 信用预审批
  • 美国最佳互换费率信用卡互换费率信用卡发卡机构
  • 比较 Razer Phone 机型:Razer Phone 2、Razer Phone 1 用户评价

我不确定这是否是限制,但你不太可能获得长度超过 12 个单词的搜索查询。

ChatGPT 使用行业搜索的频率如何?

我们想评估的一点是,ChatGPT 在不同行业中使用搜索功能的频率。由于各行业情况不尽相同,我们认为有些行业的搜索频率可能更高。我们对所有提示进行了细分,以观察这方面的趋势:

图片

其中一些非常有趣的见解包括:

  • ChatGPT 会非常频繁地使用搜索功能来处理带有“本地”意图的提示。
  • 在我们的数据集中,它执行了 565 次搜索,其中 59% 的提示都执行了查询。因此,如果您身处本地,ChatGPT 很可能正在使用搜索功能来向您展示相关信息。
  • 一般“商业”用户也经常使用搜索功能,其中 ChatGPT 有 41% 的概率触发该功能。
  • 信用卡和时尚类商品最不可能让 ChatGPT 执行搜索,分别只有 18% 和 19% 的实例。

为了更直观地展示结果,我们还制作了这张图表,显示了各个垂直领域的搜索量与平均搜索量相比是高出还是减少了多少:

图片

查询扇出在不同行业之间有何变化?

当我们查看汇总数据时,发现 ChatGPT 在我们分析的所有提示中平均查询次数约为 2.1 次。我们也想看看按行业细分后是否存在较大差异。从整体上看,大多数行业的查询次数似乎都徘徊在 2 次左右:

图片

然而,其中也存在一些差异,可以从中得出一些有趣的结论:

  • 在求职和职业领域,ChatGPT 的搜索量最高,在整个数据集中平均每条搜索量接近 3 次。
  • 软件还发现,来自数据集其余部分的查询扇出量有所增加,平均为 2.68 次查询。
  • 虽然本地搜索结果的实例数量最多,但其平均扇出次数却是最少的。本地搜索的平均扇出次数为 1.67 次,是所有垂直领域中最低的。

不同行业的查询词数会有变化吗?

我们想分析的另一个有趣问题是,不同行业的关键词数量是否会有所不同。ChatGPT 是否需要针对某些行业搜索更长的关键词,而对其他行业则不需要?简而言之,答案似乎是否定的。目前来看,大多数行业的每次查询都使用 5-6 个关键词。

图片

信用卡和房地产这两个词的单词数量最多(6 个以上)。

ChatGPT 搜索哪些类型的查询?

好的,这是数据中最有价值的部分,但也是最难分析的部分。主要原因是 ChatGPT 的本质取决于输入的提示语。

因此,这里的数据自然会严重偏向于我在提示语中使用的语言以及我选择关注的行业。然而,无论你选择什么提示语/行业,它搜索时都存在一些清晰的 Ngram 模式。

为此,我使用了以下逻辑来筛选出适用的 N 语法:

  • 原始提示中未使用 Ngram 或其同义词。
  • NGram 至少出现在 3 个数据集中。

根据这一逻辑,您可以在下方找到整个数据集中最常见的五个 Ngram:

图片

这些是关键发现,因为你需要针对这些关键词优化内容,才能与 ChatGPT 的分支搜索查询建立联系。让我们来分析其中几个:

  • 评论 :迄今为止最受欢迎的功能,共有 702 个实例。ChatGPT 经常会搜索产品、服务或软件的评论。
  • 2025 :ChatGPT 非常注重新鲜感和年份。就像传统的 SEO 策略一样,在标题标签中添加年份并每年更新,这很可能有助于提升 ChatGPT 的曝光度。
  • 特征 :我原以为这只会出现在“软件”数据集中,但它也出现在商业、时尚甚至信用卡数据集中。ChatGPT 使用“特征”这一术语来学习产品信息(例如 ASICS Gel Kayano 29 与 30 的特征对比,Chase Sapphire Reserve 的特征)。
  • 对比 :ChatGPT 似乎倾向于与产品对比内容(例如最佳电商软件平台对比)建立联系。创建将您的产品与其他产品进行比较的内容可能是一个可行的策略。

当然,这些 Ngram 指标会根据你所关注的行业而变化。

例如,深入分析软件,我发现出现了“工具”和“定价”等新兴类别,而“功能”和“免费”等 Ngram 类别则更加突出。

图片

如果您想了解您特定网站的 Ngrams,请随时联系我们,我们可以为您识别一些。

结论

我希望这些数据对您有所帮助。既然我们能够提取这些数据,我就感到有责任去分析它们,以便我们所有人都能了解 ChatGPT 的工作原理。希望这能为我们提供一些启发,帮助我们更好地优化未来的搜索策略。

不知道大家对这的看法是什么呢?

你有任何想法或疑问,也欢迎一起探讨

今天知识点就分享到这里~

接下来免费资料分享!

(独立站必备技能)

谷歌SEO文档

图片

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐