深入了解在网络上爬行的自主聊天机器人和数据抓取器的隐藏生态系统。保护您的网站免受不必要的人工智能代理访问。

ChatGPT-User

ChatGPT用户由OpenAI的ChatGPT根据用户提示进行调度。它的回答通常会包含网站上内容的摘要,而不是直接转发给用户。

cohere-ai

cohere ai是一个未经证实的代理,可能是cohere的人工智能聊天产品在需要在互联网上检索内容时根据用户提示而派遣的。

anthropic-ai

anthropic ai是一个未经证实的代理,可能被anthropic用来下载其LLM(大型语言模型)的训练数据,该LLM为Claude等人工智能产品提供动力。

CCBot

CCBot是Common Crawl使用的一个网络爬网程序,用于维护任何人都可以使用的网络爬网数据的开源存储库。该存储库已用于训练许多LLM(大型语言模型),包括OpenAI的GPT-3。

FacebookBot

FacebookBot是Meta用来下载其人工智能语音识别技术的训练数据的网络爬虫。

Google-Extended

Google Extended是谷歌用于下载其人工智能产品(如Bard和Vertex人工智能生成API)的人工智能培训内容的网络爬虫。

GPTBot

GPTBot是OpenAI用来下载LLM(大型语言模型)训练数据的网络爬虫,为ChatGPT等人工智能产品提供动力。

Omgilibot

Omgilibot是Webz.io使用的一个网络爬虫,用于维护其出售给其他公司的网络爬行数据存储库,包括那些使用它来训练人工智能模型的公司。

Amazonbot

Amazonbot是亚马逊用来索引搜索结果的网络爬虫,允许Alexa AI助手回答用户问题。Alexa的回答通常包含对网站的引用。

Applebot

Applebot是苹果公司用来索引搜索结果的网络爬虫,允许Siri AI助手回答用户问题。Siri的回答通常包含对该网站的引用。

PerplexityBot

PerplexityBot是Perplexity使用的网络爬虫,用于索引搜索结果,使其AI助手能够回答用户问题。助理的回答通常包含作为内联来源的网站参考。

YouBot

YouBot是You.com使用的网络爬虫,用于索引搜索结果,使其AI助手能够回答用户问题。助理的回答通常包含作为内联来源的网站参考。

工具网站:https://darkvisitors.com/

历史上的今天
01月
7
    抱歉,历史上的今天作者很懒,什么都没写!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。