深入了解在网络上爬行的自主聊天机器人和数据抓取器的隐藏生态系统。保护您的网站免受不必要的人工智能代理访问。
ChatGPT-User
ChatGPT用户由OpenAI的ChatGPT根据用户提示进行调度。它的回答通常会包含网站上内容的摘要,而不是直接转发给用户。
cohere-ai
cohere ai是一个未经证实的代理,可能是cohere的人工智能聊天产品在需要在互联网上检索内容时根据用户提示而派遣的。
anthropic-ai
anthropic ai是一个未经证实的代理,可能被anthropic用来下载其LLM(大型语言模型)的训练数据,该LLM为Claude等人工智能产品提供动力。
CCBot
CCBot是Common Crawl使用的一个网络爬网程序,用于维护任何人都可以使用的网络爬网数据的开源存储库。该存储库已用于训练许多LLM(大型语言模型),包括OpenAI的GPT-3。
FacebookBot
FacebookBot是Meta用来下载其人工智能语音识别技术的训练数据的网络爬虫。
Google-Extended
Google Extended是谷歌用于下载其人工智能产品(如Bard和Vertex人工智能生成API)的人工智能培训内容的网络爬虫。
GPTBot
GPTBot是OpenAI用来下载LLM(大型语言模型)训练数据的网络爬虫,为ChatGPT等人工智能产品提供动力。
Omgilibot
Omgilibot是Webz.io使用的一个网络爬虫,用于维护其出售给其他公司的网络爬行数据存储库,包括那些使用它来训练人工智能模型的公司。
Amazonbot
Amazonbot是亚马逊用来索引搜索结果的网络爬虫,允许Alexa AI助手回答用户问题。Alexa的回答通常包含对网站的引用。
Applebot
Applebot是苹果公司用来索引搜索结果的网络爬虫,允许Siri AI助手回答用户问题。Siri的回答通常包含对该网站的引用。
PerplexityBot
PerplexityBot是Perplexity使用的网络爬虫,用于索引搜索结果,使其AI助手能够回答用户问题。助理的回答通常包含作为内联来源的网站参考。
YouBot
YouBot是You.com使用的网络爬虫,用于索引搜索结果,使其AI助手能够回答用户问题。助理的回答通常包含作为内联来源的网站参考。
工具网站:https://darkvisitors.com/
评论0+