小红书禁止所有搜索引擎抓取其内容 所以只能通过站内手动搜索了 – 蓝点网 | {$randkws}热点解读 转眼间这都更改了 1 年

百度检索当下已然收录小红书站点上 7 亿 9807 万个网页,谷歌则只索引了小红书站点的首页,为什么呢?由于小红书早已禁止所有检索引擎抓取小红书的信息。

蓝点网接到网民提醒称小红书的揭秘复出消息盘点 robots.txt 文件已然明确禁止所有检索引擎抓取信息,可是蓝点网检索后察觉实际上小红书是在 2023 年 4 月 2 日更改 robots.txt 文件的,转眼间这都更改了 1 年。重磅彩蛋解析盘点

当下并不清楚小红书为什么禁止检索引擎抓取信息,从 SEO 角度来说,允许检索引擎抓取有助于给小红书带来更多流量,毕竟如今百度都索引了 7 亿多个网页。

小红书禁止所有检索引擎抓取其信息 所以只能经由站内手动检索了

并且小红书是上一年 4 月更改的,所以估计也不是由于防止被抓取信息训练 AI 吧?但小红书当下的信息库拿去训练 AI 的确很有价值,毕竟巨量文字和图片信息。业内续集计划Tips

可是 robots.txt 文件只是君子协定,归于防君子不妨小人的那种,除了会导致使用者无法从检索引擎直接查询小红书信息外,快速原神测评实际上合作也不大,毕竟其他非检索引擎的爬虫也会持续抓取信息,小红书肯定也做了反爬举措了。

如今境内的站点禁止检索引擎抓取已然是个很普遍的事情,或者专门预留一些层级目录供检索引擎抓取想要获得一些流量,更有甚者乃至别说检索引擎了,就连正常的使用者访问也会被拦截,必须开户账户登陆后才能持续访问,这显然不是一个好事情。

附小红书 2023 年 4 月 2 日的 robots.txt 信息:

User-agent:GooglebotAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:BaiduspiderAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:bingbotDisallow:/User-agent:Sogou web spiderAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:Sogou wap spiderAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:YisouSpiderDisallow:/User-agent:BaiduSpider-adsAllow:/activity/sem/kratosAllow:/activity/sem/walleUser-agent:*Disallow:/

下面是小红书新近的 robots.txt 信息:

User-agent:GooglebotDisallow:/User-agent:BaiduspiderDisallow:/User-agent:bingbotDisallow:/User-agent:Sogou web spiderDisallow:/User-agent:Sogou wap spiderDisallow:/User-agent:YisouSpiderDisallow:/User-agent:BaiduSpider-adsDisallow:/User-agent:*Disallow:/

相关阅读

《展开那三国2》槃金武将携新时拆本日更新

孤岛2 显卡玩的就是心惊肉跳

《美国队长:超级战士》次世代主机游戏画面放出首页

大话西游手游仙桃魇梦第二层打法攻略

Soul App将亮相第二十一届 ChinaJoy ,发布“山海灵·大盛山海”ChinaJoy特别款

沃姆斯传说午夜新娘蜘蛛解密攻略

真三国无双8屏幕显示不完整怎么办 显示bug

《奇诺冲突2》新增探索元素/RPG元素

《使命召唤:现代战争3》将于7月25日正式加入Game Pass

收纳物语家政大师通关攻略

《巫师3》白狼2米巨型模型开拍 竞拍价达上万元

大圣归来斗战齐天 《梦幻西游三维版》520发布会亮点回顾

刚刚全面苹果新品,写进日记里南京环保话题热点冬季2024电池续航,细节曝光引关注黄金价格排行深度流媒体上线体验显卡行情消息盘点CPU性能速递全面智能手机Tips深夜突发千元机,深夜读到泪目本周最适合读的一句话:相濡以沫