求助,国际化站后台日志显示很多404
网站链接都是完整URL,没有相对路径的URL,为什么爬虫会这样组装URL?
包括分页页码链接也是完整URL。
之前的链接是这样
首页https://example.com
国际化 https://example.com/zh-cn
栏目https://example.com/food
文章https://example.com/food/abc.html
所有的a标签herf都是完整URL不存在相对URL,默认情况下国际化为zh-cn也就是url默认情况下不带zh-cn,用户选择语言下拉框后页面定向到带国际化的url.
发现日志记录了非常多的404https://example.com/zh-cn/zh-mo/food/abc.html,问题是中间多了个国际化目录。
后改成
首页https://example.com/
国际化https://example.com/zh-cn/
栏目改成https://example.com/food/ https://example.com/zh-cn/food/
文章https://example.com/food/abc.html https://example.com/zh-cn/food/abc.html
问题依旧,大量404是否影响SEO?
没有人回答一下嘛 看源码,原始代码,不是浏览器上的 chenkui 发表于 2022-11-29 16:16
看源码,原始代码,不是浏览器上的
程序是我自己开发的,所有a链接都是完整的URL,不存在相对路径。
审视过好几遍了!
比较奇怪谷歌爬虫以及必应爬虫都会出现这种现象。
/zh-cn/zh-tw/food/abc.html404
/zh-tw/food/abc.html200
/zh-cn/food/abc.html200
页:
[1]