xu6882611 发表于 2022-11-28 18:36:57

求助,国际化站后台日志显示很多404



网站链接都是完整URL,没有相对路径的URL,为什么爬虫会这样组装URL?
包括分页页码链接也是完整URL。

之前的链接是这样
首页https://example.com
国际化 https://example.com/zh-cn
栏目https://example.com/food
文章https://example.com/food/abc.html

所有的a标签herf都是完整URL不存在相对URL,默认情况下国际化为zh-cn也就是url默认情况下不带zh-cn,用户选择语言下拉框后页面定向到带国际化的url.

发现日志记录了非常多的404https://example.com/zh-cn/zh-mo/food/abc.html,问题是中间多了个国际化目录。
后改成
首页https://example.com/
国际化https://example.com/zh-cn/
栏目改成https://example.com/food/    https://example.com/zh-cn/food/
文章https://example.com/food/abc.html    https://example.com/zh-cn/food/abc.html

问题依旧,大量404是否影响SEO?

xu6882611 发表于 2022-11-29 05:36:22

没有人回答一下嘛

chenkui 发表于 2022-11-29 16:16:57

看源码,原始代码,不是浏览器上的

xu6882611 发表于 2022-11-29 16:40:18

chenkui 发表于 2022-11-29 16:16
看源码,原始代码,不是浏览器上的

程序是我自己开发的,所有a链接都是完整的URL,不存在相对路径。

审视过好几遍了!

比较奇怪谷歌爬虫以及必应爬虫都会出现这种现象。

/zh-cn/zh-tw/food/abc.html404
/zh-tw/food/abc.html200
/zh-cn/food/abc.html200
页: [1]
查看完整版本: 求助,国际化站后台日志显示很多404