怎么让谷歌删掉以前的收录?
我有一个英文的WP博客站,前段时间做的,现在要推掉重新再做一个新的主题的站,所以想把前段时间做的旧主题的被谷歌收录的页面删掉,请问该怎么才能让谷歌把之前的收录内容去掉而不会影响到新的内容的收录?谢谢从Google 的目录中删除网页记录
来源: 作者:cnsho 2006-11-20 23:27 我来投稿 参与评论
Google 永远将品质放在第一位。因此,只有当网主提出取消网页记录的请求时,Google 才会删除这些网页的记录,以避免误删网页,保证搜索质量。
以下是各种不同的删除方式,通常需要六到八周的时间,即等到下一次 Google 漫游后才会生效。
更改网址:
由于 Google 漫游器依网址来辨别网页,所以您不能自己更改目录里的网址。Google 下次漫游时都会自动更新这些网址。漫游器的行程是自动设定的,我们也没有办法让它提前到达您的网站。
如果您在 Google 漫游后更改了网址,您可以填写网页登录申请表,并按照下列说明删除旧网址。但还是要提醒您,登录的新网址不会马上生效,所以在 Google 下次漫游前的那段时间里,可能无法通过 Google 访问您的网站。
我们建议您要求各网站更新当前指向您的旧网站的链接,使其指向您的新网站,而不要申请更改网址。另外,请不要忘记更改您在 Yahoo! 目录和其它网页目录中的记录。最后,如果您的旧网址使用 HTTP 301(永久)重定向指向您的新网站,Google 漫游时会自动获知新网址,并在六到八周内自动进行更新。
删除整个网站
要从 Google 目录中删除整个网站或部份网页的记录,可以在您服务器的根目录中放置一个 robots.txt 文件。
如果您不希望 Google 漫游器或其它搜索引擎进入您的网站,请在服务器的根目录中放入一个 robots.txt 文件,其内容如下:
User-Agent: *
Disallow: /
这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html。
删除个别网页:
如果只需要保护个别网页,可在那一页加入以下 HTML 代码:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
有关这个标准 meta 标签的详细信息,请访问:http://www.robotstxt.org/wc/exclusion.html#meta。
删除网页摘要:
网页摘要是结果页上的文字摘要,其中所有关键词均以粗体显示。选择网页之前,可以通过这些摘要浏览一下搜索词在网页中的上下文。大部份人都会先选择有合适网页摘要的网页。
如果您不希望 Google 提供您网页的摘要,请在网页中加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
请注意:删除网页摘要的同时也会删除网页快照。
删除网页快照:
Google 在网络上漫游时会保存大量文档中的文字。如果因保存网页的网络服务器出现临时故障而无法访问原始网页,最终用户还可以查看这些网页“快照”。这些网页快照是 Google 上次漫游时网页的内容。当您查看网页快照时,其顶部标题将提醒您这是快照,而不是实际网页。
如果您不希望任何漫游器保存您网页的快照,请将 meta 标签 NOARCHIVE 放入网页 HTML 代码的 <HEAD> 部份,如下所示:
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
请注意:此标签只删除“网页快照”链接,Google 仍会记录该网页,并显示网页摘要。
删除失效链接
Google 会定期自动更新整个网页目录。在网上漫游时,Google 会自动查找新的网页,删除失效的链接,并更新旧的链接。对于已经过时的链接,Google 极有可能在下次漫游时将其删除。
删除 Google 图像目录中的图像
我们不会随便删除 Google 图像目录中的图片,除非网主亲自要求我们这样做。您可以请网站管理员在服务器的根目录中放入一个 robots.txt 文件。(如果不行,可以将其放到您的目录中。)
示例:如果您的网站上有 www.yoursite.com/images/dogs.jpg,但您不希望 Google 收录 dogs.jpg 这张图片,您可以增加 www.yoursite.com/robots.txt 文件,其内容如下:
User-Agent: Googlebot-Image
Disallow: /images/dogs.jpg
如果要删除网站里所有图片的记录,请将包含以下内容的 robots.txt 文件放入服务器根目录:
User-Agent: *
Disallow: /
这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html。
请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您的网站管理员必须先创建一个 robots.txt 文件并将其放在您的网站中,这个自动程序才能工作。
只要您网络服务器的根目录中有这个 robots.txt 文件,Google 漫游器就不会进入您的网站。如果您无权访问服务器的根目录,也可以将 robots.txt 文件放在要拒绝漫游器进入的目录中。如果这样做或使用自动删除程序,Google 会暂时(90 天)从 Google目录中删除您的网站记录。(如果 robots.txt 文件不在根目录中,需要每隔 90 天再通过网址删除程序登记一次。) GOOGLE管理员工具 能具体点吗? 这是另外的方法。但个人认为使用管理员工具还是最好最简单的方法。 登录google 管理员工具,选择Optimization下的remove urls, 点击create a new removal request, 在弹出的框里输入 / ,代表删除全站的收录, 记得在robots.txt里屏蔽搜索引擎,具体就是robots.txt里光填这些:
User-Agent: *
Disallow: /
等几天就行了。
如果是中文的google管理员对照一下就知道了 感谢楼上诸君的热心答复:) 真的可以吗 在页面上添加noindex和nofollow标签 或数据库中删除 设置好网站的404 谷歌可自动更新
还有大家提到的谷歌站长工具remove url功能
最好的方法是做301转向,将旧网页转到新网页上,那样可以将旧网页的链接带到新网页上,不会浪费掉旧网页原来的链接。做了301转向后,Google很快会将旧网页删除,转而收录转向后的新网页。
如果不做转向,完全不管也是可以的,如果旧网页不存在,一段时间后,Google会自动删除这些旧网页。
也可以在Google管理员工具里主动删除这些不存在的网页。 新手学习了,感觉很有用,正好刚做了个垃圾站,正想试试
页:
[1]