|
发表于 2013-1-2 20:58:39
|
显示全部楼层
从Google 的目录中删除网页记录
来源: 作者:cnsho 2006-11-20 23:27 我来投稿 参与评论
Google 永远将品质放在第一位。因此,只有当网主提出取消网页记录的请求时,Google 才会删除这些网页的记录,以避免误删网页,保证搜索质量。
以下是各种不同的删除方式,通常需要六到八周的时间,即等到下一次 Google 漫游后才会生效。[admin5.com/google注:googlebot的漫游时间一般都不到六到八周,但其漫游后,robots.txt指定的文件,却不定一生效,基本要等到google dance后才能生效]
更改网址:
由于 Google 漫游器依网址来辨别网页,所以您不能自己更改目录里的网址。Google 下次漫游时都会自动更新这些网址。漫游器的行程是自动设定的,我们也没有办法让它提前到达您的网站。
如果您在 Google 漫游后更改了网址,您可以填写网页登录申请表,并按照下列说明删除旧网址。但还是要提醒您,登录的新网址不会马上生效,所以在 Google 下次漫游前的那段时间里,可能无法通过 Google 访问您的网站。
我们建议您要求各网站更新当前指向您的旧网站的链接,使其指向您的新网站,而不要申请更改网址。另外,请不要忘记更改您在 Yahoo! 目录和其它网页目录中的记录。最后,如果您的旧网址使用 HTTP 301(永久)重定向指向您的新网站,Google 漫游时会自动获知新网址,并在六到八周内自动进行更新。
删除整个网站
要从 Google 目录中删除整个网站或部份网页的记录,可以在您服务器的根目录中放置一个 robots.txt 文件。
如果您不希望 Google 漫游器或其它搜索引擎进入您的网站,请在服务器的根目录中放入一个 robots.txt 文件,其内容如下:
User-Agent: *
Disallow: /
这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html。
删除个别网页:
如果只需要保护个别网页,可在那一页加入以下 HTML 代码:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
有关这个标准 meta 标签的详细信息,请访问:http://www.robotstxt.org/wc/exclusion.html#meta。
删除网页摘要:
网页摘要是结果页上的文字摘要,其中所有关键词均以粗体显示。选择网页之前,可以通过这些摘要浏览一下搜索词在网页中的上下文。大部份人都会先选择有合适网页摘要的网页。
如果您不希望 Google 提供您网页的摘要,请在网页中加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
请注意:删除网页摘要的同时也会删除网页快照。
删除网页快照:
Google 在网络上漫游时会保存大量文档中的文字。如果因保存网页的网络服务器出现临时故障而无法访问原始网页,最终用户还可以查看这些网页“快照”。这些网页快照是 Google 上次漫游时网页的内容。当您查看网页快照时,其顶部标题将提醒您这是快照,而不是实际网页。
如果您不希望任何漫游器保存您网页的快照,请将 meta 标签 NOARCHIVE 放入网页 HTML 代码的 <HEAD> 部份,如下所示:
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
请注意:此标签只删除“网页快照”链接,Google 仍会记录该网页,并显示网页摘要。
删除失效链接
Google 会定期自动更新整个网页目录。在网上漫游时,Google 会自动查找新的网页,删除失效的链接,并更新旧的链接。对于已经过时的链接,Google 极有可能在下次漫游时将其删除。
删除 Google 图像目录中的图像
我们不会随便删除 Google 图像目录中的图片,除非网主亲自要求我们这样做。您可以请网站管理员在服务器的根目录中放入一个 robots.txt 文件。(如果不行,可以将其放到您的目录中。)
示例:如果您的网站上有 ,但您不希望 Google 收录 dogs.jpg 这张图片,您可以增加 www.yoursite.com/robots.txt 文件,其内容如下:
User-Agent: Googlebot-Image
Disallow: /images/dogs.jpg
如果要删除网站里所有图片的记录,请将包含以下内容的 robots.txt 文件放入服务器根目录:
User-Agent: *
Disallow: /
这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html。
请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您的网站管理员必须先创建一个 robots.txt 文件并将其放在您的网站中,这个自动程序才能工作。
只要您网络服务器的根目录中有这个 robots.txt 文件,Google 漫游器就不会进入您的网站。如果您无权访问服务器的根目录,也可以将 robots.txt 文件放在要拒绝漫游器进入的目录中。如果这样做或使用自动删除程序,Google 会暂时(90 天)从 Google目录中删除您的网站记录。(如果 robots.txt 文件不在根目录中,需要每隔 90 天再通过网址删除程序登记一次。) |
评分
-
查看全部评分
|