James_Liu 发表于 2015-11-9 15:30:29

建站思路探讨

我看到很多网上的PDF内容,谷歌没有收录,我想到两个思路:

1,用爬虫爬各种PDF文档,建立个PDF下载站。

2,用爬虫爬各种PDF文档,然后用读取其中的内容,发布到WP。

这两个思路靠谱吗? 貌似内容应该是可读性强,同时“原创”了。

凌尘 发表于 2015-11-9 16:41:22

靠谱                           

米客小D 发表于 2015-11-9 18:16:40

好像有些内容PDF也收录的

朝阳风雨 发表于 2015-11-9 18:25:54

扫描版本的是没有办法收录的

billy 发表于 2015-11-9 18:44:04

pdf的很多都收录的,现在的识图能力很强,除非那种质量很差的扫描件。

James_Liu 发表于 2015-11-10 09:29:38

billy 发表于 2015-11-9 18:44
pdf的很多都收录的,现在的识图能力很强,除非那种质量很差的扫描件。

版主大人,我看到很多PDF内容还是没有收录的,比如付费下载的PDF教程什么的。

我拿到PDF后,读取其中的内容,Google一下是否收录了,如果没收录就发布出来。

如果建立一个这样的站点,不做任何外链,有机会获得流量吗?

billy 发表于 2015-11-10 12:58:17

James_Liu 发表于 2015-11-10 09:29
版主大人,我看到很多PDF内容还是没有收录的,比如付费下载的PDF教程什么的。

我拿到PDF后,读取其中的 ...

内容数和流量关系不大,不是内容多就有流量。

moshou3044 发表于 2015-11-12 11:14:47

想法很不错。 可以试试。

哲啠喆嚞埑 发表于 2015-11-13 20:45:18

版权咋整
页: [1]
查看完整版本: 建站思路探讨