建站思路探讨
我看到很多网上的PDF内容,谷歌没有收录,我想到两个思路:1,用爬虫爬各种PDF文档,建立个PDF下载站。
2,用爬虫爬各种PDF文档,然后用读取其中的内容,发布到WP。
这两个思路靠谱吗? 貌似内容应该是可读性强,同时“原创”了。
靠谱 好像有些内容PDF也收录的 扫描版本的是没有办法收录的 pdf的很多都收录的,现在的识图能力很强,除非那种质量很差的扫描件。 billy 发表于 2015-11-9 18:44
pdf的很多都收录的,现在的识图能力很强,除非那种质量很差的扫描件。
版主大人,我看到很多PDF内容还是没有收录的,比如付费下载的PDF教程什么的。
我拿到PDF后,读取其中的内容,Google一下是否收录了,如果没收录就发布出来。
如果建立一个这样的站点,不做任何外链,有机会获得流量吗? James_Liu 发表于 2015-11-10 09:29
版主大人,我看到很多PDF内容还是没有收录的,比如付费下载的PDF教程什么的。
我拿到PDF后,读取其中的 ...
内容数和流量关系不大,不是内容多就有流量。 想法很不错。 可以试试。 版权咋整
页:
[1]