大洲 发表于 2013-5-19 08:48:27

思路,功能介绍及DEMO之2: 各种变身忽悠搜索引擎

本帖最后由 大洲 于 2013-5-20 05:12 编辑

本篇说怎么使用插件来做些简单处理:

一,使用同义词替换.

1,可以针对单站点设置插件


2,也可以针对一个组设置默认插件.在自动蔓延出新站的时候,会以组设置为模板自动应用.



中文同义词插件使用的是WORD等常见词库.可以自己编辑 词库文件.格式很简单.
英文使用TBS格式.同样也是可以自己编辑更新库.




开启后,平均增加处理时间15-50毫秒每个HTML. 对访问速度不会有影响.


二,使用Cleaner结合 同义词库插件,大变身.
这是一个清除所有除 标题/显式文本/链接之外所有内容的插件,包括CSS和IMAGE和JS等等.或者其它不包括文本的任何插件如IFRAME或空的DIV等.
做这个插件 想法,是想让他变的MOBI一些. 怎么更MOBI,后面会介绍其它插件补充.
这是一个可以设置自己的CSS和JS的插件.并且格式相对标准.
但可能会使部分网站完全不可读. 嗯嗯..还是那个自动蔓延做基础.量上了就好.


插件打开


注意:插件是可以调整执行顺序的. 正常情况下,cleaner插件如果要打开 ,优先在别的插件打开. 因为这样子可以减少后续插件工作时的数据处理量.

效果是这样子的:


对比一下 www.dazhou.net ,呵呵

三,使用关键词插件.

这个还没放出来.具体应用原理和教程,留给一位朋友来写.呵呵


补充一下DEMO站地址:

www.demo1.org   光扒,不做任何处理 .自动蔓延.
www.demo2.org   先扒,后中文同义词
www.demo3.org   先扒,后cleaner
www.demo4.org    先扒,后cleaner,再中文同义词

都只是今晚清空上线 . 搜索没收录. 效果怎么样不用太在意,因为公开出来的站点,就不灵光了.LOL~

只是DEMO而已.



新版没意外就快放出来.我先跑2天.
S表示站点编号
1T表示第一阶段时间: 检测请求,处理基础数据,并读取站点资料
2T表示更新统计和读库操作
3T读库操作
IN表示本地没有CACHE,从远程获取
HTML:FILE 表示程序对内容进行加工(包括插件工作)

时间单位:毫秒





Jack 发表于 2013-5-19 08:54:32

板凳休息

fy188 发表于 2013-5-19 09:07:35

坐等楼主更新

前世爱今生 发表于 2013-5-19 09:35:22

搬板凳学习

自由度 发表于 2013-5-19 09:38:27

等着更新

ChaseDream 发表于 2013-5-19 09:47:56

大洲这个程序最终价格大约是多少啊,不知道30%折扣后我还买不买得起。。
不方便回复的话可以pm我哈,thanks~

大洲 发表于 2013-5-19 10:54:52

ChaseDream 发表于 2013-5-19 09:47 static/image/common/back.gif
大洲这个程序最终价格大约是多少啊,不知道30%折扣后我还买不买得起。。
不方便回复的话可以pm我哈,thanks ...

还没定.建议先试用.
一个月,可以做很多事了.

sadffg 发表于 2013-5-19 11:35:04

大洲还是教一下程序的基础吧。从开始-编程-然后怎么转变成exe文件什么的,网上的都是程序,可是编程全套方法都不清楚

大洲 发表于 2013-5-19 11:49:31

sadffg 发表于 2013-5-19 11:35 static/image/common/back.gif
大洲还是教一下程序的基础吧。从开始-编程-然后怎么转变成exe文件什么的,网上的都是程序,可是编程全套方 ...

那个交点钱去参加牛耳啊北大青鸟什么的就可以了.

河小马 发表于 2013-5-20 05:49:44

wocao,

zhen xin NB!

nod32 发表于 2013-5-20 09:31:48

这贴不错,支持一下。

Atrus 发表于 2013-5-20 09:56:04

不知道比7ghost这类 有什么优势?

yljdbhf 发表于 2013-5-20 14:11:22

真的很牛逼!

dfzds 发表于 2013-5-21 17:30:03

不是一般的牛。

tyro 发表于 2013-5-22 19:57:16

www.demo4.org好像全是链接。糗%事百科还不错。
这个对于静态的网站如何,如hao123.com
页: [1] 2
查看完整版本: 思路,功能介绍及DEMO之2: 各种变身忽悠搜索引擎