无原创不做站 从垃圾站的倒掉说起

今日电商 转载大师 4383 4

  金秋十月,是收获的季节,不过一些做垃圾站的站长收获的不是排名和pr,而是无情的被K,从这次百度算法的调整可以看出,百度对于收录的标准更加的倾向于谷歌,那就是,内容的原创性检验更加严格了,一些采集的甚至是伪原创的文章,往往也会被摒弃,对于花心血用原创文章来充实自己网站的站长来说,这无疑是一个好消息。

  是的,原创一篇文章往往需要的间很长,也许冥思苦想一个小时,也写不出来一篇像样的,而使用采集呢,采集一个小时,如果你的匹配规则写得够精准,可能已经有两千篇文章躺在你的数据库里了。而一些站长为了节省时间,就会选择采集,其实,这些站长不知道的是,选择了采集,就是种下了恶果,往往会短时间内开出艳丽的花朵,但是等到了收获的季节,只有原创,才会结出丰硕的果实,“乃有青松翠柏,虽死尤生,重于泰山,浩气长存!有的是国杰豪英,人杰地灵,干将莫邪,千锤百炼,拂钟无声,销铁如泥!”用这首诗来形容原创文章再合适不过了,就算你花一天的时间来原创一篇文章,那也是值得的!你要相信,只有经过千锤百炼,才有可能成功,干将莫邪炼剑如此,我们做站也应该是如此。

  说了这许多,有的人问了,我花很多时间原创的文章,被别人采集了,我的站权重太低,采集我的那个站权重高,百度先收录了采集站的,那我这不是做了无用功么。这个其实不用担心,有方法让别人采集不了你的站,网上也提供了一些方法防止采集,像什么使用随机模板,安装防采集插件什么的,其实,这些方法只能对付一些低等级的采集者,一旦你碰上了写正则表达式的高手,那么这些方法将会是浮云,该被采还是被采,下面我分享一个方法来做到百分之百不会被采集,任你的正则表达式使用的出神入化,也拿我的站没辙。

  这个方法就是进行网址加密,我们知道,正则表达式会匹配你列表页的超链接,然后通过超链接地址来获取你文章页的内容,而一旦你把列表页的超链接进行加密,这样就从源头掐断了采集者的路。加密函数如下:

  function uc_authcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {

  $ckey_length = 4; //note 随机密钥长度 取值 0-32;

  //note 加入随机密钥,可以令密文无任何规律,即便是原文和密钥完全相同,加密结果也会每次不同,增大破解难度。

  //note 取值越大,密文变动规律越大,密文变化 = 16 的 $ckey_length 次方

  //note 当此值为 0 时,则不产生随机密钥

  $key = md5($key);

  $keya = md5(substr($key, 0, 16));

  $keyb = md5(substr($key, 16, 16));

  $keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';

  $cryptkey = $keya.md5($keya.$keyc);

  $key_length = strlen($cryptkey);

  $string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;

  $string_length = strlen($string);

  $result = '';

  $box = range(0, 255);

  $rndkey = array();

  for($i = 0; $i <= 255; $i++) {

  $rndkey[$i] = ord($cryptkey[$i % $key_length]);

  }

  for($j = $i = 0; $i < 256; $i++) {

  $j = ($j + $box[$i] + $rndkey[$i]) % 256;

  $tmp = $box[$i];

  $box[$i] = $box[$j];

  $box[$j] = $tmp;

  }

  for($a = $j = $i = 0; $i < $string_length; $i++) {

  $a = ($a + 1) % 256;

  $j = ($j + $box[$a]) % 256;

  $tmp = $box[$a];

  $box[$a] = $box[$j];

  $box[$j] = $tmp;

  $result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256]));

  }

  if($operation == 'DECODE') {

  if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {

  return substr($result, 26);

  } else {

  return '';

  }

  } else {

  return $keyc.str_replace('=', '', base64_encode($result));

  }

  }

  此函数会随机把地址加密成无序的字符串,而且每次都是不一样的,这样就无规律可言,也就无法用正则进行匹配

  用法:如果你的列表页网址是$str=”http://mx.i0311.com/list/1.html”,那么在php文件里,对变量进行加密$url = uc_authcode($url 'DECODE', '#$123');第三个参数是加入加密串而加大破解的难度,这样,在你的模板上的网址就是加过密的了,而当你要读取数据库的时候可以用uc_authcode($url 'ENCODE', '#$123');来进行解密,这样在php文件在进行读库操作的时候,就不会是加过密的地址,如此一来,就彻底解决了原创文章被采集的问题。

标签: 互联网 石家庄SEO 网络推广 网络营销

发布评论 4条评论)

评论列表

2010-10-06 22:51:27

做垃圾站现在没有一点前途!

2010-10-07 16:14:30

王道还是本地行业门户!

2010-10-10 06:29:36

最头疼代码了

2010-10-11 19:50:35

@于召霞 呵呵 习惯了就好!

2010-10-12 20:53:49

垃圾站的时代过去了。。。。

2010-10-12 23:48:59

@手表品牌排名 还有人在做啊!

2010-10-11 19:50:35

@于召霞 呵呵 习惯了就好!

2010-10-12 23:48:59

@手表品牌排名 还有人在做啊!