Archive for the ‘网建岁月’ Category

IIS(Windows服务器)启用Rewrite 防盗链

星期六, 12月 29th, 2007

利用isapi_rewrite可以实现类似于Apache的伪静态路径,利用其检查refer的功能我们还可以实现防盗链。该软件可以在 http://www.helicontech.com/download/下载,是一个共享软件,但是有一个LITE版本是免费的,基本上可以实现我们需要的功能。安装的步骤我就不详细说了,具体说说httpd.ini的设置。
首先,必须要保证httpd.ini有可写权限,设置isapi_rewrite安装文件夹everyone具有可修改权限后,去除该文件的只读属性。
httpd.ini默认设置如下:
RewriteCond Host: (.+)
RewriteCond Referer: (?!http://\1.*).*
我们在它后面加上一句
RewriteRule .*\.(?:gif|jpg|png|exe|rar|zip) /block.gif [I,O]

即可实现gif/jpg/png/exe/rar/zip文件的防盗链,盗链页面显示的是/block.gif。block.gif是一个体积较少的图片文件,我们可以在上面打上自己网站的版权标志和防盗链声明。
如果按照上面设置,则除本站以外的所有网站均不能使用这里的图片,如果要允许一些例外的网站比如google,baidu以及其它一些非营利性网站引用该怎么办呢?我们可以用如下正则表达式来实现

RewriteCond Referer: (?!http://(?:www\.0e2\.net|www\.google\.com|www\.baidu\.com)).+
如果想允许所有google子站和baidu子站形如images.baidu.com,images.google.com等站则做如下设置:

RewriteCond Referer: (?!http://(?:*\.0e2\.net|*\.google\.com|*\.baidu\.com)).+
至此,一个相当有效的防盗链系统已经出来了,但如上设置有一个问题,如果浏览者浏览了盗链页面后访问本站页面,则被盗链图片的缓存会影响图片的正常显示。把
RewriteRule .*\.(?:gif|jpg|png|exe|rar|zip) /block.gif [I,O]

改为

RewriteRule .*\.(?:gif|jpg|png|exe|rar|zip) /block.gif [I,O,N]

方可。参数N的意思是重新从站点请求文件而不是从本地缓存读取。

做好SEO,保持上万的流量

星期一, 12月 24th, 2007

做好的网站,要是没有访问量,或者一天只有几个访客,实在让我们这些草根们很郁闷。常常有朋友问我如何最快提高网站的访问量,让短时间内流量突破上千上万。
其实短时间内提高流量并不难,也许去百度贴吧发发广告,流量就来了。只是几天后,流量可能又跌了。怎么稳定网站的访问量呢?实践证明,保持稳定流量最好的
办法就是做好网站搜索引擎优化,因为来自搜索引擎的流量,其实是最稳定的。当然,优化要掌握好一个度,千万不要作弊,否则被搜索引擎K了,那才真的郁闷。
(要让搜索引擎不K站的办法只有一个:保持低调)下面
和大家谈谈怎么最好基本的搜索引擎优化:
以下是优化一个网站需要考虑的核心所在,对初学者来说,做好这些足矣!

1、做好网站的Meta标记,这是搜索引擎优化的第一步。
 
对于搜索引擎来说,<META>标记中最重要的是关键词(keywords)和网页描述(description)(但是现在效果好像不太明显了),在HTML语言中形式如下:
<HEAD>
<TITLE>Title</TITLE>
<META Name=”keywords” Content=”网页描述”>
<META Name=”description” Content=”关键词”>
……
</HEAD>
 
需要注意的是,目前<META>标记只对Altavista和Infoseek这两个主要的搜索引擎在排名方面有重要作用。有的网页构建的<META>非常完美,但却发现自己的网站排在<META>标记品质很差的网站之后,也就是说,即使上述搜索引擎考虑<META>在排名方面的作用,但与其它因素比较并不是最重要的,许多的Web设计者认为<META>是推动他们的网站排名靠前的秘密武器错误的,但<META>标记确实对搜索引擎收录方面起到了重要作用。
 
应该在全部的网页中使用<META>标记,至少可以增加在<META>对排名起到作用的搜索引擎中的排名计分,并可告诉搜索引擎在结果列表中如何显示你的网页描述

在关键词(keywords)中键入该网页的关键词,关键词频率法则同样适用于<META>标记,要使文字尽可能简练,以便增加排名计分。

描述部分(description)提供了一个有效的方式来控制你网页的描述,能替代由搜索引擎自动产生的网页概述。
 
<META>注意事项:
不要重复同样的关键字超过6次,为了安全起见建议3次,否则搜索引擎会忽略你的网页或者得到惩罚。

不要罗列重复的相连的关键字,这很容易看出你在spam,比如,如果你有3个关键字,不应该如此排列:
search,search,search,engine, engine,engine,position,position,position

而应如此排列:
search,engine,position,search, engine,position,search,engine,position

限制你的<META>字符数,关键词(keywords)部分字符数不要超过200个字符(包括空格符),描述部分(description)不要超过150个字符(包括空格符),这是在所有搜索引擎显示全部文字最大的长度,否则,多余的字符将被砍掉。

在<META>元素的HTML代码中不应该有回车符。
  
另外值得一提是机器人元素(robots),它可以让你说明你的网站的某一页不被索引,形式如下:
<META Name=”robots” Content=”noindex”>

但并不是所有的搜索引擎都支持这个tag,它们共同支持一个功能更强的,叫做robots.txt的文本文件来达到上述功能。

2、域名的选取同样重要
 
  企业希望客户通过搜索引擎找到他们的网站,域名是影响搜索引擎排名的因素之一,但通常没有引起大家足够重视,以至于排名效果不理想,失去了不少商机,下面就域名在搜索引擎排名中的作用做以介绍。

拥有独立域名

最基本的,拥有独立域名对你来说是非常重要的,有的搜索引擎(如Clickey.com)仅显示具有独立域名的网页,以便给用户提供更具“价值”的搜索结果,著名的搜索引擎Excite亦是如此,在显示结果时对网站的首页给予特殊的“照顾”,据调查,大多数搜索引擎在排名计分时对那些不具独立域名的网站赋予较小的值。
同样,拥有国际域名(.com,.net等)也是十分重要的,在排名时有些搜索引擎对某些顶级域名(如.to,.cc)的态度不够友好。
  
域名对搜索引擎排名影响甚大

如果你的域名包含人们搜索你的产品或服务的关键词,则你的网页排在结果页的前十名的机会就会大大增加,当然如何确定关键词有许多“说道”,可参阅我们其他的资料。
其他域名注册事宜:

避免容易拼写错误的名字,如 one1.com,人们很容易认为是onel.com这里的“1”与“l”就极易发生混淆。
 
尽可能保护你的域名,如域名.com和.net,比如,http://www.com.nethttp://www.com.net
 
避免域名包含太多的词,除非用连接符分开。对于搜索引擎来说,像“currentstockquotes.com”这样的域名意味着排名机会减少,如果是“current-stock-quotes.com”,则能给你带来更多的好运。

不是说你不应该注册“currentstockquotes.com”,正相反,这两个域名你都应注册,一个方便用户,一个方便搜索引擎,想一想,现在国际域名年费用跌到七八十块,这七八十块也许能给你省下一笔不小的推广费用。

如果你注册了多个域名,不必为每个域名申请空间,可以与你的ISP联系,看看是否可提供域名指向,有些还是免费的,即使收费也不多。
  
不要灰心,你还有机会

还有大量的“好”域名没有被注册,即使已经注册了,也许1年或2年后也许你还可“失而复得”,我就有这样的经历,只要你想要的域名没有被使用,就可记下该域名什么时候失效,然后当域名快失效的时候,注意监视,也可利用技术来实现。
  
简单即美

尽可能让你的首页简单,这样可提高搜索引擎排名时的相关性。但这不符合正常网站设计规则,解决的办法是,针对搜索引擎单独设计一个首页。

3、网站Title,重要性尤其突出
 
<TITLE>应该出现在<HEAD>中,如下所示:
<HEAD>
<TITLE>Title</TITLE>
<META Name=”keywords” Content=”……”>
……
</HEAD>

在计算网页相关性时,多数搜索引擎对出现在<TITLE>中的关键词一个加重的“砝码”,特别是当关键词同时在<BODY>文本中出现时。所以,一定要在<TITLE>中包含该网页的关键词。
关键词频率法则同样适用于<TITLE>,要使<TITLE>的描述言简意赅,字符数限制在40个以内。
优化<TITLE>
对某些分类目录和搜索引擎来说,网页的排名是由<TITLE>中出现的第一个字母顺序决定的,对于这样的分类目录和搜索引擎,尽可能地选择在字母表中位置靠前的字母,并把以该字母开头的单词放在<TITLE>的第一个单词位置上,字母表如下:
! @ # % ^ & ( ) _ + 1 2 3 4 5 6 7 8 9 0 - = \ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z

4、网站URL对排名仍然重要
  
对于URL地址,应该是英文名称还是汉语拼音?

对于域名,应以企业的名字或名字缩写、注册商标的英语或汉语拼音来注册,同时考虑使用行业或商品变称为其域名(因域名管理机构不允许注册行业或商品名称)。对于根目录下的子目录名字应该用英语,而不是汉语拼音。如下所示,如果你公司的某部门经营汽车生意,应建一个子目录,名称为cars,而不是qiche。对于中国人来说,汉语拼音给不熟悉英语的读者提供了方便,但是对搜索引擎来说,使用汉语拼音可能要失去排名计分,对于象AltaVista、Excite这样的搜索引擎来说,其翻译系统是英语-汉语,不是汉语拼音-汉语。

这有一个小技巧:不管你有没有自己的独立域名,都应该规划一下URL地址,多数网页设计者为了让URL地址更“酷”些,使用了单词缩写等简短形式,而没有使用关键词作为目录或文件的名称,这样就失去了提高网页排名的机会。

举个例子
某网站的地图,其URL地址应为:
http://www.com.net/sitemap.htm
而不应是:
http://www.com.net/sm.htm
这将带来三大好处:
因为URL地址中包含关键词,增加了排名计分。
整个网站层次分明,便于网站维护。
便于浏览者阅读并点击,让人一看就知道在此目录下是有关网络营销的内容,给浏览者一个专业网站的印象,并促使其点击。

5、网站在搜索引擎中排名的影响因素–Body
 
<BODY>在HTML代码中的位置:
<HTML>
<HEAD>……</HEAD>
<BODY>……</BODY>
</HTML>

对于一篇特定主题的文章,其论点应明确,结构主次分明,这就是<H>标题的作用,<H1>标题对应文章主论点,并通过<H2>、<H3>标题展开论述,所以说,<H>是Web文档的框架,在其文本中一定要包含关键词。
另外有些时候,当你需要强调某部分字体时,不应通过改变字体大小或加黑等措施实现,而是利用<H>域来实现显示效果。

一般地讲,Web文档的论点应该在文章的开始处提出,然后展开论述,也就是说,文章的开头部分对整篇文章具有高度的概括性所以有的搜索引擎只对Web文档的开始部分建立索引。如:http://www.com.com。记住,尽可能在文章前面加入关键词,尤其是第一个<P>段。

Web文档中的连接<A>域中的文本也是很重要,搜索引擎认为链接指向的网页是与该网页相关联的,所以在这些链接中含有关键词有助于网页的排名。

某些搜索引擎对图像的<ALT>域和comment注释文本,在计算网页相关性时也给予“关注”。

有些网站的主页只提供一个漂亮的图片,但搜索引擎并不能阅读图片,虽然某些搜索引擎可以索引图像的<ALT>文本和Comment注释,但使用 HTML文本在任何情况下都是安全的。

6、选好关键字,这是网站优化的核心
 
位置频率法则
 
搜索引擎如何决定网页的相关性?有很多影响因素,其中最主要的就是网页中关键词出现的位置和频率,即位置频率法则。
  
网页中一部分文本对网页内容有很高的概括性,搜索引擎在计算网页排名时给这部分文本一个加重的“砝码”,包含:
1. <TITLE>中的文本
2. <META NAME=”KEYWORD”>中的文本
3. <METANAME=”DESCRIPTION”>中的文本
4. <H1>或<H2>等中的文本
5. <BODY>最前面自然段的部分文本
6. 网页链接<A>中的文本
7. 注释<!–insert comments here>中的文本
8. 图像<ALT>tags中的文本
9. 你的网站URL地址中的文本

频率是衡量搜索引擎网页相关性的另一个主要因素,搜索引擎将计算关键词在网页中(或某部分)出现的次数占该网页(或某部分)词汇总量的比率。频率较高,则网页相关性较高。
  
如何确定关键词
  
通过各种技巧查找到竞争对手,分析其网站,并查看他们使用什么样的关键词,作为自己设计网站的参考。您可以使用<登录奇兵>软件提取META标记功能或者<排名奇兵>软件提取各搜索引擎相关关键字排名第一位网站的META标记,用来参考。
  
根据客户群来制定战略关键词。如果你的网站经销生产资料,则应以行业常用词或专业术语来作为关键词;如果经销的是消费品,则应以人们在传统媒体上经常见到的词语作为关键词的首选。
  
相近词。比如你的网站销售电脑,你还可以利用“计算机”、“品牌机”、“兼容机”等作为网站关键词的补充,因为在各种媒体上这些词也很“流行”。
  
相关词。如果你的网站经销化妆品,你可以站在消费者的角度,不妨试一试“皮肤护理”、“美容”等词来扩展你的关键词。
  
把两个或三个词组成的词组作为关键词进行网页设计。比如,一家沈阳旅游公司,关键词应为“沈阳旅游”,而不仅仅是“旅游”,这样外地的游客就可通过键入“沈阳旅游”找到公司的网站。
  
层次
  
关键词要层次分明。比如,对于体育用品网站,经销足球、篮球、游泳衣等许多商品,规划网站时就不能仅仅用“体育用品”这个关键词,其它商品也应建立相应的网页,这样当用户键入“足球”进行搜索时,网站中的足球网页比其它网页更有机会排在前面。
  
关键词大小写
  
对于英文网页文档,某些搜索引擎是区分大小写的。也就是说,搜索search engine与Search Engine可能带来完全不同的结果,所以有的网页设计者就罗列了关键词的各种变形,比如:
search engine,Search Engine,SEARCH ENGINE等
  
但这有可能被搜索引擎认为是spam,该如何解决呢?最有效的办法就是使用小写形式(专有名词例外)。据有关统计结果显示,用户使用小写形式进行查询占总量的82%左右,所以说仅使用小写形式最多“损失”18%的访问量。

复数形式
  
对于英文网页,应给关键词加“s”,如果你使用searchengine作为关键词,当用户键入searchengines进行搜索时,那你的网站将永沉大海。
  
入乡随俗
  
随着国际贸易的扩大,公司有必要提供多语言的Web网站内容,这意味着,站点不仅面临语言翻译,还更面临这“文化翻译”的问题,所以选择关键词时一定要符合当地的语言习惯。另外,即使同一国家的同一种语言,由于地区差异,同一事物可能有不同的名字(即关键词)。

7、Frame(帧)的优化,其实也主要
 
大多数的搜索引擎不能“读懂”使用帧结构的网页,就象古老的浏览器,看不懂构建框架结构的说明网页,但可利用noframe tags来解决问题。

在noframetags中加入文本信息,告诉不支持帧结构的浏览器某些信息,更重要的是,要在其中加入引导搜索引擎继续访问网页的链接,以便搜索引擎索引全部网页。

注:noframe tags中的文本对支持帧结构的浏览器来说将被忽略。
记住,要给每个帧网页加上标题<TITLE>,尽管对于支持帧结构的浏览器标题将不出现,但对搜索引擎来说是最重要的的因素。
某些搜索引擎声称它们的Robot可以顺利通过具有帧结构的网站但是,关于此点还没有证据,即使可以做到这点。实际上,对帧结构网站缺点也是明显的,因为你只能有一个网址被搜索引擎列表。

favicon.ico不显示的解决方法

星期四, 12月 20th, 2007

为自己网站做了favicon.ico,却不显示

1、确认已添加 <link rel=”shortcut icon” href=”favicon.ico”>

2、IE清空缓存再刷新,傲游Maxthon则需删除安装目录下的Favicons再刷新
 

Discuz论坛SEO方案

星期三, 12月 19th, 2007

假设discuz已启用伪静态功能,使用5.0/5.5 GBK 版本;

1、meta,content 优化
2、内容页的网页复制问题
3、robots.txt使用及其它

更新
discuz5.5的robots.txt问题
DZ 禁止一个版面帖子的收录的补充

一、meta的优化

discuz的后台可以对meta信息进行设置,甚至可以添加自己的头部信息,但它的设置都是针对于所有页面的,全部页面都拥有相同的keywords和description是SEO所不赞成的。

方案一:删除meta

修改页头模板文件 templates/default/header.htm:将meta的keywords和description标签删除。

这两个标签作用很小了,而且还有discuz自带的一些无用信息,用得不好反而会有坏作用,因此宁缺勿滥。

方案二:定制meta

本部分实现了将内容页keywords设为帖子标题,description为内容前100字;也实现了主页与各版列表页meta的单独设置(不同版的不同,同一版各列表页相同)。

1.修改页头模板文件 templates\default\header.htm:将meta的keywords和description标签改为如下形式

<meta name=”keywords” content=”{$metakeywords}$seokeywords” />
<meta name=”description” content=”$seodescription” />
这里的$seokeywords、$seodescription就是后台设置的那个值,下面说怎么定制这个值;{$metakeywords}是奇虎的关键字,留下以后处理

2.内容页(viewthread)设置keywords为帖子标题,description为内容前100字

2.1修改 viewthread.php 文件:
在 include template(’viewthread’); (更新:dz5.5为iinclude template($iscircle ? ’supesite_viewthread’ : ‘viewthread’); ) 语句的上面加入一行:
require_once DISCUZ_ROOT.’./include/bmt.thread.inc.php’;

2.2创建 include/bmt.thread.inc.php 文件,内容为

<?php
if(!defined(’IN_DISCUZ’)) { exit(’Access Denied’); }

$seokeywords = strip_tags($thread[’subject’]); //关键字设为帖子的标题
//(已更新: nethome 提出问题,当启用主题分类并允许按类别浏览时,原来代码会有问题。所以加了标签过滤,本来在viewthread.php中改更好,为以后升级方便,还是放在这里吧,subject很短,不会影响效率)

$seodescription = current( $postlist );//description取文章内容的前100字
$seodescription = mb_substr( $seodescription[’message’],0,100,”gb2312″ );
$seodescription = htmlspecialchars( strip_tags($seodescription) );
?>
*此处数字和个别函数适用于GBK版本

最后一行作用是过滤内容中的html,否则在meta中会引起语法错误。先是去除HTML标签,但因为这里是前100字,有可能html标签已经被截断了,所以又用了htmlspecialchars转义一下,有可能会有些垃圾信息。
当然也可以在截取之前用strip_tags去除html标签,可能效率会差了。

*所以此处表达式您需要根据自己的情况修改。
我目前用的是preg_replace( ‘/[^\xa1-\xff]/’, ”, $seodescription ),即过滤汉字以外的所在内容,但这样会损失英文关键字。

别外说明,此处数据都是viewthread.php已取好的,所以不会产生额外的数据库操作,只是做了字符串处理,不会引响效率。

3.列表页(forumdisplay)设置不同的keywords和description

3.1修改 forumdisplay.php

文件,在 include template(’forumdisplay’); 语句上面添加
require_once DISCUZ_ROOT.’./include/bmt.forum.inc.php’;

3.2创建 include/bmt.forum.inc.php 文件,内容为

<?php
if(!defined(’IN_DISCUZ’)) { exit(’Access Denied’); }
$seokeywords = $forum[’name’];
$seodescription = $forum[’description’];

switch ( $forum[’fid’] ){
   case 1: //此数字为版的ID号,不同版设置不同的meta
       $seokeywords = ‘key1,key2,…’;
       $seodescription = ‘xxxx xxxx xxxx’;
       break;
   case 2:
       $seokeywords = ‘key1,key2,…’;
       $seodescription = ‘xxxx xxxx xxxx’;
       break;

}
?>
//更新:一般情况下可以不用switch和case,列表页的关键字为版名,说明为版的说明,若要对某个版设置特殊的关键字和说明,可以设置case。这样解决了版面很多时要设置很多case语句,加快了程序执行速度(不了解php,JAVA的 case进行了优化,执行很快)

使用修改文件来实现,每版的meta改起来不方便,感觉有些弱智,呵呵。但没有改数据库,用了两个单独的文件,修改了两个文件也很简单,这样升级或迁移更方便吧

case虽然多了一些,但比起读数据库的记录,速度应该快很多

4.主页meta
在后台设置即可。(如果2、3不做,则meta也同主页)

content的优化
discuz有个archiver,一是URL容易收录,二是页面比较干静,还有description会从正文中取内容,但archiver没有对内容中[b][url]之类的解析,那些标签起不到作用,原样显示还会增加垃圾信息。
本部分主要做两方面的优化,一是去除内容页的无用信息,二是给标题加上

<h1>

。加上伪静态和上篇meta的优化,效果就超过了archiver,因此可以在后台禁用它,还减少了复制网页。

实施方案

1.隐藏内容页(viewthread)中的无用信息:
修改内容页模板文件 templates/default/viewthread.htm:

用<!–{if $discuz_uid}–>   <!–{/if}–>将要隐藏的信息包含起来。

准确的说是当游客(bots)访问时,隐藏那些信息,当用户登录后是正常的,所以不影响使用。
这些信息主要指的是左侧用户信息栏、(资料 个人空间 主页 短消息 等等)、用户的签名(隐藏后不怕签名的内容影响正文,链接也不起作用了:P)
以住相关文章

2.为标题加上

<h1>

标签
修改内容页模板文件 templates/default/viewthread.htm:

将 <span class=”bold”>$post[subject]</span><br><br> 替换为
<h1>$post[subject]</h1>

定制“本帖最后由 XXX 于 xxxxxx 编辑”内容

修改文件 templates/default/misc.lang.php:将下面两行改成您喜欢的内容:

‘post_edit’ => ‘\n\n[[i]] 本帖最后由 $editor 于 $edittime 编辑 [/i]]’,
‘post_edit_regexp’ => ‘/\n{2}\[\[i\] 本帖最后由 .*? 于 .*? 编辑 \[\/i\]\]$/s’,
比如我改成 [ 网站名 URL xxx 于 xxxx 编辑]。改程序无聊时的自娱,呵呵
注意上下两个表达式要匹配。为了防止解析方括号是全角,不要复制后在文件中查找。

二、内容页的网页复制问题

看看内容页的URL大家就知道了:thread-(tid)-(page)-(forumdisplay page).html,可以看出最后一节表示的是此帖在列表页的第几页。所以,当您的帖子越来越多,这个帖就会由第一页到第二页…,它的URL就会不断的变化。其实打开一个列表页就可以看出来,第2页的帖子链接的最后数字都是2,第3页的都是3,只是很少注意它。我是在SE的收录中发现复制网页越来越多,才对最后的数字注意的。

解决方法
修改 forumdisplay.php 文件:

将 $extra = rawurlencode(”page=$page$forumdisplayadd”); 语句替换为
$extra = rawurlencode(”page=1$forumdisplayadd”);
语句中的page就是forumdisplay page,这样改后不管帖子在列表页的第几页,这个数都是1。

功能损失:当用户编辑帖子或版主管理帖子后,有个提示跳转页:选择转入列表页还是主题页,这时转入列表页的话,只能转到列表页第一页,而不管您原来停留在第几页。

redirect的301重定向

在discuz论坛中可以看到类似redirect.php?tid=xxx&goto=lastpost#lastpost这样的链接,它的功能是实现“最新发表、最后发表、上一主题、下一主题“功能,仅这一个功能就可以给同一个内容页造成四份复制网页,因此将这样的链接301永久重定向到帖子的静态地址。

解决方法
修改 redirect.php 文件:

将前两个 require_once DISCUZ_ROOT.’./viewthread.php’; 语句替换为
$bmt_url=’Location:/thread-’.$tid.’-’.$page.’-1.html’;
header(’HTTP/1.1 301 Moved Permanently’);
header( $bmt_url );
将后两个 require_once DISCUZ_ROOT.’./viewthread.php’; 语句替换为
$bmt_url=’Location:/thread-’.$tid.’-1-1.html’;
header(’HTTP/1.1 301 Moved Permanently’);
header( $bmt_url );
dz5.5的引用处也有个跳转,也可以做301:

将 dheader(”Location: viewthread.php?tid=$post[tid]&page=$page#pid$pid”);替换为
$bmt_url=’Location:/thread-’.$post[tid].’-’.$page.’-1.html#pid’.$pid;
header(’HTTP/1.1 301 Moved Permanently’);
header( $bmt_url );
***注意此处直接转到了静态地址,没有做判断是否开启伪静态功能,所以不开启会有问题

功能损失:转向到静态地址后,动态地址中类似#lastpost的锚点将无法起作用了,可能要手动滚屏了
???好像没有影响锚点

提示信息页的网页复制

这个问题和内容页也有着很大的关系,呵呵。如管理员设置允许游客浏览列表,而禁止浏览内容时,这些内容页都将返回一没有权限的提示信息页,但它们的URL 是不同的,这样就形成了严重的网页复制,此外还有其它形成的无权操作等。别一种提示信息如帖子不存在等,数量大了也会形成网页复制。这两种提示信息,都是通过showmessage函数分别调用nopermission.htm和showmessage.htm两个模板实现的。

解决方法
1.创建另一个头模板文件 templates/default/header_disbots.htm
内容同 header.htm 文件,但加入meta robot标签,如下

<meta name=”robots” content=”noindex,nofollow” />

2.分别修改 templates/default/nopermission.htm 和 templates/default/showmessage.htm 文件
将它们第一行的 {template header} 替换为 {template header_disbots}

虽然对meta robots标签支持的不是很广泛,但这是比较省事的方法
因为是提示信息页,用301来实现的话,还要传给转到的页好多信息,修改起来比较麻烦

三、robots.txt使用

User-agent: *

#禁止一个版面的收录
#如果有个水版,不想禁止游客权限,也不想SE收录,已免影响网站质量,可以用如下方法
Disallow: /forum-1-

#数字即为要禁止版块的ID。
#注意数字最后的 - 不要省略,否则连ID为11,12等1开头的版都禁了
[更新]补充方法:再给内容页加meta robot禁止

#再禁网页复制
Disallow: /viewthread.php
#这个是内容页的动态形式,前面对伪静态做了优化并修改了很多的复制网页,因此这里动态形式如打印页等一定要禁止

Disallow: /forumdisplay.php
#这个要慎重:列表页的动态形式,还包括精华、活动、投票等形式。我发现5.0的静态化不彻底,它的上一页下一页翻页仍是动态,这样如果禁止了,十页之后的内容就不能通这索引了。所以如果您站内的交差链接不丰富的话,不要在此禁止,以免影响收录。

hekaiyu说没有这个问题,去官方看了下5.5的确没问题(也许我的5.0本来没问题,也许官方在新版本中完善了正则表达式的替换规则),这样更好了,禁止它,又干净了好多

#禁止其它无用内容
Disallow: /profile
#用户信息,不知为什么discuz也静态化了,一律禁止
Disallow: /relatethread
Disallow: /post
Disallow: /blog
Disallow: /member
Disallow: /misc
Disallow: /faq
Disallow: /my
Disallow: /pm
Disallow: /digest
Disallow: /status
# … … 等等
# —– robots.txt end ——
[更新]dz5.5的robots.txt后部分给出的Disallow: post.php等是不合规范的,一定要在前面加上”/”。>>详细说明

首页URL问题

后台基本设置->首页文件名如果不设置,会默认为index.php。所以站内到首页的链接为形式为http: //domain/index.php。而我们一般引用论坛首页或交换链接的形式一般是http://domain/。实际是一样的,但SE可认为是两个 URL,而且一个拥有很多的内部链接,一个拥有较多的外部链接,所以哪个被降级都不是好事情,最好统一起来。这里的修改目标是http: //domain/的形式。

1.进入后台,基本设置->首面文件名 设置为: /
2.修改文件 member.php 将 header(”Location: {$boardurl}”.$indexname); 替换为

if( $indexname==’/'){
   header(”Location: {$boardurl}”);
}else{
   header(”Location: {$boardurl}”.$indexname);
}
[更新]dz5.5为dheader

此修改处的功能是清除cookies后返回到首页,如不修改域名后就有两个/。暂时未发现使用/当首页文件名的其它问题

结 束

除了文件的修改,有些地方要配合后台设置,前面都提到了,这里总结一下。主要有:1.URL静态化,只启用普通页面静态化就可以了;2.不要启用 Archiver功能;3.后台的keywords和description设置只是针对首页的(如果您没做列表页和内容页的meta修改则也应用到它们);4.后台首页文件名为/(当然您也可以设置自己特定的)

推荐软件下载 www.xiazai.in

星期二, 11月 27th, 2007

网站名:下载.IN
网   址:http://www.xiazai.in/

被强奸的搜索引擎 vs Google对付桥页作弊的方法

星期一, 08月 27th, 2007

前言:
Zac
提起Google在他的搜索排名算法里面正在加入更多的用户行为方式,我完全同意该观点。认识与研究Google很久了,对Google的搜索行为有一个基本认识:Google的排名算法不会局限于任何一种因素,不会忽略任何一种因素,尤其重视自然因素。
很多人会笑话这样的认识,认为是空谈,然后,我作为一名开发人员,完全认为采用如此的策略是明智的。

引入更多用户行为方式的基石在于Google ToolBar,这是Google最近花大金钱捆绑在Dell机器上的玩意儿。它能做什么? 能统计用户的查看网页的行为。

什么是桥页? 桥页如何作弊?
桥页就是在第三方网站上做一个页,堆砌了大量的关键词,让该页在搜索引擎收录里排在前边,如第一页,然后,在桥页中注入转向代码,用户来到该页,实际上却去了另外一页。这里,第三方网站一般是一些BLOG,这些BLOG允许一些转向HTML代码及Javascript代码,包括blog.donews.com。

搜索引擎的无奈:

百度主要依靠人工防作弊,在自动封站上不如Google。但在上边的作弊方法中,百度人工也不敢封第三方网站,如blog.donews.com,因为它是无辜的。百度也不敢人工封目标网站,因为它也可能是无辜的。(有人恶意栽赃,不是它要的)
这种作弊在百度里非常泛滥,但在Google中却几乎绝种。
http://www.baidu.com/s?ie=gb2312&bs=%CF%E0%C9%F9%D4%DA%CF%DF%B2%A5%B7%C5&sr=&z=&cl=3&f=8&wd=%C1%F5%B5%C2%BB%AA%CF%E0%C6%AC&ct=0
排名第一的: http://qoito.blogbus.com/files/1142761371.htm
被导向到: http://mms.zzling.com/?

这意味着,异常热门的关键字,很多都被桥页占满了。换句话,百度在被强奸。

Google是如何对付的呢?
能够想象的有两种方法:
方法一:分析网页中的转向代码,遇见可疑的转向代码,降低权重。
方法二:利用分析用户的行为,对于停留不超过N毫秒的页,降低权重。

方法一的可行性是有的,但不能完全解决问题。原因在于Google现在并不分析嵌入的JS,对JS本身也不重视。作弊高手可以写复杂的转向代码来欺骗Google。

我所能相信的有效方法应该是方法二:
分析用户的行为,对于停留不超过N毫秒的页,做spam标识。

能想象到的更完善的算法可以是:
如果A页是来自于搜索引擎,下边的算法启动:
如果A页被A用户浏览且不超过N毫秒,然后马上导向到B页。则标识
A–>B为 桥页spam。
如果被标识次数大于N,N可以是3,且来自于不同的IP,就可以降低A页的权重了,但不应该去动B页。

这里,降低而不是封杀是安全且可靠的,基于以下考虑:
1) 竞争对手恶意利用,来封杀对手。
2) A页有人浏览,但每次被用户马上忽略,则应该为不重要的垃圾页。
3) B页不能封杀是因为B页可能是无辜的。
前边说过,这方法的基石在于,Google Toolbar,用它来统计用户的自然行为。
百度同样有Baidu Toolbar,由于上边的算法并不需要基于海量的数据统计即可有效,因此,即使基于baidu toolbar当前的安装量,也是可以进行的。

另外,Google Analytis等产品,也是用户数据来源。

谈谈刷关键词的技巧

星期日, 08月 5th, 2007

所谓刷流量,就是刷某一关键词.也就是通过广泛的反链接,形成搜索引擎的青睐
主要方法有:
1,百度知道
2,大的论坛签名
3,论坛群发
关键是会综合运用。

论坛群发,是一种极速的群发方式,里面有一些特别技巧:
作为版主,他们一方面喜欢朋友(会员)的捧场。另方面,他们也极度地讨厌无意义或与论坛主题或论坛版块不相关联的主题。
第一,精选一些好贴。所谓好贴,指的是那些有内容,同时受大家普遍欢迎的贴子,比如情感类,两性类或幽默类。

第二,一般群发软件都支持DISCUZ语言,那么,你可以在一些标点处,或经典语言处加上中文显示的链接代码。所加处,切莫范围很大,只在一些经典词语中。或夹杂一少许你的关键词。别以为你很聪明,版主见多了,你的目的他一眼都能识别。只是让他明白,你的文章是优秀的,你是在帮他,他舍不得删了你的贴。 如果采用群删群封,他也会损失, 这样,你的贴就保留住了。所以一定要掌握这个尺度。

第三,还有一种方式,就是采用二段贴,也就是每一贴中,完全不放任何广告内容,然后在第二天的发贴中,将含有隐性链接的贴子发出。
同一主题,后一贴只是前一贴的延续。因为前一贴保留着,第二个贴也自然能最大限度的保留。 到底有多少人通过这些贴能进入你的网站,直接带来流量,这不重要。重要的是你会形成大面积的反链接。有了广泛的反链接,在搜索引擎中你的排名就会自然提升。有了搜索引擎的前部排名,就会有流量。
这一切,是以有论坛群发软件为前提 。

新浪博客,一个自动有流量的地方

星期三, 07月 11th, 2007

昨天晚上,看了一个新浪的博客,一看竟然是熟人的,没想到他竟然排在首页,急忙的联系了一下,交换了一下看法,竟然得出了平时我们自己多忽略的市场。
他说,新浪博客要比自己开网站得到的支持者要多,因为新浪博客的某个特定的圈子里的博客,都是同行或者是这个行业的从业者在浏览,还有就是只要有好的文章,肯定能够成为这个圈子里的最优秀的博客,不要去考虑那些娱乐方面的,那些都是炒作自己的泡末,没多大意思,多写一些行业性的内容的文章,成名不是难事。
整个流程就是:
1,开博客
2,加入圈子
3,每天坚持更新多篇文章(一般的博客,一天更新一篇算是高频了)
4,在文章里适当的加上自己的产品广告。
5,肯定要比单独开一个网站发展的还要快,因为这是一个聚集人气的过程,结交朋友的过程。
————————————————————
在新浪博客上,文章质量,决定人的人气。

如何利用百度的空间带来流量

星期四, 06月 28th, 2007

具体操作很简单:

    第一步:注册百度用户。记得用户名要用你要做的关键字或者是你的网站名(用户名最好是汉字)。  

    第二步:开通百度空间。空间名就用你前面注册的用户名(原因:百度空间文章标题命名规则:文章名_空间名)。模版要稍微改一下,去掉像相册留言之类的,可以添加一些自定义模版,内容可以是宣传你的网站或是网站的关键字。

    第三步:添加文章。从你的网站中选取比较热门的高质量的文章发到空间。然后在文章来源处把你的网站连接加上。
    最后要做的就是定时从你的网站选取优质文章发到你的空间。

网站流量的分类

星期四, 03月 15th, 2007

我们刚才说了流量就是到一个站的人数,就是流量。
一,按照流量的目的性,分为:
1,随意流量。
随意流量就是被迫性或者被诱惑到了一个站上去了,而站上的内容不是自己想要的或者是自己主动要看的。
例如,弹窗流量。
自己不想看,但是他就弹出来了。
例如,挂QQ来的流量。
自己以为是有美女,结果是创业类的站,这种就是不是自己想看的内容。
这种流量的质量一般都不会很高,都是仅仅叫流量而已,质量一般。
2,定向流量。
不是随意流量的,那么肯定就是定向流量。
什么是定向流量呢?就是这个人看了广告以后,就是准备到你的站上去的。
网站上的固定流量,就是定向流量,他们每天打开站就是为了看你的站上的内容,所以这是一种固定的流量。
在竞价上做的广告,这种也是定向流量,大家是看了你的广告,想消费你的产品才走到你的站上的。
全民皆赚的流量, 也是定向流量,包括在一些站上做的横幅广告或者文字广告,也属于定向流量。
二,按照流量来源分为:
1,宣传的流量。
这种流量就是个人的流量能力了,就是能够对一个没有任何流量的网站进行流量宣传,
例如挂QQ,全民皆赚,木马,插件。。。
就是说靠的外界的免费的力量来获得的流量,这种都是宣传来的流量。
2,购买的流量。
假如我没有任何流量技巧,但是我有钱,那么我就可以花钱买流量,
我可以买定向流量, 也可以买不是定向的流量,可以买高质量的流量, 也可以买低质量的流量。
3,自然流量。
这种流量就是每天都固定的流量,例如我们去新浪, 因为我们知道新浪的网址,我们就是新浪的自然流量。
流量的三种类型, 基本上代表了网络发展的三境界:
第一阶段的人往往都喜欢自己宣传。
第二阶段的人往往喜欢买流量。
第三阶段的站基本上都是靠自然流量。