解密.htm.html.shtm.shtml的区别与联系(转帖)

转自:(http://tech.sina.com.cn/s/2006-04-24/1654915865.shtml)

今天,在做JAVA学习日记的首页静态化过程中想到一个问题,静态文件的后缀名用.htm还是用.html呢?它们有什么区别吗?是不是像图像文件后缀名:.jpg和.jpeg一样呢?

下面是一篇转帖正文。

*************************************************************************

                                           

                          解密.htm.html.shtm.shtml的区别与联系

    ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

                 http://www.sina.com.cn 2006年04月24日 16:54 天极yesky

      作者:猴年马月

      每一个网页或者说是web页都有其固定的后缀名,不同的后缀名对应着不同的文件格式

    和不同的规则、协议、用法,最常见的web页的后缀名是.html和.htm,但这只是web页最基

    本的两种文件格式,今天我们来介绍一下web页的其它一些文件格式。

   

    [adfshow]

    [xfrd_01]                                          ●

      首先介绍一下html与htm

      关于HTML,HTML(HyperTextMark-upLanguage)即超文本标记语言,是WWW的描述语言。

    设计HTML语言的目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或

    图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在

    网络的其它电脑上。我们只需使用鼠标在某一文档中点取一个图标,Internet就会马上转

    到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。 HTML文本是由

    HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等

    。HTML的结构包括头部(Head)、主体(Body)两大部分,其中头部描述浏览器所需的信息,

    而主体则包含所要说明的具体内容。

      关于HTM,实际上HTM与HTML没有本质意义的区别,只是为了满足DOS仅能识别8+3的文

    件名而已,因为一些老的系统(win32)不能识别四位文件名,所以某些网页服务器要求

    index.html最后一个l不能省略。MSIE能自动识别和打开这些文件,但编写网页地址的时候

    必须是完全对应的,也就是说index.htm和index.html是两个不同的文件,对应着不同的地

    址。值得一提的是UNIX系统中对大小写敏感,不吻合的话就可能报没有文件或者找不到文

    件。

      其次介绍一下shtml和shtm

      关于shtml,shtml是一种基于SSI技术的文件,也就是Server Side Include--SSI 服

    务器端包含指令,一些Web Server如果有SSI功能的话就会对shtml文件特殊招待,服务器

    会先扫一次shtml文件看没有特殊的SSI指令存在,如果有的话就按Web Server设定规则解

    释SSI指令,解释完后跟一般html一起调去客户端。

      关于shtm,shtm与shtml的关系和htm与html的关系大致相似,这里就不多说了。

      html或htm与shtml或shtm的关系是什么

      html或者htm是一种静态的页面格式,也就是说不需要服务器解析其中的脚本,或者说

    里面没有服务器端执行的脚本,而shtml或者shtm由于它基于SSI技术,当有服务器端可执

    行脚本时被当作一种动态编程语言来看待,就如asp、jsp或者php一样。当shtml或者shtm

    中不包含服务器端可执行脚本时其作用和html或者htm是一样的。

********************************************************************************

                                      转帖完毕

跳来跳去的adsense广告和在文章中广告文字绕排

  网站需要运行,google广告是一个途径,我认为不应绝对的排斥广告

  前一段时间我发现广告的点击率由1~1.5%下降为0.5~0.8%,就想是不是一成不变的广告对朋友已经失去吸引力,于是用代码让广告随机的变位置和种类。结果经过3天的试验效果,点击率更是下降到了0.1%。

  看来,还是固定位置的广告要好点呀。聊胜于无吧。

  现在的广告形式是页面头尾是大横幅,文章开头绕排一个200×200的正方形广告。

  另外,我申请了google广告的自定义渠道报告分析,从今天的效果来看,还是菜单顶部的效果好于中部和底部。

  可见,网页广告成功的要素还是醒目为主,那种像我那样不断变种类和位置的跳来跳去的广告是不行的。

附:一、jsp页面的元素随机跳动代码

 下面附上我的jsp页面的元素随机跳动代码,使用的是Struts+JSTL+JSP。很简单:

  1、随机数发生器:


package com.learndiary.website.util;

import java.util.Random;

import com.learndiary.website.Constants;

/**

 * generate random int between 0 (inclusive) and the specified value: Constants.MAX_RANDOM (exclusive),

 */

public class Randomer {

  private int i;

  public int getI() {

    return new Random().nextInt(Constants.MAX_RANDOM);

  }

}

  2、在用户进入页面后在session中保留一个 Randomer的对象。

  3、在页面和JSTL调用事先在google帐户中复制下来的代码:


 <c:set var="j" value="2"/>

 <c:set var="k" value="5"/>

 

 

 <c:if test="false">

  <div align="left">

 </c:if>

 <c:if test="false">

  <div align="center">

 </c:if>

 <c:if test="false">

  <div align="right">

 </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/234.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/468.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/728.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/link_728.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/ref_firefox.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/ref_firefox_en.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/ref_pic.jsp" %>

  </c:if>

 

  <c:if test="false">

  <%@ include file="/guanggao/ref_pic_en.jsp" %>

  </c:if>

 

 </div>

  总觉得这样写可以让页面简洁一点,也许效率比直接写在jsp页面的要差一点?不知道。

 二、google adsense被文字绕排的效果 (相关代码来自google上的论坛,好像是:http://groups.google.com/group/adsense-help-zhs,具体位置忘了)

1、

 


     <table cellSpacing=0 cellPadding=10 align=left border=0>

      <tr>

       <td style="border-style: dotted; border-width: 0">

        <%@ include file="/guanggao/200_200.jsp" %>

       </td>

      </tr>

     </table>

     <p style="text-indent: 3">

     <bean:write name="aGoal" property="articleText" scope="request" filter="false"/><!--文章内容-->

 

但是我发现google广告在文章头部的加载时间太长严重影响了文章的显示,于是,根据原来学到的让del.icio.us不影响页面的加载(转帖),改进了代码如下:

内容部分:


     <font face="Ms Song"><font face="宋体">

     <table cellSpacing=0 cellPadding=10 align=left border=0>

      <tr>

       <td style="border-style: dotted; border-width: 0">

        <div id="daily_loading">loading...</div>

        <div id="daily_show" style="display:none;"></div>

       </td>

      </tr>

     </table>

     <p style="text-indent: 3">

     <bean:write name="aGoal" property="articleText" scope="request" filter="false"/><!--文章内容-->

     </font></font>

在</body>和</html>之间的部分:

<script type="text/javascript">

 

   function daily() {

 

       document.getElementById("daily_loading").style.display = 'none';

       document.getElementById("daily_loaded").style.display = 'none';

       document.getElementById("daily_show").innerHTML=document.getElementById("daily_loaded").innerHTML;

       document.getElementById("daily_show").style.display = 'block';    

   };

 

   window.onload = daily;

 

</script>

<div id="daily_loaded" style="display:none">

<%@ include file="/guanggao/200_200.jsp" %>

</div>

以上代码供对有同样需求的朋友参考,热切的希望您的任何意见和建议,谢谢。

隐藏网页中的文字和使用锚点

这是在看准备用英文版的Thinking in Patterns学习设计模式时的一点意外收获:)

我发现在文本浏览器w3m中看这本书的目录时里面有数字,而在图形界面的浏览器中看则没有(详见:Outline of Thinking in Patterns with Java)。于是,我查看了网页的源码,发现原来使用了隐藏文字的技术(这个技术是什么名字我也叫不上,反正是这个效果)。从其中我知道隐藏文字可以用:


          <span style='color:windowtext;display:none;text-decoration:none'>

            .

          </span>

链接到锚点可以这样:


<a href="#_Toc41169680">

...

</a>

全部实验代码如下:

1)、隐藏文字:


<html>

  <head>

    <title>

      Test hiding some text in page

    </title>

  </head>

  <body>

    <p class=MsoToc2>

      <span class=MsoHyperlink>

        <a href="#_Toc41169680">

          The Y2K syndrome

          <span style='color:windowtext;display:none;text-decoration:none'>

            .

          </span>

          <span style='color:windowtext;display:none;text-decoration:none'>

            11

          </span>

        </a>

      </span>

    </p>

  </body>

</html>

2)、显示文字:


<html>

  <head>

    <title>

      Test displaying some text in page

    </title>

  </head>

  <body>

    <p class=MsoToc2>

      <span class=MsoHyperlink>

        <a href="#_Toc41169680">

          The Y2K syndrome

          <span style='color:windowtext;text-decoration:none'>

            .

          </span>

          <span style='color:windowtext;text-decoration:none'>

            11

          </span>

        </a>

      </span>

    </p>

  </body>

</html>

附网上摘的一段使用锚点的段落:(摘自:http://www.sdau.edu.cn/support/html/html_cn.htm


连结 <A HREF="URL"></A>

连结到锚点

<A HREF="URL#***"></A>(如果锚点在另一个档案)

<A HREF="#***"></A>  (如果锚点目前的档案)

N2.0 连结到目的视框 <A HREF="URL" TARGET="***"></A>

设定锚点 <A NAME="***"></A>

个人网站,不要流量也一样赚钱!(转帖)

转自:http://www.cn-pn.com/article/1/60.html

网站需要策略和运作,任何网站都是。下面这篇文章可以作为大家做任何网站的一点参考。

正文:

××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××

个人网站,不要流量也一样赚钱!

编辑:flymorn 来源:eczn.com 更新:2006-10-31 20:58:36 点击:

【字体:小 大】

摘要:个人网站,不要流量也一样赚钱!个人站长最擅长拉流量的方式就不外乎QQ广告群发。论坛发贴,砸钱,这些都手段却是能起到一定的作用,但是需要投入大量的人力和财力。

关键字:网站 流量 网赚

正文:

在写这个标题的时候。很多人点击进来看是觉得很好奇。个人站没流量拿什么赚钱,这似乎不可能,现在我来告诉你,这是完全可以的。很多站长认为。网站要赚钱,先从流量开始。其实这是一个误区,作网站要赚钱不是先从流量开始。而是先从品牌开始。

个人站长最擅长拉流量的方式就不外乎QQ广告群发。论坛发贴,砸钱,这些都手段却是能起到一定的作用,但是需要投入大量的人力和财力。

最近在DONEWS.“庞”出现的频率甚多,而其自创的BLOG招聘也打出中国第一。每每公司有新人进来之时也要在BLOG上大赞,而最吸引人的眼球是 “加入我们,3年,您有望成为千万富翁 ”,使得庞的QQ人满为患,“世外桃源,高薪水,高待遇,老板的传奇经历”,无不吸引着每个人的眼球。庞是个极其敏锐,极富洞悉力的新新人类,而他的得力干将屠则是擅长网络营销的高手,加之其在BLOG里自暴喜欢研究周易。而在中国很少有听说搞IT的还擅长周易相学。

细心的人可以发现,这是一种品牌营销的战略,2004年火了的刀郎,庞龙,在不闻其人先闻其声的策略下,歌曲在网络上迅速窜红,他们卖的是关子,不论是批评还是赞扬,他们却是火了一把,顺便那个假“刀朗”称火打劫一把,也来凑个热闹。这些迅速走红的歌手从一开始的闻其声不见其人,到最后的频繁在媒体露面,接受采访,办演唱会,张扬,绯闻,炒作,与之前的低调作风格格不入,可见其营销策略。

大家经常说,无论是黑猫白猫,只要能抓耗子就是好猫,谁都想兜里的钞票揣得鼓鼓的,所以只要在不违反国家法律法规的前提下,这些手段都是可以用的,

不论是传统行业还是新兴的IT网络,我们都要重视品牌的营销。学会如何推销自己,用最少的成本获得最大的回报。

9FLASH的杨涛 一篇“9flash的流量是怎样练成的”文章,被众多站长拜读,不但营销了自己的9FLASH品牌。而且还增加了网站的流量。他所写的东西正是我们站长喜欢的。杨涛是个绝对聪明的人,他很早就注重自己网站品牌的营销,当初给自己的网站定了口号,打出“爱你就象老鼠爱大米”,他把他的心得写了出来。得到了大家的认可,在读者的心里有了烙印。他的品牌自然会提升。而他的文章也在各大媒体转载,包括新浪(http: //tech.sina.com.cn/i/2005-03-23/1729559535.shtml),否则一个个人站长怎能拿到某日本的华资企业数百万元的投资。

收购的公司看重的是9FLASH 的品牌,所以网站的价值品牌排在第一位,而内容则是在品牌之后的次重点。

那么,网络营销到底能起到什么的效果那,他们能解决你所遇到的哪些问题呢?我看他可以解决你的流量问题,增加网站知名度,给你带来很高的现金收入。

好123不外乎个人站长的顶峰之作,很多人认为李兴平是个善于营销的搞人。我不这么认为,他的成功是有偶然性,不可复制性的。我不否认他的成功,但是就品牌营销上他绝对是个弱者,李做网站N 年,其好123的盈利模式一直很单一,而李的性格内向,拒绝一切外来的合作者,而其在265组织的厦门站长大会上却是他这么多年第一次走出广东省,实在令人汗颜。而好123的价格网络上一直有传被千万收购,其实从李在厦门站长大会上的一番话。圈里人也都明白了百度拣了个大便宜,实在佩服李彦宏见缝就插的能力。

好123其实有更深的价值去挖掘,百度收购好123不是平白无故的,正是利用他在个人站长中的品牌优势,对百度产品进行更深层次的推广,而好123无疑是个很好的平台。

                         --转帖完毕

SEO在网站运营中的位置(转帖)

转自:(http://www.chinamyhosting.com/seoblog/2006/11/09/seo-position/

 

SEO在网站运营中的位置 2006年11月9日

谈了这么多SEO,有可能让人误解搜索引擎优化在网站运营中占很大一部分,其实搜索引擎优化只是网站运营食物链中比较低层的一个位置。

我觉得从总体上来说,网站运营和SEO是这样层层包括的关系:

网站运营-网络营销-网站推广-SEM-SEO

网站运营是一个总体概念,包括了设计,编程,客户服务,公司管理等。网络营销是网站运营的一部分。

网络营销又包含很多内容,并不局限于网站本身的推广。网络营销还包含比如blog营销,市场定位,价格策略,销售流程的设计和优化,产品策略,电子邮件营销等。网站推广是网络营销的一部分,

网站推广又包括很多方法,比如联署计划,论坛的参与,免费礼物以吸引用户,发布新闻稿等。SEM(搜索引擎营销)是网站推广的其中一种手段。

SEM主要包括SEO(搜索引擎优化)和PPC竞价广告。

SEO只是网站推广和网络营销的一小部分内容,当然我个人觉得SEO是网站推广最有效的手法。

专门招聘SEO人员的公司和网站似乎不是很多,所以做SEO的人应该把自己的知识往食物链的上层扩展,多了解网站推广和网络营销的总体知识,对职业的发展有好处,而且对SEO本身的深度和广度也有很大好处。有很多SEO技巧不能只从技术层面看,而要考虑到这些技术对网站整体营销的影响。

作者: Zac

原载: 搜索引擎优化SEO每天一贴

版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

收藏本页到:

365Key | del.icio.us

相关文章:

    * 谁是你的顾客?

    * 抓住一个方法,然后坚持!

    * 长尾理论和SEO及网络营销

    * 中英文垃圾邮件比较和网络商机

    * 写blog是不是就得干点什么?

站内链接的优化(转帖)

站内链接的优化  2006年11月2日

大家都知道外部链接对网站排名的重要性,同时也建议不要忽略了站内链接的作用。

外部链接大部分情况下是不好控制的,而且要经过很长时间的积累,内部链接却完全在自己的控制之下。下面列几个优化站内链接的经验。

建立网站地图

只要有可能,最好给网站建一个完整的网站地图sitemap。同时把网站地图的链接放在首页上,使搜索引擎能很方便的发现和抓取所有网页。

有不少CMS系统并不自动生成网站地图,可能需要加一些插件。对大型的网站来说,可以把网站地图分成几个文件,每个文件里不要放太多网页。

每个网页最多离首页四次点击

对一个中小型网站来说,要确保从首页出发,四次点击之内就要达到任何一个网页。当然如果在三次点击之内更好,两次就更好。配合网站地图的使用,这一点应该不是大问题。

大家可以计算一下,四次点击至少可以有几百万个网页,所以对一般网站应该是可以适用的。

尽量使用文字导航

网站的导航系统最好使用文字链接。有的网站喜欢用图片或者JS下拉菜单等,但SEO效果最好的是文字链接,使搜索引擎可以顺利抓取,而且通过链接文字了解这些栏目页的具体内容。

如果为了美观不得不使用图片或者JS,至少在网站底部或者在网站地图中应该有所有栏目的文字链接。

链接文字

网站导航中的链接文字应该准确描述栏目的内容,自然而然在链接文字中就会有关键词,但是也不要在这里堆砌关键词。

在网页正文文章中提到其他网页内容的时候,可以自然而然的使用关键词链接到其他网页。反向链接中的关键词也是排名的重要因素之一,在自己的站内自己有完全的控制权。

整站的PR传递和流动

只要有好的网站整体结构,整个网站的PR传递应该是很均匀的,首页最高,栏目页次之,内容页再次。

但有的时候可以通过网页的链接影响PR和重要性的传递,使某一页或某几页的PR值和重要性升高,这几页也是你重点要推的网页。

网页的互相链接

以前说过网站的树型结构,不过要注意的是,这种树型结构不是说各个栏目下的文章页之间没有链接,恰恰相反,应该在不同栏目的网页中链接向其他栏目的相关网页。整个网站的结构看起来更像蜘蛛网,既有由栏目组成的主脉,也有网页之间的适当链接。

作者: Zac

原载: 搜索引擎优化SEO每天一贴

版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

收藏本页到:

365Key | del.icio.us

相关文章:

    * URL的优化

    * Google链接分析专利

    * Zac是谁?

    * 网站内容与技术性优化并行

    * Blog优化的局限

发表于分类目录SEO技术 ||

“站内链接的优化”2个评论

   1. 塑钢门窗说:

      2006年11月3日 at 9:17 am

      恩 学习,现在很多的门户网站非常注重内部的连接,我想问一下,用什么可以实现网站内部网站关键词的内部链接?比如软件之类的?

   2. littlebat说:

      2006年11月3日 at 1:41 pm

      zac的这篇文章太实用了。我正在重新写小站的导航系统,这篇文章可以作为重要的依据。

      尤其是:

     


      链接文字

      网站导航中的链接文字应该准确描述栏目的内容,自然而然在链接文字中就会有关键词,但是也不要在这里堆砌关键词。

      在网页正文文章中提到其他网页内容的时候,可以自然而然的使用关键词链接到其他网页。反向链接中的关键词也是排名的重要因素之一,在自己的站内自己有完全的控制权。

     

      这段很有启发。

      我转帖了这篇文章在小站的“建设学习日记”目标下。

百度和google对本站301重定向的反应

本站对域名和每个具体的网页都整体进行了301重定向.重定向完毕大概3天了吧.现在百度对301重定向的反应很快.site:java.learndiary.com 有19000了,而site:www.learndiary.com有5000左右,但是site:www.123go.org.cn却还有22000(好像没有受到重定向影响似的).

在百度上,本站的重定向看来没有受到传说中的"百度一跳转就死"的说法,但是,最终结果要由时间来说话.

而在google方面,本站重定向反应不大好,site:java.learndiary.com只有50左右,site:www.learndiary.com有12200,site:www.123go.org.cn有5900,也就是说,大部分的页面还是收在www.learndiary.com中的.本站在google上的收录存在一些问题,如太多补充材料.而site:learndiary.com出现多个主页版本的问题已经得到修正.也就是说,本站在google收录的方面目前的形势还不明朗.而且现在收录的页面中只有2个出现,其它的报告为:"为了提供最相关的结果,我们省略了与已显示的 2 个类似的条目。根据您的意愿,可将省略的结果纳入搜索范围后再重新搜索。"

这也许提示本站的导航部分内容太多,正式内容太少,以至被提示为"类似条目".

先静观其变,原来是这样都没有如此报告.或许最多把所有网页中的相同部分尽量少一点,像那些注释了的.但是导航部分还是不要作大的改动.zac的博客上的SEO时间跨度往往都是半年,1年或更久.而他这次的博客被百度"惩罚",他也是再观察一个月,如果不行再去掉他的301重定向.所以我也试试静观一个月吧.

已经写好的sitemap.xml也没有提交,害怕误用其中的规则,弄巧成拙.经过学习,如果以后java.learndiary.com的收录出问题再把这个sitemap.xml文件提交上去.

还有,提醒自己不要走入根据搜索引擎来做网站的误区.用户才是网站的上帝,内容才是网站的生命.我们要着眼于内容有用,对用户友好.而搜索引擎的表现要作为在之后的一个重要的参考.因为搜索引擎出现问题,也往往提示在内容或用户友好度方面有问题.

本站进行301重定向的过程见日记:昨天去掉了网站的动态导航参数并做301定向

搜索引擎新闻数则(转帖)

转自:http://www.chinamyhosting.com/seoblog/2006/10/28/se-news-2/

搜索引擎新闻数则  2006年10月28日

总结这两天的几条搜索引擎新闻。

Google推出自定义搜索引擎

幻灭的博客里有详细的说明。

大意是Google允许用户做一个极为个人化的搜索引擎,你可以选择关键词,使搜索结果围绕这些关键词,也可以指定搜索结果限于哪些网站,然后把搜索条放在自己网站上。

这个自定义搜索引擎是基于以前推出的Co-op,幻灭认为这是2006年Google推出的最重要产品。

我感觉虽然这个产品可以更好的收集用户参与的搜索数据,但是用法还是比较复杂,不利于推广,所以不是很看好。

Google修改站长指南

Google以前的站长指南里面曾经说过,带”&id=”的URL不会被收录。前两天Google Webmaster Central官方博客提醒大家,这个指南已经做了修改,Google蜘蛛加强了对这类动态URL的支持。

不过另一方面Google还是提醒大家,这类动态URL毕竟有危险,还是建议大家尽可能改成静态网址。如果一定要使用的话,最多一到两个参数。这对很多电子商务网站是个福音,只要你的程序不让Google陷入死循环,带一两个参数应该问题不大了。

雅虎推出雅虎书签

雅虎的新版工具条中推出了自己开发的书签服务Yahoo! Bookmarks,界面清晰简单,这是雅虎在社会性搜索领域迈出的又一步。

值得注意的是,雅虎早就收购了书签服务网站Del.icio.us,不过他们并没有把这两个服务合并起来。

雅虎支持NOODP标签

25号,雅虎在官方博客正式宣布支持NOODP标签。在同一个贴子里,雅虎也提到了最新一次的数据更新,这距离上一次11号的更新也太近了点儿。

作者: Zac

原载: 搜索引擎优化SEO每天一贴

版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

收藏本页到:

365Key | del.icio.us

相关文章:

    * Google 8月18号数据刷新

    * 搜索引擎新闻数则

    * 搜索引擎行业大混战

    * Google新闻和心得三则

    * Google新闻-Google董事长施密特访华

发表于分类目录SEO新闻及点评 ||

“搜索引擎新闻数则”2个评论

   1. littlebat说:

      2006年10月29日 at 7:11 am

     


      只要你的程序不让Google陷入死循环,带一两个参数应该问题不大了。

     

      是个好消息,“东西没有破就不要修”,看来,随着搜索引擎对动态url的放宽,动态url静态化的必要性在下降了。

   2. littlebat说:

      2006年10月29日 at 7:13 am

      我转帖了你的这篇帖子。

北京中搜网会模拟人访问网站

今天在查看访问日志时发现几个IP有点异常,通过http://www.123cha.com网站可以看到,这些IP都是北京中搜网的。

他们不像其它搜索引擎,会明确告诉网站他们是bot。

这是他们的访问记录:

...

2006-10-25 23:01:25,281 - User: userID:836,userName:guest; IP: 202.108.1.13 USER-AGENT: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0) REFERER: Http://www.learndiary.com/disDiaryContentAction.do?goalID=2168&naviStr=a10a21

...

2006-10-25 23:01:54,281 - User: userID:836,userName:guest; IP: 202.108.1.10 USER-AGENT: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0) REFERER: Http://www.learndiary.com/disGoalContentAction.do?goalID=2040&naviStr=a10

...

2006-10-25 23:02:16,781 - User: userID:836,userName:guest; IP: 202.108.1.6 USER-AGENT: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0) REFERER: Http://www.learndiary.com/disDiaryContentAction.do?goalID=2034