TA的每日心情 | 奋斗 昨天 01:12 |
---|
签到天数: 41 天 [LV.5]常住居民I
超级版主
 
- 积分
- 304418
|
百度搜索引擎收录习惯:百度是全球大的中文搜索引擎,对中文页的搜索技术在某种程度上领先于G,百度在某些方面与G有相同或相似之处外它还有以下特点:
1、较重视首次收录印象
给百度的首印象比较重要,相对G而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录页而不是由机器来决定。所以,在登录百度搜索引擎之前把内容做得丰富点、原创内容多一点、页关键词与内容的相关度高一点,这样才能给百度较好的初次印象。
2、对页的更新较敏感
百度对页的更新相对G而言更加敏感,可能这与百度的本土性格有关。百度搜索引擎每周更新,页视重要性有不同的更新率,频率在几天至一月之间。所以在百度的搜索结果中基本上都标明了收录时间。
3、较重视首页
百度对首页的重视程度要比G高得多,这与上面提到的“较重视首次收录印象”一脉相承。百度在显示搜索结果时也常常把首页显示出来,而不具体到某个内容页(当其认为不够重要时)。相对而言,其用户体验打了折扣,而增加了其“百度照”的用户量。
4、较重视绝对地址的链接
百度在收录页时比较重视绝对地址的收录,百度提供的页照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现。
5、较重视收录日期
百度对页的收录日期非常看重,也是其搜索结果排的参考点,被收录得越早排会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息。这是百度需改进的技术。
百度使用的技术
百度使用以下技术:“一种互联上镜像和准镜像的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词汇的手段,现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果;“一种使用照的方式现对上信息进行记录和分析的方法”,该方法是通过对互联上一个特定信息,多次进行照的方式,将信息当时的状态进行保留。并通过对一系列照信息的分析,得到有效数据,方便地得到上信息的变动情况。
[小技巧一]如何提高百度的收录
1如果站点有论坛或者动态的经常更新的东西的话收录和更新都很
2做大感受就是自己不断在往的数据库里添加内容不断采集,筛选重排列,然后提交给而因为强调更新率,本身对数据是喜新厌旧,所以新的内容如果和别的站的老内容重复的话,自己居然还能慢慢排到采集源头的站前面
3一般一个月大更新2到3次小更新天天有目标主要是在小更新的时候提交目录和索引页(一般是分类页或者页)到,在大更新时候争取大量被收录每次更新后大概两天时间调整这短时间站点别做大动作否则很容易被删目录或者被封
4一定要定期喂给页面否则会连累同目录的老页面不断被降权
[小技巧二]对于G决定博客搜索排的有利因素:
1)博客的流行程度
2)是否存在于其它博客中“博客链接”里
3)大量的订阅数:对于B的RSS订阅数,G通过订阅者的IP地址来判断是否,以避免虚假的高订阅数字。
4)标签的使用
5)在搜索结果里的B文章,其被点击频率高低,会影响排,这就相当于用户用点击所作的投票。
6)如果一个B里,绝大部分是高质量的B链接,而你的链接在其中,对排有正面的影响。[P]
百度和G的域权威度分析
G在显示页排的时候,有可能会给页赋予一个权威度值,这个权威度和页的PR是不同的,法从外部看到,而这个权威度的算法,目前仍然是一个未公开的算法,可能和反向链接数量可能有关系,可能也和域类型、注册时间有关系,如果适当提高域的权威度,对于G的排有很大的好处。
百度其也有类似权威度这样的算法,但是一般看来百度显示页排和所谓的域权威度的关系不是特别大。这和G的算法是有一定区别的。根据一般观察,注册时间长的大型(页面内容多)往往在G上有较高的权威度,而百度似乎比较注重论坛、社区、博客上的链接,而把这些链接作为衡量权威度的一个标准。
百度对于社区论坛的重视,主要也源于人的上习惯。人天生下来就喜欢泡论坛,因此一般大型论坛的人气都非常旺,百度也喜欢收录各种论坛或者博客的页面,并给于其较高排,这样就显得百度收录的文章较多,而G则喜欢收录大型的页面,反而会影响收录速度,对于某些类似个人原创文章的搜索也未必能有更好的搜索体验。建议G能够针对的国情和特色微调一下相关的搜索算法,相信会对搜索结果的用户体验得到不少提升。 |
|