TA的每日心情 | 郁闷 22 小时前 |
---|
签到天数: 41 天 [LV.5]常住居民I
超级版主
 
- 积分
- 306599
|
G搜索引擎习惯
G作为全球大的多语言搜索引擎在发展历史过程中形成了自己的页收录习惯,也建立起自己的一套标准。研究G收录页的习惯有利于更好迎合G搜索引擎的口味,达到提高页收录量和收录排的目的。
我们暂且不研究G对其他语言的收录,就汉语而言,G收录有以下特点:
1、敏感度较高,反应较
G对新建的具有较高的查知性,当然,新建的必须要有外部链接或者向G递交过登录信息。否则,即使G的搜索技术再厉害,一个只有站长一个人看得见的是很难被G发现的。G收录新建的两个途径是:首,通过的外部链接;第二,通过向G提交登录数据。一般而言,后者的收录速度相对较,而前者则要视G对新建的外部链接的收录频率而定。如果G对外部链接的评价高、收录频率高那么其发现新站的速度也相应地高,新建被收录的日期就会被提前。
2、并重相关性和重要性
G使用PR技术检查整个络链接结构,并确定哪些页重要性高。然后进行超文本匹配分析,以确定哪些页与正在执行的特定搜索相关。在综合考虑整体重要性以及与特定查询的相关性之后,G才将相关可靠的搜索结果放在首位。这也是G收录页的特点之一。
3、变化较、机动性较高
G漫游器会定期抓取W,将大量页列入索引。稍后完成的下一次抓取会注意到新、对现有的更改以及失效的链接,并对内容的变化在搜索结果中加以调整。
4、较重视链接的文字描述
G会将链接的文字描述作为关键词加以索引,所以我们在作友情链接时千万要仔细设计链接的文字描述,使之既符合的定位又不失相关性,以此博得G的信任。
5、较重视页M标记的描述
大多数时候G显示搜索结果时会把页的D显示出来,并占有较重的篇幅。
G使用的技术:
PR技术:PR能够对页的重要性做出客观的评价。PR并不计算直接链接的数量,而是将从页A指向页B的链接解释为由页A对页B所投的一票。这样,PR会根据页B所收到的投票数量来评估该页的重要性。
超文本匹配分析:G的搜索引擎同时也分析页内容。然而,G的技术并不采用单纯扫描基于页的文本(发布商可以通过元标记控制这类文本)的方式,而是分析页的全部内容以及字体、分区及每个文字精确位置等因素。G同时还会分析相邻页的内容,以确保返回与用户查询相关的结果。
百度搜索引擎收录习惯
百度是全球大的中文搜索引擎,对中文页的搜索技术在某种程度上领先于G,百度在某些方面与G有相同或相似之处外它还有以下特点:
1、较重视首次收录印象
给百度的首印象比较重要,相对G而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录页而不是由机器来决定。所以,在登录百度搜索引擎之前把内容做得丰富点、原创内容多一点、页关键词与内容的相关度高一点,这样才能给百度较好的初次印象。
2、对页的更新较敏感
百度对页的更新相对G而言更加敏感,可能这与百度的本土性格有关。百度搜索引擎每周更新,页视重要性有不同的更新率,频率在几天至一月之间。所以在百度的搜索结果中基本上都标明了收录时间。
3、较重视首页
百度对首页的重视程度要比G高得多,这与上面提到的“较重视首次收录印象”一脉相承。百度在显示搜索结果时也常常把首页显示出来,而不具体到某个内容页(当其认为不够重要时)。相对而言,其用户体验打了折扣,而增加了其“百度照”的用户量。[P]
4、较重视绝对地址的链接
百度在收录页时比较重视绝对地址的收录,百度提供的页照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现。
5、较重视收录日期
百度对页的收录日期非常看重,也是其搜索结果排的参考点,被收录得越早排会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息。这是百度需要改进的技术。
百度使用的技术:
百度使用以下技术:“一种互联上镜像和准镜像的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词汇的手段,现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果;“一种使用照的方式现对上信息进行记录和分析的方法”,该方法是通过对互联上一个特定信息,多次进行照的方式,将信息当时的状态进行保留。并通过对一系列照信息的分析,得到有效数据,方便地得到上信息的变动情况。 |
|