Feb 06, 2014 PHP

百度石榴算法

一、简介         2013 年 5 月 17 日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法”。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面。百度称此举是为了尊重搜索的用户,净化互联网生态环境!   二、公告原文         石榴算法-低质量页面终结者原文如下:         作者:百度网页搜索反作弊团队 发布时间:2013 年 5 月 17 日 亲爱的站长朋友们: 大家好!         一直以来,我们本着为用户提供最优质直接的信息的原则,不断优化算法、升级系统。保护优质页面与打压低质页面是一直都运用的两种方式。         本次想向各位站长朋友传达,我们将针对低质量页面将进行一系列调整,我们称之为石榴算法。         第一期将对此类页面生效:含有大量妨碍用户正常浏览的恶劣广告的页面,尤其以弹出大量低质弹窗广告、混淆页面主体内容的垃圾广告页面为代表。         从整个互联网生态环境看,泛滥的低质量广告越来越多的被加诸于大量网站的各个角落,无处不在,这已经严重影响了正常用户的浏览体验。想象一下,当你打开一个网页,看到的不是感兴趣的内容反而是一个个垃圾弹窗广告或者混淆、掩盖住主体内容的大面积广告,你的感受如何?不言自明。         因此本次算法上线后,我们将会看到低质广告少、无弹窗的优质页面排序有所提升,当然,前提是主体内容有价值。相应的含有恶劣弹窗、大量混淆页面主体内容等垃圾广告的页面排序会大幅下降。         这是搜索引擎尊重用户的必然选择,也是着眼于净化互联网整体环境的必然趋势。         最后,希望站长能够从用户角度出发往长远考虑,在不影响用户体验的前提下合理放置广告,赢得用户的长期青睐才是一个网站发展壮大的基础。         提醒:石榴算法第一期针对含有大量低质弹窗广告及大量混淆页面主体内容等垃圾广告的页面算法升级,将会在一周之后正式上线,希望广大站长在这一周内尽快检查网站中的广告情况,若存在上述说的情况,请及时进行处理。    三、未来影响…

Jan 08, 2014 PHP

Sitemap 介绍

一、什么是 Sitemap?         Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交 Sitemap 有助于百度发现并了解您网站上的所有网页。您还可以使用 Sitemap 提供有关您网站的其他信息,如上次更新日期、Sitemap 文件的更新频率等,供百度 Spider 参考。         百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用 Sitemap 中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。         此外,Sitemap 与搜索排名没有关系。 二、百度 Sitemap 协议都支持哪些格式?         百度 Sitemap 协议支持三种格式:文本格式、xml 格式、Sitemap 索引格式,可以根据自己情况来选择任意一种格式组织 sitemap。具体格式说明及示例如下: 2.1、第一种格式样例:txt 文本格式         在一个 txt 文本列明需要向百度提交的链接地址,将 txt 文本文件通过站长平台进行提交 http://www.example.com/repaste/101562698_5230191316.html http://www.example.com/repaste/101586283_5230215075.html http://www.example.com/repaste/101639435_5230310576.html        …

Mar 06, 2013 PHP

SEO 排名影响因素

        对许多有志于最大化站点附加价值的网站管理员,可阅读由搜索引擎出版的、以及 W3C 发布的编码指南。合理有效地遵循该指南,站点频繁地更新有效原创的内容,并创建几个实用、有意义的导入链接,获得相当可观数目的基本搜索流量也不是什么难事。         当站点拥有有用的内容,其它网站管理员自然而然会链接至该站,进而增加它的网页级别和访客流。当访客发现一个有用的站点,他们倾向于利用电子邮件或者及时消息介绍给其它访客。   一、搜索引擎蜘蛛工作原理         搜索引擎蜘蛛是通过链接地址来寻找网页的。搜索引擎蜘蛛名称随搜索引擎的不同而不同。那它的原理是由一个起始链接开始抓取网页内容,同时也采集网页上的 链接,并将这些链接作为它下一步抓取的链接地址,如此循环,直到达到某个停止条件后才会停止。停止条件的设定通常是以时间或是数量为依据,可以通过链接的层数来限制网络蜘蛛的爬取。同时页面信息的重要性作为客观因素决定了蜘蛛对该网站页面的检索。站长工具中的搜索引擎蜘蛛模拟器其实就是这个原理。基于蜘蛛的这种工作原理,站长都会不自然地增加页面关键词的出现次数,虽然对关键词密度产生量的变化,但对蜘蛛而言并没达到一定的变化。这在搜索引擎优化过程中应该要避免的。   二、影响因素         由国外 37 名优秀的 SEO 界高手共同参与,以投票形式评论影响 Google 排名的重要因素,此次评选非常有价值,尽管没有将 200 多个 Google 排名因素全部列出,但 Google 排名算法中 90%-95%的重要成分已经包含在其中了。 2.1、正面因素 关键词:关键词在网站 TITLE 上的使用 外部链接:外部链接的锚文字 网站品质:网站的外部链接流行度、广泛度 网站品质:域名年龄(从被搜索引擎索引开始计算) 页面质量:网站内部链接结构 网站品质:网站的外部链接页面内容与关键词的相关性 网站品质:网站在主题相关的网站群中的链接流行度 关键词:关键词在网页内容上的应用 外部链接:外部链接页面本身的链接流行度…

Feb 06, 2013 PHP

搜索引擎工作过程与 SEO

        搜索引擎的工作的过程非常复杂,而简单的讲搜索引擎的工作过程大体可以分成三个阶段。         (1)、爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问页面,获取页面 HTML 代码存入数据库。         (2)、预处理:搜索赢球对抓取来的页面数据文字进行文字提取、中文分词、索引等处理,以备排名程序调用。         (3)、排名:用户输入关键字后,排名调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。 一、爬行和抓取 爬行和抓取是搜索引擎工作的第一步,完成数据收集任务。 1.1、蜘蛛         搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。 各大SEO引擎搜索的蜘蛛会一次又一次访问爬取我们站点的文章内容,也会耗费一定的站点流量,有时候就必须屏蔽一些蜘蛛浏览我们的站点。掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;这里搜集了各大搜索引擎的蜘蛛爬虫UA,便于需要时查看。 1.2、蜘蛛代理名称 1.2.1、百度蜘蛛:BaiduSpider         常见的Baiduspider和Baiduspider-image(抓取图片),百度公司还有其它几个蜘蛛:Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)、Baiduspider-mobile(抓取wap),都不常见。         百度蜘蛛爬虫UA:         PC端:Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)           移动端:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46…

Jan 01, 2013 PHP

SEO 常见术语

导航         请确保你的网站导航(网址导航)都是以 html 的形式链接。所有页面之间应该有广泛的互联,要满足站内任何页面可以通过回连到达主页,如果无法实现这一点,可以考虑建立一个网站地图。   首页         网站的首页(home 或 index 页等)应该采用文本的形式,而不是 flash 等。这个文本里面要包含你的目标关键字或目标短语。   标签         <title> < /title>这是标题标签,里面应当包含你最重要的目标关键词。         <keywords></keywords>这是关键词标签         <description></description>这是描述标签   PR 值算法         PR值全称为PageRank,用来表现网页等级的一个标准,级别分别是0到10,是Google用于评测一个网页“重要性”的一种方法。         PR(A) =(PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)+...+PR(N)/L(N))*q+(1-q)         其中,PR(A):指网页 A 的佩奇等级(PR 值), PR(B)、PR(C)...PR(N)表示链接网页…

Jul 06, 2012 PHP

搜索引擎的排名原理

        要了解搜索引擎优化,首先了解搜索引擎的基本工作原理。搜索引擎排名大致上可以分为四个步骤。一、爬行和抓取        搜索引擎派出一个能够在网上发现新网页并抓取文件的程序,这个程序通常被称为蜘蛛或机器人。搜索引擎蜘蛛从数据库中已知的网页开始出发,就像正常用户的浏览器一样访问这些网页并抓取文件。        并且搜索引擎蜘蛛会跟踪网页上的链接,访问更多网页,这个过程就叫爬行。当通过链接发现有新的网址时,蜘蛛将把新网址记录入数据库等待抓取。跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本方法,所以反向链接成为搜索引擎优化的最基本因素之一。没有反向链接,搜索引擎连页面都发现不了,就更谈不上排名了。        搜索引擎蜘蛛抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。二、索引        搜索引擎索引程序把蜘蛛抓取的网页文件分解、分析,并以巨大表格的形式存入数据库,这个过程就是索引。在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。        搜索引擎索引数据库存储巨量数据,主流搜索引擎通常都存有几十亿级别的网页。三、搜索词处理        用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对输入的搜索词进行处理,如中文特有的分词处理,对关键词词序的分别,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。四、排序        对搜索词进行处理后,搜索引擎排序程序开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名计算法计算出哪些网页应该排在前面,然后按一定格式返回“搜索”页面。        排序过程虽然在一两秒之内就完成返回用户所要的搜索结果,实际上这是一个非常复杂的过程。排名算法需要实时从索引数据库中找出所有相关页面,实时计算相关性,加入过滤算法,其复杂程度是外人无法想象的。搜索引擎是当今规模最大、最复杂的计算系统之一。        但是即使最好的搜素引擎在鉴别网页上也还无法与人相比,这就是为什么网站需要搜索引擎优化。没有 SEO 的帮助,搜索引擎常常并不能正确返回最相关、最权威、最有用的信息。

Jun 06, 2012 PHP

新手遇到这些快照难题 该如何解决?

        很多时候快照的变化会预示着网站近期的一些走向,根据操作实例来讲,如果你的快照无缘无故的回档甚至消失,那么网站八成是被拔毛了。也正是因为快照有着这样的预示作用,使得很多新手朋友对于快照总是有着这样或是那样的敏感情绪。鉴于此,我总结了一些快照出现的问题分享给大家,希望可以帮到同为站长的你我。当然以下也只是我个人的看法,欠妥的地方大家一起讨论。一、快照更新的频率与网站关键词排名有无直接的关系?        相信这是很多站长最关心的问题,因为在实际的操作过程中我们会发现,如果自己的快照时间变化无常,时而停滞不前,时而延迟数天,那么自己的网站就一定会产生一定的影响。要不关键词掉落,要不直接被 K 掉。因此这就让很多站长变得犹如惊弓之鸟,盲目的以为只要快照不正常,那么网站就会产生大的问题。其实在百度官方定义中,快照只不过是纯文本文档,是网站无法打开之际提供给用户的一种预览界面,并无其他附加值。因此盲目的将快照更新频率与网站排名挂钩有点不太合适。不过通过正常的操作来看,如果你的站点正规,更新内容及时且高质,并且能够做好外链建设和流量的引入,那么快照会保持一种迅捷的更新频率。所以说快照更新的快照一定程度上呈现出你最近的网站状况。二、快照回档就一定会是 K 站的节奏吗?        相比于快照更新不正常,首页快照回档才是更恐惧的事情。因为在很多老站长看来,快照回档就是 K 站的前奏,没有犹豫和商量。其实我觉得这事情未必就直接影响,因为在我看来,每个网页在搜索引擎那都会有若干个备份,在一些比较特殊的情况下比如百度算法调整阶段,很容易会出现显示效果的差错,导致之前的备份被调用出来,这就出现了咱们所担心情况的发生,但是当一切企稳之后异常现象又会再次消失。因此只要我们自身网站没有问题,不存在作弊手段,那么无伤的可能性还是比较低的,但对于那些本身内容更新就不及时、存在作弊建站手段的网站来说,快照回档显然是自身质量无法满足当下爬取要求,回档其实更像是 K 站的前兆,毕竟有因才有果,网站硬件实力才是我们拒绝盲目对待快照的最坚实基础。三、快照与首页不匹配怎么办,难道有问题?        不知道大家出现过这个问题没有,当你点击首页快照的时候,你会发现出来的页面与首页并不相关,而是一个其他的页面,如果出现这种情况是不是就意味着网站首页已经被 K 掉,只剩下内页了呢。其实问题不能这么简单的分析,如果我们看到快照与着陆页位置不匹配,那么是一定存在问题的,但是不一定代表不能补救。如果你的关键词排名还在,那么问题就可能预示着两个信息,其一,网站本身的访问稳定性不够,致使蜘蛛无法爬取索引正常的内容,其二,原创力度太低,采集内容与主页一共被监察。所以说当出现这种问题的时候,大家要先根据自己网站的情况进行一番彻底的分析,然后依照问题出现的点进行布置和补救,加大原创力度和内容建设,做好外链指向等等,虽然问题不会直接导致 K 站,但是未雨绸缪,提前打个预防针也还是不错的。四、首页快照迟迟不放出来是不是就等于原创力度不够?        对于新站,一般会有一个考察期,在这个阶段中很多网站都是先放出内页,再放出首页,所以说在这个阶段你会发现,你的站点内页和首页的更新频率是不相同的,有些时候内页快照的更新更及时。当出现这种问题的时候,不要盲目的以为自己的首页重复度过高导致的搜索扣分,然后盲目的做内链指向首页,其实只要网站空间运行稳定,首页原创度中等偏上,一些属性不存在过多的雷同,那么首页快照的释放就一定是早晚的事情。大家没有必要过多的去担心和恐惧。但是在这个过程中有时候还会出现另外一种情况,那就是首页更新及时,内页倒是收录少,更新缓慢,这种情况其实并不被大家所重视,当出现这种情况的时候我觉得这多与网站建设有关,多发一些内页的高质量链接,不要总把外链指向首页就能解决相应的问题,其实就是增加下内页的权重。五、对于快照,我们该以怎样的心态对待?        关于快照,就像前面所说,它只是一个存档,一个应急备案,大家对它的变化没有必要过分敏感,之所以这么多“预言”变成现实,其主要因素还在于你的网站站点未必成熟和坚挺。如果网站建设出现问题,原创不够,稳定性不高的话,那么说什么都没用,你肯定在搜索引擎那得分不高,被 K 站也未必是快照引起的。因此打铁还需自身硬,为了得到更好的关键词排名,我们应该做好网站是首要,不过对于快照我们还是要有一个认知,那便是快照更新快代表我们在内容上有一定的优势,蜘蛛很青睐,因此在日后的操作中要更加注意内容的补充力度和频率。       对于快照我只是说出了自己的看法,或许可以给同为站长的朋友们些许帮助。

May 05, 2012 PHP

如何培养 SEO 思维

        无论是专业的 SEOER 还是个人站长,都应该尝试培养自己的“SEO 思维”,利用这种思维能够让你在对网站进行优化时更加有规则、有目的、有执行力,可以更好地保证优化的效果实现!这里结合我个人的经历和体会,浅谈一下什么是 SEO 思维,还有如何培养这种思维。一、怎么定义“SEO 思维”        以我的感受和理解,SEO 思维指的就是无论在网站建设过程中,还是日常的其它活 动中,都能把所接触到的事物敏锐地与网站的 SEO 联系起来,从中发现对优化有帮助、有 价值的信息,从而从新的层次上提升 SEO 优化的水平。毕竟,在我们的日常工作和生活之 中,有许多有价值的信息可以对网站的优化起到作用,这其中涉及到发掘热点事件中有价值 的新鲜“关键词”,抓住时机利用新出现的关键词进行布局和优化,从而获得搜索流量。另外, 对于网站优化流程的管理,则可以积极借鉴企业管理中的一些常用方法,特别是对于职业 SEOER 来说,对待手中掌握的多个优化项目,就需要引入项目管理的高效办法来提高工作 的效率,保证每个项目都能达到应有的效果。二、如何培养“SEO 思维”2.1、熟练掌握基本的 SEO 技能        要做到利用 SEO 思维来提升优化的技能和水平,首先需要的就是打牢基础,做到熟练 掌握基本的 SEO 技能,这其中包括以下几个方面:        如何确定网站的关键词,分为主关键词、热门关键词和长尾关键词         如何编写网站的 Title、Dercription、Meta Keyword、Tag 等         如何选定推广平台构建网站的外链        …

Apr 04, 2012 PHP

关键词的选择

一、海选        (1)、圈定能高度概括你网站主题或所提供服务的1至3个关键词。如提供二手房产交易的网站可能圈定的关键词是:“二手房”;“北京二手房”;“房产中介”等。        (2)、 找出你圈定的关键词的同义词:如网站的主题是“旅游”,相应的同义词可能有“旅行”“自由行”“自助游”等,可以根据你网站可提供的服务和内容来确定。        (3)、找出你网站主题或产品或服务所属领域的上一级类别关键词。并不是所有网站都可以找出上一级类别关键词,不必强求。(可以通过行业协会网站,观察他们在讨论类似内容时使用何种关键词)。如一些中小企业网站,生产插种机的小企业网站,上一级类别的关键词会是“农业机械”等。        (4)、列出网站内的所有产品词或品牌词或服务词。        (5)、找出用户在浏览你网站时的潜在需求及相关关键词。如境外旅游网站,用户在浏览的同时,很多情况下也是有外币汇率需求的。        (6)、尽可能地寻找与上述关键词有关的长尾关键词。        (7)、考虑一下搜索引擎用户会通过怎样的关键词去查询你网站能提供的信息,即从潜在用户的搜索习惯上找到关键词。二、筛选        海选阶段会产生很多关键词,不可能全部放在网站中,需要筛选出有 SEO 价值的部分。        (1)、 确保关键词有搜索量,简单的说,就是确保关键词是真的有用户在搜索,且搜索量能达到一定水平。可以通过百度指数来解决这个问题。        (2)、确保网站可以产出与关键词相关的内容,用户通过该关键词进入到你的网站后,会有诸如继续点击阅读、注册、下单等行为,即转化率——这一点搜索引擎是极为看重的。        (3)、考虑内容制作的难易程度是否在自己控制范围内,如上述所说的境多旅游用户的需求,外币汇率比较好解决,但还有诸多细节需求对于小型网站来说,满足起来难度较大。三、重要注意事项        (1)、关键词所属领域应该与网站所属领域相关:如健康网站内可以有一些医学内容,而娱乐内容明显不合适。        (2)、选择可以获得有效、安全的关键词:有些网站紧盯百度首页推荐的热词,再通过采集把大量内容填充进自己的网站,不仅对网站自身用户造成伤害,对提升转化率没有任何好处,也很容易被搜索引擎当垃圾内容进行惩罚。        (3)、避免过度重视通用词:在海选中,我们确认网站内容主题服务主题的关键词,还要找上一级类别关键词,但这些关键词往往过于宽泛,建议网站还是抓住几个重点进行内容建设        (4)、重视长尾关键词:在海选第 6 条我们提到应该寻找一些长尾关键词,但长尾关键词的检索量往往比通用词或非长尾要低许多,有些网站认为没有价值就放弃了。其实长尾关键词包含了用户更精准的信息,转化效果更好,SEO 竞争也更小,值得站长下一番工夫。

Mar 06, 2012 PHP

SEO 优化基本要点

        定义网站的名字,选择与网站名字相关的域名注册查询以保障网站的安全运行         分析围绕网站核心的内容,定义相应的栏目,定制栏目菜单导航         根据网站栏目,收集信息内容、整理、修改、创作、添加         选择稳定安全服务器,保证网站 24 小时能正常打开,网速稳定         分析网站相关长尾关键词,合理的添加到内容中         网站程序采用 DIV+CSS 构造,符合 w3c 网页标准,全站生成静态网页         合理交换网站相关的友情链接,不能与搜索引擎惩罚的与行业不相关的网站交换链接         制作生成 XML 与 HTML 的地图,便于搜索引擎对网站内容的抓取         为每个网页定义 TITLE、META 标签,标题简洁,META 围绕主题关键词         网站经常更新相关信息内容,禁用采集,手工添置,原创为佳         放置网站统计计算器,分析网站流量是通过什么来的,用户关注什么内容,根据用户的需求,修改、添加,增加用户体验         网站设计美观大方,菜单清晰,网站色彩搭配合理         合理的 SEO…