百度大搜索业务部门对新站的不断重视,既是来势汹涌的创业潮的推动所致,也是爬虫技术对内容优秀的新站挖掘困难的结果。为此,百度站长平台正在做出更多的努力,面向新站的扶持计划“蝶变行动”正说明了这一点。
第一届“蝶变行动”举办于今年3月份,迄今为止共2届,共覆盖了1万大几的新站。两次活动均面向上线不超过2年的新站,筛选优秀者给予奖励,并在SEO、新站扶持等方面与创业者展开讨论。第2次活动更看重网站在移动端的建设,同时综合搜索引擎对网站的评价、内容质量、用户体验、用户投票等评选出奖项。
当然,这是一个双方受益的事情。一方面对于做网页的创业公司而言,不论是做内容还是做移动端的引流,都必须重视SEO优化;另一方面,百度自身也需要通过引导优秀新站的SEO优化,来为用户抓取优秀内容提供便利。
换句话说,创业公司更希望做出SEO优化行为后,能有可评估的效果立见。但百度的诉求是,创业公司做出好内容后,创业公司自身努力去适应百度的技术规则。不得不承认的是,这两种诉求的地位不可能对等,但适应规则本身也是创业公司的必备技能。
整理此次沙龙的部分干货如下:
1. 在spider的网页抓取上,百度从站点评价、本站链接、pattern聚合、用户反馈等方面给出了一些建议:
(1)站点评价:指标包括时效性、原创性、权威性、用户访问友好性。这里面需要注意三点:首先,注意新域名之前是否被滥用过;其次是注意域名是不是被黑。可以使用抓取诊断工具,查看源代码,是不是被藏着小黑链;此外,不要用泛滥的域名,很多免费域名堆积了一大堆垃圾站,百度会评价聚合域名的价值,聚合的评价效果会影响小站,所以建议用比较常见或者传统的域名;
(2)本站的链接关系:过多的层级和链接对百度Spider来说是很不友好的,链接深度越高,价值评估越低,超链关系尽量要扁平,从首页就能够发现;优质的前链对后链收录有促进作用;时效性强的内容往前推;
(3)Pattern:Spider抓回链接,将相似的内容聚合成Pattern,和网页内容相似的站点会给聚和,这种聚合决定了抓取。选比较好的进行实时推送,可以形成一个较好的Pattern;
(4)用户的反馈数据。包括点击量等,要给用户提供有价值的内容;
(5)其他: Url长度要均匀规范。参数过多导致的长Url,在Spider抓取的时候往往被认为没有价值,长尾会被Pass掉,不要搞无谓的参数;百度Spider非常不欢迎爆发式的内容增长,而且会打压。因此链接推送速度要均匀,而不是攒一堆推过来,或者复制一堆东西推过来。
2. 百度给出了Mobile Friendly移动友好度的标准:
移动友好度是应用于移动端检索的一套算法,用来把移动端展现好,满足移动端用户体验的结果排到靠前的位置上。主要包括页面可读性、资源/功能易用性、质量增益三个方面。
页面可读性指标
资源/功能易用性指标
页面的质量增益
质量增益相当于一个加分项,当可读性和资源功能易用性都很好的时候,百度才会考虑页面质量增益,并给予额外优待。质量增益有四点,第一访问路径增益,页面提供很好的导航和面包屑,能够去往上一级、下一级,方便用户在站内继浏览。第二是效益增益,你提供电话和地址,提供电话可拨打和地址可定位。第三是输入增益,查询类应用类网站,输入语言和图象搜索。最后是体验增益,白天、夜间模式切换,主要是大概是这四类以上,后面可能会扩充别的项记。
移动友好度算法应用是移动端的检索,不影响PC端的检索。百度也表示,此次指标在会上是初次透露,还没有正式对其进行推广,所以上述指标也仅供参考。
此外百度还介绍了服务于移动端的新产品AppLink:客户接入百度AppLink服务,用户通过点击百度搜索结果,调起用户设备中已安装的App,并进入内容对应界面。旨在打破移动App与H5的边界,并帮助客户提升App日活以及转化率。对于未安装App的设备,链接则跳转到原WAP页面或Website页面。
值得注意的是,对不同领域的新站而言,掌握一些小技巧也是非常必要的。比如如何鉴别数据反馈、和优化搜索词。拿与会并获奖的“问病网”和“三优亲子”来说,母婴类的网站中会出现一些“白癜风”、“不孕不育”的词汇,而这些词汇都是被百度作为敏感词汇,小网站的话很容易被屏蔽。如果网站在SEO上没有出现很大问题,可以把做的不错的页面去百度搜一下,看排在前面是哪些结果?如果排在前面是宝宝树、摇篮网等大网站,小网站就会看不见。这些搜索词就不要做了。整个网站的权重和流量达到一定规模后,再做“三个月宝宝吃什么奶粉好”这类的关键词。最开始这种情况下则建议使用海量标签和长尾搜索词。
获奖新站的名单:
平台特别奖:大家装修;活动家;好奇心日报;界面行业之星:问病网;三优亲子;玩加赛事;编织汇;团车网;活动价;云财经