提到外贸建站工作,大家会自然而然的想到网站SEO的优化,网站SEO的优化又离不开网站的的收录工作。谷歌作为当前全球最大的搜索引擎,在独立站的运营推广方面发挥了不可或缺的重要作用,那么如何让谷歌快速收录自己的网站呢?商家可以通过等方法实现,接下来本文将为大家介绍谷歌收录网站的具体教程,以供大家参考。
一、如何让谷歌收录网站
1、使用GSC的“网址检查”
谷歌搜索控制台有一个功能叫做“网址检查”。在这里可以输入页面网址查看网页收录情况。如果收录情况显示网页未收录状态,可以点击“请求编入索引”请求谷歌索引页面。当然还可以点击“测试实际网址”,来查看谷歌未收录该页面的原因,针对谷歌提示的未收录的原因对页面进行修正,然后谷歌才会索引该页面。
2、将页面包含在网站地图中(xml)
外贸独立站的网站地图是一个导航,帮助搜索引擎了解网站上哪些页面是重要的。在网站地图中包含页面并不能保证索引,但是没有包含重要的页面会减少索引。如果网站是在WordPress上运行的,可以使用Yoast插件来设置和提交网站地图。
通过制作xml站点地图,并上传到ftp后台,然后向谷歌站长-索引-站点地图进行提交,也可以方便谷歌进行抓取。这里要注意的是,如果url的数量过多,最好先拆分成多个sitemap文件,然后压缩再上传提交,这样也能加快谷歌抓取索引的速度。一旦网站地图构建完成并提交到GSC,商家就可以在Sitemaps报告中查看。
3、去掉canonical标签
canonical标签告诉Google哪个是首选的页面版本,它看起来像这样:
<link rel=”canonical” href=”/page.html/”> |
如果页面有一个Canonical标签,那么它会告诉Google这个页面并不存在,这种情况下页面将不会被索引。用户可以通过使用GSC的“网址检查”工具检查独立站页面中是否有canonical标签,如果canonical标签指向另一个页面,将看到“ Alternate page with canonical tag” 警告,如果想让谷歌索引和收录这个页面,只需要去除canonical标签即可。
注:大多数带有canonical标签的页面都有它们的原因。如果看到某页面有canonical标签设置,那么请检查该页面。如果这确实是页面的首选版本,并且也不需要索引正在讨论的页面,那么canonical标记应该保留。所以去除canonical标签,应该谨慎,只针对那些误操作,且需要索引的页面去除canonical标签。
4、检查“nofollow”标签
Nofollow链接是指带有rel=”nofollow”标签的链接。nofollow标签既可用于网页上的链接,也可用于网页,目的是禁止谷歌跟踪该链接或跟踪该网页上的链接,也起到了禁止传递链接权重的作用。尤其是初建网站,不推荐大量使用nofollow标签,这会大量减少谷歌对网站的抓取,自然也会影响收录。
5、添加结构化数据标记
结构化数据是可添加到网站页面中的代码,用于向搜索引擎描述内容,以便搜索引擎更好地了解网页上的信息。搜索引擎可以利用这类信息在搜索结果中以有用的(且吸引用户的)方式显示内容,这也有助于吸引到适合网站业务的客户。
例如如果有一个网店并且标记了一个单独的产品页面,这将帮助谷歌了解该页面主要显示该页面的产品内容,这样谷歌可能会在相关查询的搜索结果的摘要中显示这些信息,这被称称之为“富媒体搜索结果”。
- 富媒体搜索结果:Google搜索结果中的增强型结果,具有额外的视觉效果或互动功能。
6、网站内容优化
(1)内容质量:用户需要向谷歌表明网站是优质站点,一方面要呈现高质量、独特的有价值的内容,提升EAT,另一方面也要压缩低质量内容,这包括修改或者屏蔽低质量内容。
(2)内容丰富性:内容的丰富性是指除了文本内容之外,还提供了图片、视频、音频、图表等多种形式的内容,因此是网页内容质量的提升而非单纯文本内容质量的提升,也起到了信息增益的效果。
(3)内容更新频率:保持规律的内容更新也有利于提升爬虫抓取的次数和频率,从而促进网站的收录。
二、谷歌收录网站教程
谷歌给网站管理员提供了Google Search Console这个免费工具,方便网站管理员将网站收录到谷歌搜索引擎。
1、登录Google Search Console
首先进入Google Search Console,需要选择添加的资源类型,可以是整个网域也可以是某个网址。
2、验证网站所有权
接下来Google Search Console会要求验证网站的所有权,主要有以下5种方法来进行验证。本文在这里选择的是“网址前缀”,输入 https://xxxx.xxxx 点击“继续”。
在Hexo博客安装了fluid主题的情况下,网页 <head> 中添加元标记最为方便,可以直接在 _config.fluid.yml 文件中添加以 custom_head:
# 自定义 <head> 节点中的 HTML 内容 custom_head: ‘<meta name=”google-site-verification” content=”d0Rev5W_JYq5bbkGICM-P1jOiRgOtD7NERbZxHiFMMw” />’ |
(1)HTML文件(推荐的验证方法)
将HTML文件上传至网站,下载此文件:googlede2565d4422defeabc4.html,上传至:https://xxxx.xxxx/
注:为了保持已完成验证的状态,请不要移除该文件(即使是在成功通过验证后)。
(2)HTML标记
向网站的首页添加元标记复制下面的元标记,并将其粘贴至网站的首页中,它应该位于第一个 <body> 部分之前的 <head> 部分中,之后点击下面的验证按钮。
<meta name=”google-site-verification” content=”d0Rev5W_JYq5bbkGICM-P1jOiRgOtD7NERbZxHiFMMw” /> |
(3)Google Analytics(分析)
使用Google Analytics(分析)帐号,首页必须包含analytics.js或gtag.js代码段,跟踪代码应该位于网页的 <head> 部分中,此外还必须拥有对相应Google Analytics(分析)媒体资源的“修改”权限。
注:Google Analytics(分析)跟踪代码仅用于验证网站所有权,它不会访问任何 Google Analytics(分析)数据。
(4)域名提供商
将DNS记录与Google关联,登录到域名提供商网站,将下面的TXT记录复制到xxxx.xxxx的DNS配置中,之后按下面的验证按钮。
google-site-verification=d0Rev5W_JYq5bbkGICM-P1jOiRgOtD7NERbZxHiFMMw |
注:DNS更改可能要过一段时间才会生效,如果Search Console未能立即发现相应记录,请等待1天,然后重新尝试验证。
(5)Google跟踪代码管理器
使用Google跟踪代码管理器帐号,使用条件是必须使用容器代码段和对跟踪代码管理器容器的“发布”权限。
注:Google跟踪代码管理器容器ID仅用于验证网站所有权,系统不会访问任何Google跟踪代码管理器数据。
3、验证成功
重新生成 Hexo 静态网页后,点击“验证”,稍等片刻就可以验证成功,之后就会进入 Google Search Console。
4、检查网站是否被索引
接下来需要将自己的网站编入索引,点击“网址检查”或者直接在最上方的搜索栏中输入 https://xxxx.xxxx/,系统就会检查网址是否被收录到Google。
5、请求编入索引
这时只需要点击“请求编入索引”,Google就会安排爬虫(Googlebot)对网页进行抓取,这需要等待一段时间,一般为2-3天。
在一个星期左右的时间里,爬虫(Googlebot)会对网址的每个页面进行抓取,最终将有效的网页编入索引并加入到谷歌的搜索结果中。如果想更快的将网站的所有网页编入索引,还可以将站点地图(sitemap)提交到 Google Search Console。但是目前有一个难题就是无论怎样更改sitemap格式,甚至严格按照Google要求的规范生成站点地图(sitemap),Google Search Console都无法读取本站的站点地图(sitemap)。
好在即使不提交站点地图(sitemap),谷歌也会定期对本站进行抓取,所以没有站点地图(sitemap)影响不大。
初次提交抓取请求,一般需要等待 2-3 天,爬虫(Googlebot)才会开始对网址进行爬取,之后就可以在谷歌中搜到自己的网站了。一开始可能只会有一两个网页被搜索出来,而且排名靠后,随着爬虫(Googlebot)抓取的次数增多,更多的网页会编入索引,排名也会逐渐靠前。