日前,Google Search Console(谷歌站长工具)向站长们释出了公告,是有关于最近在 http 到 https 迁移中识别到的错误问题。
具体来说就是,某些页面不再出现在 Google 搜索中,是因为它们丢失了。
Search Console 通知如下: “Google systems identified that you recently migrated your site from HTTP to HTTPS. Approximately 80% of your HTTP pages that were indexed before migration can no longer be found in either your HTTP or HTTPS site. Therefore, these pages are no longer accessible from Google search. If these pages were moved to your HTTPS site, we encourage you to help us find them and include them in Google Search.” —–“Google 系统识别到您最近将站点从 http 移至 https 。
在迁移之前索引的 http 页面中,大约有 80% 会在 http 或 https 站点中消失。
因此,这些页面不再能够通过 Google 搜索访问。
如果这些页面被移动到了您的 https 站点,我们希望您能帮助我们找到这些页面,并将它们收录到 Google Search 中。
” Google 的 John Mueller 回答如下,他解释了通常情况下这些错误为什么会经常发生: “A lot of https migration problems come from bad or incomplete migrations, we’re trying to help folks when we spot these issues. Hope this kind of heads up is useful!” —–“许多 https 迁移问题源于糟糕的或不完整的迁移,我们发现了这些问题,希望这次的通知是有用的,并且可以帮到人们。
” 正如另一位 Twitter 使用者更简明地说到:“看起来我们需要一个拥有 SEO 知识的网页开发人员。
” Google 一再宣告,在执行这种迁移时,网站管理员需要给出明确的方向。
这意味著需要为每个页面重新设置导向。
如果不告诉 Google 在哪里找到这些新页面,Google 就无法自己找到他们。
此外,Google 还意识不到一个新页面不需要使用 rel=canonical 这样的指令或 301 重定向就能替换一个旧页面。
而站点迁移很少能顺利进行,所以至少 Google 现在会在找不到 http 页面的 https 版本时通知站长。
站点迁移到 https,过程比较复杂,如果没有处理好,考虑到公告中阐述的 “80% 的页面将丢失”,这将是一件十分严重的事情,那我们如何避免发生这样的情况? 其实上面 Google 有简单的支招,下面小支将为您著重阐述一下。
当 http 站点迁移到 https 时,并非是新建一个站点,如果操作出错,Google 就会认为您在新建一个站点。
在迁移过程中,会因为重复的内容,新的协议站点会被 Google 重新计算。
毕竟一个是为客户端与服务端提供加密协议,是安全可靠的,而另一个则不是。
这样,Google 就会显示两个网址: https://example.com http://example.com 这样就会出现内容重复的两个不同网页,很有可能会被 Google 降权、惩罚。
shutiao Google 会如何惩罚? 如果网站被 Google 惩罚,Google 会将网站页面从索引资料库抽走,导致搜索使用者不可能从搜索查询结果中找到该页面。
再进一步,Google 可能会将网站的全部页面从索引资料库里抽走,导致使用者无法找到该网站的任何网页。
shutiao 如何避免 Google 视为重复的内容? 这种情况最好的方法是在所有的 http 页面使用 301 重定向到对应的 https 。
换个说法就是把每个页面都使用 SSL 证书,所有页面都使用 https 。
如果只在单个页面设置 https,那么该站点的访问者就会从安全连线跳转到非安全连线然后返回。
这种做法会给服务器带来额外的压力,因为 SSL 握手过程是一个复杂的过程。
并且也存在风险,不法分子也利用不安全协议开启攻击媒介。
shutiao 竞争对手可以使用您的配置错误 目前,有些服务器就算没有安全的证书也可以向访问者提供 https 页面。
假设竞争对手使用 https 协议连结到您的 http 站点,Google 会将其视为重复的内容。
Google 将会把您的内容编入索引。
如果他们不使用 https 和没有重定向,服务器将不提供页面。
因此,使用 https 连结到您的 http 站点时就可能会建立一条错误讯息 “站点无法访问” 。
其他建议 规范标签–让其重定向,将页面的标签规范,将有助于告诉 Google 在搜索结果中显示哪个页面。
测试服务器–服务器如何响应安全和不安全连结的请求?使用者需要新增更多的 301 来弥补。
检查 404–这只是良好的习惯,使用 Google Search Console 来查询和补救网站正在生产的任何 404 错误。