大家都知道,在发布一个新网站的时候,最好配合一个最基本的XML Sitemap以更好的被搜索引擎索引。但其实对于小网站来说没啥必要,今天Google的John Mueller就在 Google Webmaster Help 里回答了大家的疑虑:
要看网站的规模大小,你不是非要有一个sitemap文件,我们也会自己索引到所有的内容。
当然,如果有一个sitemap文件的话,你可以随时查看独立的URL地址是否已经正确被索引了。
也就是说对于小站来说,Google完全有能力在没有sitemap的情况下索引到整个网站。如果你只是想查看URL地址是否被正确索引了的话,sitemap当然可以做到,但对于小网站来说这样有点多此一举,因为你完全可以将自己的地址输入到Google去搜索来看看被收录的情况,因为你的网站压根也没几页嘛。
Via SER
你是否曾经想过把视频,图片等不同文件类型包含在一个 Sitemap 文件里面?从今天开始这不再是奢求了,Google 已经正式提供了对包含多种文件类型的 Sitemap 的支持,如上图即是两个类似的 Sitemap 文件在 Webmaster Tools 中的效果。
多文件类型的 Sitemap 结构和标准的 Sitemap 十分相似,只需要额外包含内容类型的 URL 属性即可。以下是一个包含页面,图片以及视频内容的 Sitemap 文件示范。
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns="http://www.sitemaps.org/schemas/sitemap-image/1.1"
xmlns="http://www.sitemaps.org/schemas/sitemap-video/1.1">
<url>
<loc>http://www.example.com/foo.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
<video:video>
<video:content_loc>http://www.example.com/videoABC.flv</video:content_loc>
<video:title>Grilling tofu for summer</video:title>
</video>
</url>
</urlset>
需要注意的是,虽然这样一来不少 Sitemap 文件可以合并在一起,但是单个 Sitemap 最多包含5万个 URL 以及未压缩尺寸不得超过 10MB 这些限制依旧存在。
via webmastercentral
现在,你可以使用Sitemaps来告诉Google如何索引图片数据了,支持的字段包括images; image, location, caption, geographic location, title 和 license details。
比如最简单的例子:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>http://example.com/sample.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
</url>
</urlset>
这里还有更多技术细节。
Via Google Webmaster Central Blog
Google最近增加了一个Sitemap索引文件里的链接数量限制,从1000个增加到了50000个,暴涨50倍啊,这个是Caffeine带来的好处吗?
由于Sitemap可以嵌套,所以理论上你可以创建50000个包含50000个URL链接的Sitemaps文件,一次性提交给Google25亿个地址让它去索引……
Via Search Engine Roundtable
CommonCrawl通过自己的爬虫对全球400万个网站进行统计,结果显示有28%的网站都在使用Google Analytics进行访客统计,而有12%的网站都有加入AdSense广告计划,1%的网站有Google Webmaster Central认证码。
另外一些有趣的数字包括:
- 5%的网站不是有twitter链接就是有Facebook链接
- 2%的网站同时拥有twitter和Facebook链接
- 20%的网站使用flash
- 19%的网站有RSS feed
- 6%的网站有自己的sitemaps文件
- 1%的网站有Quantcast追踪代码
- 0.5%的网站有Creative Commons声明
Via Search Engine Land
再过去一年中,提交Sitemap的网站数量增长了2倍,毫无疑问,及时的更新,提交Sitemap对于网站被搜索引擎收录是非常有好处的。最近,Google改进了其对Sitemap的支持。
其中最重要是增加了支持的Child Sitemap(子Sitemap)的数量。以前,Google对一个Sitemap索引文件最多只能支持1000个子Sitemap,在最近一次的更新中,这个数字变成了50000,这意味着一个Sitemap索引文件中最多可以包含25亿个URL,我相信这已经可以满足一般大型网站的需求了。
其他更新还包括在Webmaster Tools中查看帐户中已验证过的网站的Sitemap功能等。
via Webmaster Central