Total Pageviews

Friday, 10 February 2012

Google是如何搜集互联网信息的?

 Google的使命是:“整合全球信息,让人人可用,人人受益”。它也正在很好地兑现这个诺言。然而,Google正在收集的信息似乎比我们意识到的还要多。

1. 搜索(网页、图片、新闻和博客等)- 众所周知,Google是全球最受欢迎的搜索引擎,其全球市场占有率几近70%(比如,美国本土占66%)。Google追踪所有的搜索,其现在的搜索方式也越加个性化,个性化势必将越来越细化。

2. 搜索结果中的点击- Google不仅能知道我们要找什么,它也知道我们点击了哪些搜索结果。(编者注:这个做SEO的朋友应该很清楚,可以从Google Analytics中知道。)

3. 网页检索- Google的网页爬虫Googlebot就是一只不知疲倦的小蜜蜂,一直不停地“品读”和收录数十亿的网页。

4. 网站分析- Google Analytics是目前最受欢迎的网站分析工具。因其免费并支持多种高级特性,全球大量网站正使用它。

5. 广告服务- Adwords和Adsense是Google财务成功的基石,但它们也给Google提供了大量的有价值的数据。网民点击了那些广告,广告主在竞争哪些关键字,哪些关键字最值钱等等。这些信息都是非常有用的。

6. 电子邮件- Gmail是全球三大电子邮件服务之一,面临着来自微软的Hotmail还有雅虎的Email的竞争。邮件内容,包括发送内容和接收内容,都是可以解析和分析的。即使是从安全角度来看,这也是Google的一项优秀服务。Google的邮件安全服务——Postini,要从海量Gmail用户中,接收超大量的数据,包括垃圾信息、恶意软件和邮件安全趋势数据。(编者注:2007年,Google以六亿二千五百万美元的价格收购网络安全服务商 Postini,以此为Google的小型商务客户提供更好的电子邮件安全服务。)

7. Twitter- “你所有的Twitter消息都是我们的”,这句话用来解释早期的网络快速传播现象(又称“网络爆红现象”)。在09年和Twitter达成交易后,Google可以直接访问Twitter上所有的消息。

8. Google应用服务(文档、电子表单和日历等) – Google的办公套件有很多用户,它当然也是Google的一个数据收集来源。

9. Google公开的个人资料- Google鼓励你把你的个人资料在网络上公开,这些资料包括你活跃在哪些社交网站(Facebook或Linkedin),你的个人主页和在线图片等等。

10. Orkut- 虽然Google的社交网络还并不是很成功,但Orkut在巴西和印度还是很成功。

11. Google Public DNS- Google2009年年末推出的DNS服务并不只是帮助网民获得更快的DNA解析,也同时帮助Google自己。因为从这项服务中,Google可以获得大量的统计数据,比如网民访问了哪些网站。

12. Chrome浏览器- Chrome可以收集你的浏览器行为,还有访问哪些网站。

13. Google财经- 除了财经数据之外,用户在Google财经上搜索的信息和使用的信息都是Google的重要数据。

14. YouTube- 这个目前是全球最大最受欢迎的视频网站,为Google所有。它也向Google提供了大量的用户观看习惯方面的数据。

15. Google翻译- 帮助Google完善其自然语言解析和翻译。

16. Google Books- 虽然现在不是很庞大,但有潜力帮助Google知道网民阅读习惯和他们想阅读什么东西。

17. Google阅读器- 目前为止是全球最受欢迎的Feed阅读器。你订阅了哪些RSS种子?你在看哪些博文?Google会知道的。

18. Feedburner- 很多博客都使用Feedburner来公开其RSS种子。Google追踪Feedburner的每一条链接。

19. Google地图和 Google Earth- 你对哪些地方感兴趣?(Google也会知道的)

20. 你的联系人网络- 你在Gtalk和Gmail等上的联系,组成了一张错综复杂的用户网。如果他们都使用Google,网络映射更为深刻。虽然我们不知道Google是否做了这个,但这上面的数据是可以收集的。

即将推出的- Chrome OS等Google更多可能成功的产品。

刚推出不久的- 即时搜索和Goo.gl等服务

已经消亡的- Google Wave等(虽然消亡了,应该死前收集了一些数据吧。)

正所谓“天下没有免费的午餐”,Google给网民提供这么多免费服务,实际上是网民用自己的信息换来的。

No comments:

Post a Comment