Google 是一家价值数十亿美元的公司。它是万维网内外的主要参与者之一。该公司依靠分布式计算系统为用户提供访问、创建和更改数据所需的基础设施。Google 肯定会购买最先进的计算机和服务器来保持系统顺畅运行,对吗?
错了。为 Google 运营提供动力的机器并非拥有众多花哨功能的尖端高性能计算机。事实上,它们是运行 Linux 操作系统的相对廉价的机器。为什么万维网上最具影响力的公司之一会依赖廉价硬件?这是由于Google 文件系统(GFS)的存在,它利用了现成服务器的优势,同时弥补了任何硬件弱点。这一切都体现在其设计中。
广告
Google 使用 GFS 来组织和操作庞大的文件,并为应用程序开发人员提供他们所需的研究和开发资源。GFS 是 Google 独有的,不予出售。但它可以作为具有类似需求组织的 文件系统的模型。
GFS 的一些细节对于 Google 外部的人来说仍然是个谜。例如,Google 不会透露它使用了多少台计算机来运行 GFS。在 Google 官方文件中,该公司只说系统中有“数千”台计算机(来源:Google)。但尽管有这层保密性,Google 已经将 GFS 的大部分结构和操作公之于众。
那么 GFS 到底有什么作用,为什么它很重要?请看下一节。
广告