Google 图书是如何运作的

如果 Google 成功,你最终将能够使用关键词搜索找到几乎所有已出版书籍中的文本。查看更多热门网站图片
截图来自 十万个为什么.com

当谢尔盖·布林和拉里·佩奇推出谷歌时,他们创造了一个互联网巨头,让信息更容易找到。但他们意识到,如果没有人类那些明显是模拟格式的书籍中包含的信息,在线信息将永远存在一个巨大的空白。

为了弥补这一空白,Google Print(现称 Google 图书)应运而生,其目标是数字化整个图书馆的藏书。这些书籍上线后,任何有互联网连接的人都可以使用关键词搜索来查找涵盖整个出版历史的信息。这个项目的影响以无数种方式深远。

广告

例如,学者可以使用该服务查阅埃及开罗的珍稀手稿。医学研究人员可能只需几周而非几年就能浏览世界各地的研究,大大缩短了研究时间。各种科学研究也能在加快的时间表内完成。当然,高中生和大学生可以以极快的速度完成研究论文,并获得更好的引用和更高质量的信息。

Google 图书的支持者还认为,一旦世界上的书籍宝库被数字化,它们将更加安全。火灾和地震等自然灾害曾摧毁大片书面历史,但不会毁坏一个在多个位置存储冗余文件副本的数据库。在线存储库更适合抵御战争和政治动荡。此外,还有一个简单的事实:纸张会随着时间老化变得脆弱。有些作品图书馆员必须特别小心保管,以防它们散架。

简而言之,Google 图书可能意味着比以往任何时候都更多的人能够更好地获取更多信息。它可能以我们目前无法想象的方式彻底改变互联网。

但与所有革命一样,Google 图书项目也并非没有争议。来自世界各地的公民、政治家和公司对 Google 图书相关的隐私、版权法和反垄断问题持有正当的担忧。继续阅读,了解 Google 如何快速扫描数百万页书籍,以及一些人如何竭尽全力阻碍这个大胆的项目。

广告

Google 图书扫描与策略

Google 计划扫描并索引整个图书馆,例如斯坦福大学的图书馆。
Justin Sullivan/盖蒂图片社新闻

不言而喻,扫描数百万本书是一项艰巨的任务。仅仅技术挑战就非常巨大。传统的扫描设备使用一个玻璃板,将每页完全压平,以确保 OCR(光学字符识别)软件能够识别正在数字化的页面上印刷的字母和数字。一旦扫描,这些字符就可以通过计算机进行编辑和搜索。

为了消除对玻璃板的需求并减少对要保存的书籍造成损坏的可能性,Google 申请了一项新的书籍扫描流程专利。工作人员只需将书籍放在一个开放式书籍扫描仪上,该扫描仪既没有玻璃板,也没有任何其他会压平书籍的设备。Google 的高级软件会扫描书籍并考虑到页面的弯曲度,这意味着字符识别不会降级。这些扫描仪的工作速度约为每小时 1,000 页。

广告

Google 与主要图书馆达成协议,启动了该项目。纽约公共图书馆以及哈佛大学、密歇根大学和斯坦福大学的图书馆都同意让 Google 扫描它们的藏书。在这些机构的帮助下,Google 已经扫描了大约 1200 万册图书[来源:von Lohmann]。

该项目的广度意味着其最大的希望在于让人们能够接触到原本永远无法看到书籍。佛罗里达州的学生可以查阅该国另一端的特殊美国原住民藏品。那些无力前往法国查阅古代文献的人可以在自己的客厅里浏览这些巨著。多亏了 Google 的额外努力,视力受损者可以通过放大显示器、使用盲文设备或通过朗读技术收听文档来阅读书籍。

最初,Google 图书计划只数字化公共领域的作品,这约占所有书籍的 20% [来源:Toobin]。在美国,书籍在作者去世 70 年后进入公共领域;作为公共领域作品,它们不再受版权保护。

然而,随着谷歌的扫描,它开始甚至对受版权保护的文本进行数字化。该公司并未将受版权保护的材料完整地在线发布,而是将在线内容限制在书籍内容的约 20%。谷歌声称这是对受版权保护材料的合理使用。

其他人强烈反对。美国作家协会和美国出版商协会提起集体诉讼,加剧了美国和世界各地对Google图书的争议。

广告

Google 图书争议与拟议和解

版权、访问和利润问题是 Google 图书辩论的核心。权利人希望对其作品的发行拥有更多控制权,他们也希望分享 Google 从其数字档案中产生的利润。另一方面,Google 希望对其正在数字化的信息拥有更多控制权——有了更好的控制,Google 图书不仅会成为世界上最大的图书馆,它也可能成为世界上最大的书店。

在与作者协会和美国出版商协会的初步和解中,谷歌同意向原告支付 1.25 亿美元,并对其使用 Google 图书数据库的方式进行一些更改。谷歌同意创建一个图书版权登记处,供作者和出版商解决版权索赔[来源:Metz]。

广告

通过登记处,权利人可以选择退出Google图书项目,拒绝让Google展示其作品。当然,如果您是来自其他国家的作者或出版商,并且不了解该登记处,您很容易错过选择退出截止日期,这意味着Google图书将自动开始将您的作品纳入其搜索结果。

除了登记处之外,最初的和解方案将赋予 Google 独家许可,以扫描和发布孤儿作品的页面。这些书籍仍受版权保护,但无法追踪到版权所有者。Google 还可以销售这些书籍的数字下载版,并根据登记处提供的指导自行定价。

相关方质疑和解的公平性。他们认为,Google公然的版权侵权引发了一场诉讼,而这场诉讼随后反而赋予了侵权公司对其复制材料更大的权力。美国司法部也介入其中,鼓励各方用更公平的版本替换该和解协议。

在和解协议的修订版本中,Google 图书同意删除所有在美国、英国、加拿大和澳大利亚境外出版的书籍。它还设立了一名受托人,负责管理从孤儿作品访问中获得的版税。因此,这笔收入可能最终不会流入 Google 的金库,而是落入最终被找到的版权所有者手中——如果找不到,收益可能会用于资助促进扫盲的慈善机构[来源:Samuelson]。

另一项修改解决了 Google 独家许可使用孤儿作品牟利的问题。从理论上讲,新的和解方案应该能让其他公司更好地与 Google 图书竞争。

广告

为何Google图书引起如此大的争议?

许多人反对 Google 在世界各地拍摄街道和房屋的照片。你对 Google 追踪你的阅读习惯有何看法?
Harold Cunningham/盖蒂图片社新闻

Google 图书在版权问题上无疑触及了危险地带。这里只有一个和解协议不太可能解决的问题:美国法院有什么权利代表数百万不了解或不关心 Google 图书的权利人发言?但对于许多反对者来说,版权侵权只是该项目的一个令人不安的方面。

其他反对者更担心隐私问题。例如,尽管 Google 图书有隐私政策,但谷歌仍有可能追踪你的阅读内容,甚至具体到页面,包括日期和时间。

广告

由于Google是一个营利性组织,它从其不断增长的图书索引和从用户那里收集到的相关跟踪数据中获取收入是理所当然的。当Google展示公共领域和受版权保护的书籍片段时,它还会显示与书籍及其主题相关的相邻广告,提供销售相关内容的产品。这种定向营销是一种可靠的收入来源。如果Google可以利用这种详细数据获取商业利益,它也可以将其用于更邪恶的目的。

利润问题也受到威胁。作者和出版商看到谷歌展示他们的作品并从中获利,于是他们通过诉讼进行反击。他们声称谷歌显然正在大规模侵犯版权,并在此过程中从其行为中获利。尽管谷歌没有显示受版权保护书籍的全部内容,但未来又有什么能阻止该公司这样做呢?

从技术和哲学层面来看,谁能阻止 Google 审查书籍的部分内容,或者删除整个文本?而且由于法律和解允许作者和出版商选择退出图书版权登记数据库,权利人也存在一种自我审查的潜在形式。

如果对 Google 图书权威日益增长的依赖实际上导致了信息鸿沟呢?一旦人们开始假设 Google 已经扫描了所有书籍,他们似乎也会理所当然地认为,如果信息不在 Google 图书上,那它就不存在。

更重要的是,如果 Google 图书构成垄断呢?如果 Google 成为世界图书的数字中心,该公司将控制知识的获取。那么 Google 可能会向希望利用 Google 图书数据库的组织收取巨额费用。

广告

Google 图书受到抨击

谷歌继续扫描图书,迅速建立其数据库,并将其内容用于自身目的。与此同时,竞争对手、隐私倡导者和联邦当局正在密切监控该项目。

同时,Google 图书能否经受住时间的考验仍有待观察。Google 的这项进取项目会增加所有拥有计算机访问权限的人的知识和理解吗?还是该公司会把知识巩固为权力,建立一个巨大的垄断,然后对其藏品收取高额费用?

广告

Google 图书会非常小心地保护用户隐私吗?还是会将详细的跟踪信息出售给一个乐于利用私人信息获取一切可能经济利益的公司?

科学家们会利用 Google 图书的力量解决人类面临的一些最紧迫的问题吗?随着指尖触手可及的知识增多,或许他们会合作,在短短几年内消除世界饥饿,治愈可怕疾病,并将技术推向惊人的高度。抑或他们会因数据库过于庞大和笨重而阻碍了本应帮助的人们?

简而言之,谈到Google图书及其对人类的潜在影响,问题多于答案。该项目的规模如此巨大,可能的结果如此深远,以至于没有人真正知道这条路将通向何方。

许多评论员都认为,无论接下来的法律诉讼结果如何,关于 Google 图书的斗争才刚刚开始,战场正在美国和国外同时形成。一名法国法官最近支持了起诉 Google 的出版商,Google 不得不删除其数据库中所有受版权保护的法国材料,并支付侵权赔偿金。

尽管这是一个充满深奥法律和经济术语的令人困惑和复杂的问题,但 Google 图书之争值得关注。你可能会见证有史以来最强大的知识共享网络的诞生。

广告

常见问题解答

Google 图书免费吗?
是的,Google 图书是免费的。您可以通过 Google 图书网站找到它们,该网站包含一个搜索引擎,允许您根据关键词、作者和标题查找书籍。

更多信息

相关十万个为什么文章

更多精彩链接

  • Bartz, Diane。“谷歌希望也将书籍出售给Kindle用户。”路透社。2009年12月11日。(2009年12月19日) http://www.reuters.com/article/idUSTRE5BB0DH20091212
  • Boulton, Clint。“谷歌屈服于联邦贸易委员会,为Google 图书创建隐私政策。”Eweek。2009年9月4日。(2009年12月19日) http://www.eweek.com/c/a/Search-Engines/Google-Bows-to-FTC-Creates-Privacy-Policy-For-Google-Books-763554/
  • Boulton, Clint。“也许谷歌应该放弃谷歌图书搜索的幽灵。”Eweek。2009年11月20日。(2009年12月19日) http://googlewatch.eweek.com/content/google_book_search/maybe_google_should_give_up_the_google_book_search_ghost.html
  • Clements, Maureen。“谷歌图书扫描机器的秘密揭示。”美国国家公共电台。2009年4月30日。(2009年12月19日) http://www.npr.org/blogs/library/2009/04/the_granting_of_patent_7508978.html
  • Crumley, Bruce。“欧洲与谷歌:下一章。”《时代周刊》。2009年12月11日。(2009年12月19日) http://www.time.com/time/world/article/0,8599,1946920,00.html
  • Deahl, Rachael。“密歇根大学校长致AAP:谷歌是好的。”《出版人周刊每日》。2006年2月8日。(2009年12月19日) http://www.publishersweekly.com/article/CA6305725.html
  • Eckersley, Peter。“Google 图书和解协议:促进竞争,托管扫描件。”电子前沿基金会博客。2009年6月11日。(2009年12月19日) http://www.eff.org/deeplinks/2009/06/should-google-have-s
  • Faure, Gaelle。“法国法院叫停Google 图书项目。”《洛杉矶时报》。2009年12月19日。(2009年12月19日) http://www.latimes.com/news/nation-and-world/la-fg-france-google19-2009dec19,0,548537.story
  • Fister, Barbara。“未定:关于Google 图书和解协议的问题。”《图书馆杂志》。2009年12月10日。(2009年12月19日) http://www.libraryjournal.com/article/CA6711187.html Frommer, Dan。“Google 如何扫描图书。”《硅巷内幕》。2009年5月3日。(2009年12月19日) http://www.businessinsider.com/how-google-scans-books-2009-5
  • Google。“Google 图书和解。”(2009年12月19日) http://books.google.com/booksrightsholders/
  • Kahle, Brewster。“谷歌的图书抢夺。”《华盛顿邮报》。2009年5月19日。(2009年12月19日) http://www.washingtonpost.com/wp-dyn/content/article/2009/05/18/AR2009051802637.html
  • Kang, Cecilia。“《华盛顿邮报》科技版解释谷歌修订后的图书和解协议:视频。”《华盛顿邮报》。2009年11月24日。(2009年12月19日) http://voices.washingtonpost.com/posttech/2009/11/post_tech_explains_googles_rev.html
  • Toobin, Jeffrey。“Google 的月球计划。”《纽约客》。2007年2月5日。(2009年12月19日) http://www.newyorker.com/reporting/2007/02/05/070205fa_fact_toobin
  • MacMillan, Douglas。“Google 图书:先扫描,后提问。”《商业周刊》。2009年11月14日。(2009年12月19日) http://www.businessweek.com/the_thread/techbeat/archives/2009/11/google_books_sc.html
  • Metz, Cade。“Google 图书:它是最后的图书馆吗?”《The Register》。2009年8月29日。(2009年12月19日) http://www.theregister.co.uk/2009/08/29/google_books/
  • Metz, Cade。“谷歌对电子书垄断主张不屑一顾。”《The Register》。2009年8月5日。(2009年12月19日) http://www.theregister.co.uk/2009/08/05/google_book_defense/
  • Metz, Cade。“谷歌以1.25亿美元和解图书搜索诉讼。”《The Register》。2008年10月28日。(2009年12月19日) http://www.theregister.co.uk/2008/10/28/google_settles_book_suit/
  • Oder, Norman。“萨缪尔森表示她对Google和解协议有相同的定价和隐私担忧。”《图书馆杂志》。2009年11月18日。(2009年12月19日) http://www.libraryjournal.com/article/CA6707799.html
  • Samuelson, Pamela。“从法律角度看:Google图书搜索和解协议中的‘死灵魂’。”O'Reilly Radar。2009年4月17日。(2009年12月19日) http://radar.oreilly.com/2009/04/legally-speaking-the-dead-soul.html
  • Schonfeld, Erick。“扫描你的图书并在Google上搜索。”TechCrunch。2009年6月7日。(2009年12月19日) http://www.techcrunch.com/2009/06/07/scan-your-books-and-search-them-on-google/
  • Singel, Ryan。“关于所有图书馆的谷歌之争:Wired.com 常见问题解答。”Wired。2009年4月30日。(2009年12月19日) http://www.wired.com/epicenter/2009/04/the-fight-over-the-worlds-greatest-library-the-wiredcom-faq/
  • Von Lohmann, Fred。“Google 图书和解协议 2.0:评估访问权限。”电子前沿基金会博客。2009年11月17日。(2009年12月19日) http://www.eff.org/deeplinks/2009/08/google-book-search-settlement-access
  • Vyas, Ravi。“触手可及的世界。”《电讯报》。2009年12月11日。(2009年12月19日) http://www.telegraphindia.com/1091211/jsp/opinion/story_11843045.jsp

广告

加载中...