Wolfram|Alpha 的工作原理

A sample results page from Wolfram|Alpha
Wolfram|Alpha 示例结果页面
图片来源: Wolfram Research

2009年3月5日,斯蒂芬·沃尔夫拉姆在他的公司博客中发表了一篇文章,介绍了他一直在开发的一款新产品。沃尔夫拉姆写道,不久之后,Wolfram Research 将发布一款能够回答自然语言提问的新引擎。

至少在美国,互联网搜索由谷歌主导。2009年3月,该公司占据了美国搜索市场的64.2%份额,其次是雅虎的15.8%和Windows Live的10.3%[来源:Nielsen Online]。沃尔夫拉姆的声明登上了科技网站的头条。但如果像雅虎和微软这样的巨头都无法将谷歌从其宝座上拉下马,为什么还会有人关心Wolfram Research及其新网站呢?

广告

实际上,这可能部分是因为人们喜欢大卫与歌利亚式的故事,其中弱者挑战强者并成功,尽管困难重重。但在M2这个故事中,大卫拥有一个巨大的弹弓。1988年,Wolfram Research发布了一款名为Mathematica的软件,这是一款备受推崇的程序,可以帮助人们以各种方式处理数据。在创建Wolfram|Alpha时,Wolfram Research找到了一种处理用户问题中的数据并以新颖、创造性的方式显示结果的方法。正因为它的来源知名且可靠,当斯蒂芬·沃尔夫拉姆宣布时,人们都竖起耳朵倾听。

那么 Wolfram|Alpha 到底是什么?它有什么作用,对谷歌有威胁吗?

广告

计算知识引擎

Wolfram|Alpha search results page
Wolfram|Alpha 会根据您的提问,提供搜索结果的视觉呈现。
图片来源: Wolfram Research

Wolfram|Alpha 于2009年5月15日上线。许多早期用户期望它像搜索引擎一样工作,因此抱怨该网站无法返回某些简单查询的结果。但与谷歌——以及其他搜索网站——不同,Alpha 并非旨在编目全球信息。相反,Wolfram Research 称其为计算知识引擎。

传统的搜索引擎会抓取网页并将其添加到目录中。这些搜索引擎代码中内置的算法会根据多种因素对页面进行排名。其中一个因素是点击搜索结果页面(SERP)链接的人数。另一个因素是链接到该网站的第三方网站数量。如果您创建一个公共网站,很有可能它最终会出现在搜索引擎上,而您无需采取任何措施即可将其列出——只要有其他网站链接到它。

广告

Wolfram|Alpha 不会扫描网页以获取资料。相反,它依赖于 Wolfam Research 员工授权的数据库以及由其员工输入、标记和编目的内容。据该公司称,在该网站上线时,Alpha 服务器上存储了超过10万亿个独立数据块[来源:Wolfram Research]。Wolfram Research 员工会对所有信息进行核实,以确保其准确性,然后才将其添加到 Wolfram|Alpha 数据库中。

为了获取这些信息,用户在Wolfram|Alpha主页的搜索框中输入查询,然后按下右侧的等号——等号暗示后台正在进行数学运算。然后,Alpha会在其数据库中搜索相应的M2数据。

结果可以非常简单:输入一个城市名称,您将获得当天的时间和天气信息,以及人口和海拔高度。输入多个城市名称,您将获得一个表格,可以比较它们。如果您输入一个动物的名称,您将获得平均大小、别名、学名,甚至是其分类的详细信息。同样,如果您向 Alpha 询问不同动物的名称,您将获得一个比较它们的表格,甚至可以看到它们在分类学上的关系。

科学和数学问题对Alpha来说很容易处理。事实上,您可以要求计算知识引擎推导一个微积分问题,它不仅会告诉您答案,还会向您展示解决问题所需的步骤。

但请记住,Wolfram|Alpha 不是搜索引擎,这意味着如果您想查找名人图片、飞往伦敦的最便宜机票或有关特定主题的文章,您需要使用搜索引擎。Alpha 旨在让您提出问题并获得事实正确的答案,以及对该答案的视觉解释。

广告

Wolfram|Alpha 的幕后功臣是什么?

Stephen Wolfram
斯蒂芬·沃尔夫拉姆
图片来源: Wolfram Research

斯蒂芬·沃尔夫拉姆年仅15岁时,就发表了他的第一篇科学论文。20岁时,他获得了加州理工学院理论物理学博士学位。沃尔夫拉姆于1981年获得麦克阿瑟奖学金,大约就在那时,他开始研究自然系统及其复杂性。

沃尔夫拉姆于1973年开始使用计算机。1986年,他的公司Wolfram Research发布了其备受推崇的Mathematica软件的第一个版本。Mathematica被广泛应用于工程、科学和金融等各种行业,并能够进行高端计算和建模。Mathematica的算法被用于计算和显示Wolfram|Alpha中的搜索结果。

广告

2002年,斯蒂芬·沃尔夫拉姆出版了一本名为《一种新科学》的书,他在书中解释了他相信简单规则可以解释复杂问题的观点。正如沃尔夫拉姆在2009年3月的博客文章中解释的那样,他书中的原则和Mathematica软件提供的计算能力使他相信可以创建Alpha。

沃尔夫拉姆的目标之一是“让计算机能够回答任何事实性问题,并计算出答案”[来源:Wolfram]。但自然语言处理并非易事。根据Wolfram Research的说法,该网站使用算法和分析软件来识别数据中的模式。这有助于它识别人们用来提问的速记术语。这有助于它猜测当您在其搜索框中输入查询时,您试图找到什么。

举个例子,如果你输入“GEC”,Alpha 假设你是在问通用电气公司。如果你用逗号将字母分开,你就会得到音符和它们在键盘上的可视化显示。点击“播放音符”链接可以听到乐段的进行——也许如果你是美国人,你就能猜到通用电气是哪个主要电视网络的控股母公司。Wolfram|Alpha 会根据你输入搜索词的方式,猜测你正在试图寻找的信息。

Wolfram Research 表示,Alpha 基于四个支柱:数据、动态计算、自然语言理解和计算美学。数据由 Wolfram Research 员工处理。其余部分则通过 Mathematica 在后端完成。

要处理这类数字,你需要强大的计算机能力。Wolfram Research 拥有一台超级计算机(实际上是两台),它使用戴尔硬件,并由一家名为 R Systems 的公司定制。这台机器名为 R Smarr,是世界上第66快的超级计算机(截至本文撰写之时)。R Smarr 拥有4,608个处理器核心,每秒可执行39.6万亿次操作。每台 R Smarr 超级计算机内部有576个四核英特尔“Harpertown”Xeon 芯片,并且拥有65,536 GB 的随机存取存储器(RAM)[来源:Shankland]。

广告

Wolfram|Alpha 对比 谷歌

Wolfram|Alpha search results page
输入“Google and Wolfram Alpha”,您将看到两家公司的比较。
截图来源:十万个为什么.com

既然这么多人想让搜索巨头谷歌与这个新来者一较高下,那我们何不把它们俩拿出来看看,它们到底表现如何呢?

根据 Wolfram|Alpha(其信息来源于 Alexa.com),截至本文撰写时,google.com 每天获得38亿页面浏览量。而 Alpha 则每天获得1300万页面浏览量。谷歌在网络排名中位居第一,而 Alpha 则排名第568位。

广告

但这并未道出全部真相。谷歌的收入来自广告。仅2008年,谷歌的营收就达到了210亿美元——其中99%与广告相关[来源:Buley]。Wolfram Research 也通过广告来补贴其网站,它使用一个出现在某些搜索结果右侧的上下文“特色赞助商”框。

Wolfram|Alpha 可能需要寻找其他方式来创收。该网站幕后有大约250人工作[来源:Shankland and Needleman]。人工策划数据比派遣爬虫编目网站成本更高,也更耗时。Alpha 在发布时使用的数据库花了三到四年时间才建成[来源:Beaumont]。

另外,Wolfram Research 也有可能向希望将其专有信息与 Alpha 数据库进行比较的组织出售定制订阅服务。此外,还有一个应用程序编程接口(API),它将允许开发者将自己网站的功能与 Wolfram|Alpha 融合[来源:Shankland and Needleman]。

但谷歌联合创始人兼技术总裁谢尔盖·布林在网站发布前,曾亲自接受斯蒂芬·沃尔夫拉姆演示Wolfram|Alpha技术[来源:Levy]。这表明两者可能会找到合作方式。另一方面,一些人认为谷歌推出的Google Squared(一项搜索功能,将使谷歌用户能够以类似于Alpha的方式比较数据)表明了其扼杀新贵的愿望。然而,Google Squared评估的是在线数据,而非Alpha所使用的独家专有数据库[来源:Talbot]。

正如斯蒂芬·沃尔夫拉姆在2009年3月的博客文章中所说,Alpha 是一个巨大的项目,永远不会完成。时间将证明它能否在互联网用户心中占据一席之地,或者其技术最终是否会成为其他网站搜索工作的基石。

如需了解更多关于互联网搜索技术及相关主题的信息,请查看下一页。

广告

更多精彩信息

相关十万个为什么文章

更多精彩链接

  • Beaumont, Claudine. "Can Wolfram Alpha take on Google?" Telegraph.co.uk. May 14, 2009. (May 18, 2009) http://www.telegraph.co.uk/scienceandtechnology/technology/5319890/Can-Wolfram-Alpha-take-on-Google.html
  • Buley, Taylor."Calculating Wolfram Alpha's Business." Forbes.com. May 15, 2009. (May 18, 2009) http://www.forbes.com/2009/05/15/wolfram-alpha-internet-technology-internet-wolfram-alpha.html
  • Helft, Miguel. "The Veil is Lifted From Wolfram Alpha." Bits. The New York Times. April 28, 2009. (May 18, 2009) http://bits.blogs.nytimes.com/2009/04/28/wolfram-alpha-veil-lifted/
  • Levy, Stephen. "Stephen Wolfram Reveals Radical New Formula for Web Search." May 11, 2009. Epicenter. Wired.com. (May 11, 2009) http://www.wired.com/epicenter/2009/05/blog_epicenter_0511_wolframlevy
  • Nielsen Online. "Nielsen Online Announces March U.S. Search Share Rankings." April 10, 2009. (May 26, 2009) http://www.nielsen-online.com/pr/pr_090410.pdf
  • Shankland, Stephen. "Wolfram Alpha gets supercomputer boost." CNET News. May 12, 2009. (May 18, 2009)http://news.cnet.com/8301-11386_3-10238869-76.html
  • Shankland, Stephen and Rafe Needleman. "Wolfram Alpha shows data in a way Google can't." Webware. CNET.com. May 5, 2009. (May 6, 2009) http://news.cnet.com/wolfram-alpha-shows-data-in-a-way-google-cant
  • Stephen Wolfram, LLC. "About Stephen Wolfram." 2009. (May 18, 2009) http://www.stephenwolfram.com/about-sw/
  • Talbot, David. "Google Unveils Google Squared." Technology Review. May 12, 2009. (May 27, 2009) http://www.technologyreview.com/blog/editors/23522/
  • Wolfram, Stephen. "Wolfram|Alpha is Coming!" WolframBlog. March 5, 2009. (May 26, 2009) http://blog.wolfram.com/2009/03/05/wolframalpha-is-coming/
  • Wolfram Research. "Wolfram|Alpha: What is it, how does it work, and how did we build it?"

广告

正在加载...