Digg 的工作原理

作者:Julia Layton
Digg 的热门视图显示了获得最多“Diggs”的故事。查看更多热门网站图片
(HSW 截图,无署名)

这个互联网承载着海量信息,任何人都无法在一生中将其全部处理完。需要一支军队才能从海量新闻报道中挖掘并筛选出可管理的信息,然后另一支军队再从中挑选出普通网络用户可能感兴趣的信息片段。再然后,还需要一支军队来反馈这些信息是否真的引起了普通网络用户的兴趣。欢迎来到 Digg.com,这是一个由用户驱动的新闻网站,它汇集了成千上万的人,共同完成从网络各个角落查找、提交、审查和推荐新闻报道的工作。

Digg 有点像没有编辑的 Slashdot,为新闻提交网站带来了一种民主的方法。在 Digg 上,网站用户做出所有与内容相关的决策。在很大程度上,这种方法似乎运作得非常好。凯文·罗斯(Kevin Rose),曾是 TechTV 的一位节目主持人,于 2004 年 12 月联合创立了 Digg(在 Digg 前首席执行官 Jay Adelson 和 Owen Byrne 的帮助下)。罗斯花费 1000 美元开发并推出了 Digg.com,主要依靠开源软件。六个月后,该网站拥有约 25,000 名注册用户。一年后,Digg 拥有 80,000 名注册用户和每天 500,000 名独立访客。2007 年 3 月,Digg 达到了 1,000,000 名注册用户的里程碑。到 2008 年,一些博主估计 Digg 的用户群超过 2,700,000 个独立账户。

广告

庞大的 Digg 社区由扮演不同且通常相互重叠角色的用户组成。有提交者会发布他们在博客、专业新闻网站和网络上的随机帖子中发现的新闻故事。这些故事会进入 Digg 队列。有普通的评论者会在队列中寻找有趣的内容并“Digg”它——这意味着他们点击一个按钮,让 Digg.com 知道他们认为这个内容很棒。一旦一篇文章获得足够多的 Diggs(并满足许多其他秘密要求),它就会被推广到主页。还有一些真正敬业的评论者,他们每天花费数小时梳理队列,积极推广好故事并举报坏故事(这些故事最终会因收到足够的举报而被删除)。这些人真正推动了主页上的内容,从而使得成千上万的人点击阅读故事,有时甚至导致毫无防备的Web 服务器崩溃。当小型网站和家庭服务器每天 400 名访问者在两小时内突然变成 5,000 名时,它们可能会瘫痪。即使在 十万个为什么,我们的服务器可以处理流量,我们也能轻易判断何时被 Digg 了。当我们的统计数据显示单个文章每小时的点击量比正常流量增加数千次时,我们就会查看新闻聚合网站的领先者——Slashdot、Fark、Yahoo! Buzz 和 Digg——看看是哪家推送了它。

最后,还有 Digg 读者,他们构成了 Digg 用户的大多数,并受益于乐于将最佳故事推广到首页的 Digg 大军。作为回报,读者为 Digg 带来了广告收入,并为提交者和 Diggers 提供了事情可做。

虽然有些人可能称其前提是革命性的,但网站本身的基本功能相当简单直观。开始使用 Digg 很简单。当你访问 Digg.com 主页时,你已经看到了当前最热门的故事。它们已经获得足够多用户的 Digg,从而被推广到主页。

在下一节中,我们将介绍 Digg 的布局和注册流程。

广告

Digg 布局

Digg 的注册页面
(HSW 截图,无署名)

如果你想深入了解主页故事之外的内容,以下是你在 Digg.com 将采取的主要操作的细分说明:

注册

创建 Digg 帐户只需几秒钟。一旦拥有帐户,你就可以访问网站的所有功能,并在提交和 Digging 故事方面发挥积极作用。

广告

(HSW 截图,无署名)
(HSW 截图,无署名)
在提交你的故事之前,你应该指定它属于哪个类别。
(HSW 截图,无署名)

浏览和 Digg

Digg 上的“热门”标签显示了从用户那里获得最多 Digg 的故事。在 Digg 的“即将发布的故事”队列中浏览故事,并通过点击每个故事标题左侧的“Digg”按钮,让 Digg 知道你喜欢哪些故事。(你 Digg 的每个故事都会保存到你的帐户中,以便日后查看,因此你最终会得到一个你曾经 Digg 过的所有内容的运行列表。)一个故事获得的 Digg 越多,它登上主页的机会就越大。你还可以按类别浏览队列。

Digg 也有标签页,可以让你将内容源筛选为新闻故事、视频、图片和播客。你甚至可以自定义在你的 Digg 视图中显示的类别。对科技行业感兴趣,但对赛车运动毫不在意?没问题。只需点击几个复选框,Digg 就会筛选你的故事,让你得到你想要的一切。

评论

如果你发现一个你觉得特别有趣的故事,并想补充一些内容或与 Digg 其他用户讨论,只需点击故事描述下方的“评论”链接。你可以在评论页面的底部添加你自己的评论。

埋藏

作为一名 Digg 用户,我们很感谢你通过点击每个故事描述下方“问题”下拉列表中的相应链接来举报重复故事(不允许)、死链接、不正确的故事、过时内容、无趣内容以及垃圾邮件。当一个故事收到足够的举报或“埋藏”时,它就会从 Digg 队列中消失,只出现在搜索结果和用户个人资料中。

提交

最后,你可以自己发布一个故事到 Digg 队列中,并希望其他用户觉得它足够有趣,能够将其直接 Digg 到头版。看看你的故事是否能成功,这实际上很有趣。你所需要做的就是点击主页右上角的“提交故事”,进行关键词或 URL 搜索,如果你的故事尚未提交,则提供你正在发布的标题、链接和简短描述。

提交的内容会立即出现在“即将发布的故事”队列中,所有人都可以看到。

它要么获得足够的 Diggs 从而移到主页,要么在未获得足够 Diggs 或被多个用户举报的情况下最终消失。在下一节中,我们将介绍 Digg 的特殊功能。

广告

Digg 特殊功能

Digg BigSpy 应用程序使用字体大小来表示故事的受欢迎程度。
(HSW 截图,无署名)

我们已经介绍了大部分基础知识,但 Digg.com 还有更多功能可供你使用。它有点像一个集新闻网站、博客聚合器和“社交书签”中心于一体的平台。你可以在 Digg 使用的一些额外功能包括:

  • Digg 推荐 - Digg 的推荐引擎使用一种特殊算法,搜索 Digg 其他与你 Digg 过相同故事的成员。你可以使用该引擎结交朋友,或者只是留意你可能错过的故事。你可以通过在 Digg 的“即将发布”标签中浏览来使用推荐引擎,或者你可以切换到“全部”视图查看所有内容。
  • Digg 侦探 - Digg 侦探提供 Digg.com 活动的实时视图。你可以查看故事的提交、推广、Digg 和举报情况。
  • 社交书签 - 添加朋友并通过你自己的个人资料页面跟踪他们在 Digg 上的活动。
  • 播客 - 订阅 Diggnation 播客,收听 Digg 创始人及其伙伴每周讨论 Digg 上最热门的故事,并解决 Digg 相关问题。(参见播客的工作原理,了解这种大众媒体。)
  • 博客链接 - 只要你的博客托管在 Typepad、Blogger、Live Journal、Moveable Type 或 Wordpress 上,Digg 就提供一键博客发布任何故事的功能。只需点击任何故事描述下方的“博客故事”链接。(你也可以在自己的博客文章中添加一个“Digg 这篇文章”按钮,这样你的读者就可以立即将你的故事提交到 Digg。这不是 Digg.com 创建或认可的功能,但 Digg 似乎不介意人们这样做。)
  • RSS 订阅源 - 通过 RSS 订阅源将 Digg 新闻添加到你自己的网站。你有多种故事订阅选项——你可以自动添加所有 Digg 主页故事、所有你 Digg 或评论过的故事,以及你所有朋友 Digg 或评论过的故事。
  • 电子邮件故事 - 通过点击故事描述下方的“电子邮件此文章”链接,将任何故事通过电子邮件发送给朋友。
  • 阻止/举报用户 - 如果你发现你不喜欢某个特定用户的提交或评论,你可以阻止该用户,这样他或她所做的任何事情都不会出现在你的 Digg 视图中。如果该用户被足够多的 Digg 用户阻止,他或她可能会被 Digg 封禁。

除了这些特殊功能,Digg 的开发人员也一直在开发新的应用程序。Digg Labs 托管着以独特方式使用 Digg 的应用程序,例如跟踪图像在 Digg 上的使用情况或使用不同的视图显示故事。例如,BigSpy 应用程序使用不同大小的字体显示 Digg 故事——字体越大表示获得 Digg 越多的故事。 

广告

Digg 网站的用户端正在发生很多事情。从表面上看,这是一项自愿的集体努力,它不断产生值得查看的 Digg 主页——如果你考虑到支付人们执行相同工作的成本,这无疑是一个绝妙的商业策略。在幕后,Digg 拥有 75 名员工(计划到 2009 年底将此数字翻倍)和数百台服务器。在下一节中,我们将了解 Digg 运作背后的一些情况。

­

广告

Digg 技术

Digg.com 技术基础设施概述

对于一个每月(2008 年 5 月)获得超过 2.3 亿页面浏览量的网站来说,Digg 的技术框架相当精简。与任何专有系统一样,Digg 的技术部门不会将其所有内容公开供所有人效仿。但仍有一些零星的信息可供收集。整个设置基于 LAMP(Linux、Apache、MySQL、PHP/Perl/Python),这是一种将运行 PHP 等服务器应用程序与 MySQL 数据库等结合起来的编程模型。它允许多种语言在系统架构上进行交互,最大限度地减少翻译延迟。

在 2006 年 6 月 14 日录制的 Diggnation 播客中,凯文·罗斯估计服务器总数约为 75 台。Digg 技术博客 2008 年的一篇文章指出,该公司拥有的服务器数量是保持 Digg 运行所需最低数量的 1.8 到 2.5 倍。根据该文章,Digg 的任何人都不知道公司实际拥有多少台服务器 [来源:Digg]。

广告

在接受 十万个为什么 的电子邮件采访时,Digg 前首席执行官杰伊·阿德尔森(Jay Adelson)将服务器识别为 Penguin Computing 和 Sun 服务器,并表示 Web 服务器运行 PHP 和 Debian Linux。操作系统,数据库服务器运行 MySQL 数据库管理软件。Digg 实际上不需要存储太多数据,因为它几乎只处理文本,但阿德尔森报告说目前的设置具有无限可扩展性。在 2005 年 12 月 Mad Penguin 的一次采访中,阿德尔森表示 Digg 正在“每月将基础设施翻倍以满足需求”。基本架构如下所示:

在这个系统中,用户提交并 Digg 故事,并利用 Digg.com 上所有其他可用功能。Digg 不使用任何 cookies,只使用服务器端存储,因此你的所有用户数据(过去的 Diggs、朋友、评论等)都保存在你的 Digg 个人资料中,而该资料保存在 Digg 数据库中。当你访问网站时,你需要实际登录,这在实践中可能作为一项初始安全措施,以确保每次访问的用户有效性。系统在不同点内置了多项合法性检查,Digg 称之为“业力检查”。

  • 当用户尝试提交文章时,系统会检查提交是否合法——即它不是垃圾邮件(由计算机自动提交),并且用户是有效的(未被禁止或以其他方式受限)。根据阿德尔森的说法,业力系统还考虑了多种因素,其中包括 Digg 庞大用户群的某些“独特属性”。
  • 当提交的文章被推广到类别主页或头版时——这由包括 Diggs 数量和速度在内的多种因素决定——系统会检查以确保Diggs 的有效性。其中一项检查是查找仅为推广故事而创建的欺诈性账户。根据阿德尔曼的说法,“我们的业力系统知道仅仅为了 Digg 一个故事而创建的用户与和网站有互动过的用户之间的区别。”系统还会寻找自动 Digging,即计算机自动 Digging 故事以欺诈性地将其推广到主页的行为。

­

阿德尔曼证实,在幕后,Digg 没有进行任何编辑控制,无论是在提交、推广还是埋藏(从 Digg 队列中删除故事)方面。除了允许用户开启脏话过滤器以屏蔽脏话之外,对提交的内容没有进行任何审查。Digg 以与其他一切相同的方式管理“埋藏”——使用专有算法。系统运行一个“降级算法”,该算法决定何时将一个被举报的故事从网站主页面中移除。

这一切听起来都非常民主和具有前瞻性,Digg 正在将我们进一步推向大众化网络之路,将普通人转变为企业家、记者、编辑、股票交易员和百科全书贡献者。但在 2006 年年中发生的一些喧嚣,对 Digg 完全由用户驱动的性质提出了质疑——至少在少数精选且善于表达的人看来是如此。在下一节中,我们将探讨用户对 Digg 的回应。

广告

Digg 评论与投诉

你可以按类别筛选你的视图——这里是“热门”下的“技术”视图。
(HSW 截图,无署名)

引用科技博客 ForeverGeek 的 Macgyver 在 2006 年 4 月的话:“Digg 99% 都很棒。”尽管这位博主后来在与 Digg 创始人凯文·罗斯的一场旷日持久的争斗后改变了他对该网站的看法,但大多数人会告诉你,最初的评价仍然是正确的。人们争相在 Digg 上发布热门新闻故事;Digg 经常推出“璞玉”般的故事,从而发现一些鲜为人知但工作出色的博主;该网站的用户,在很大程度上,似乎真诚而无私地致力于推广最好的故事并埋藏最糟糕的故事。理论上,该网站的用户驱动性质创造了一个难以被腐蚀的新闻平台,至少不容易被大公司或过于热心的编辑腐蚀。当然,有些人会不同意,特别是关于最后一点——编辑控制的存在与否是 Macgyver 抱怨的基础,我们稍后会深入探讨。

在任何基于网络的社区中,都会存在抱怨。就 Digg 而言,长期以来最大的抱怨是关于文章评论,这些评论往往只是粗鲁或愚蠢,而不是发人深省或引发对话的。但按照惯例,随着网站的发展,对滥用潜力的担忧也随之增加。这些担忧主要涉及我们在上一节中提到的欺诈性 Digg 活动——垃圾邮件、欺诈性账户和自动 Digging。另一种可能的滥用涉及没有编辑控制的网站的营销潜力。不择手段的网站所有者可能会发布看似无法抗拒的故事,只为吸引 Digg 用户点击进入他们的网站,从而产生页面浏览量并增加广告收入。

广告

2006 年 3 月,Digg 注意到了一种特别奇怪的滥用可能性,当时一系列奇怪的帖子报道了 Google 将收购 Sun Microsystems 的谣言。这样的收购可能会让 Sun 的股价飙升。文章提交内容接连出现,一天之内至少有四篇,而且 Diggers 将其中几篇推广到了头版。在每种情况下,Diggers 似乎都是同一个人。事实上,这个谣言毫无根据,有些人想知道那些发帖者是否试图利用 Digg 散布虚假谣言,以期抬高 Sun 的股价从而牟利。

那么,回到“99% 都很棒”的评价,可以合理地假设另外的 1% 可能与 Digg.com 不可避免地未能捕获所有垃圾邮件、自动 Digging 和其他恶意使用该网站的行为有关。它每天处理超过一百万访客和 1,500 份提交内容。但 Macgyver 最终的抱怨——正是这场在各地科技博客上报道的“小战役”的起因——却与这些都无关。

在下一节中,我们将了解更多关于 Digg 争议的信息。

广告

Digg 争议

“即将发布的故事”视图向你展示 Digg 上最新的提交内容。
(HSW 截图,无署名)

它开始于一场悄无声息的小事件。Macgyver 是 ForeverGeek 和 Digg 的常客,他在 Digg 上发现了一件奇怪的事情——同一个用户提交的两个故事,其 Digg 者几乎完全相同,且 Digg 顺序也几乎一致,却都被推广到了头版,而每个故事的 Digg 者之一恰好是凯文·罗斯。虽然 Macgyver 没有得出结论,但显而易见的结论是 Digg 遗漏了一个自动 Digging 的实例。凯文·罗斯作为 Digg 者之一的这种额外奇怪之处更难解释,Macgyver 就此打住。他在 ForeverGeek 博客上发布了他的观察结果。

一个有些奇怪的举动是,一位 ForeverGeek 读者(不是 Macgyver)将这篇博客文章提交给了 Digg。他们很快发现,该故事变得无法被 Digg(实际上被埋藏),并且 ForeverGeek 的 URL 被封禁——用户无法再提交 ForeverGeek 的故事。被埋藏的故事很快就从网站上彻底消失了。

广告

你可以在你的个人资料中调整设置,以便在登录 Digg 时创建自定义视图。
(HSW 截图,无署名)

Macgyver 随后发表了一篇题为“Digg 已被腐蚀:编辑的游乐场,而非用户驱动的网站”的博客文章,该故事迅速传播开来。在 Digg 官方博客上,凯文·罗斯发布了对争议的回应,基本上声明没有任何可疑之处。他说他 Digg 的故事是他觉得有趣的,如果当时发生了自动 Digging,他对此一无所知。他说,ForeverGeek 被封禁是因为它违反了 Digg 关于垃圾邮件和欺诈账户的政策。

Macgyver 没有就此罢休,称罗斯的回应是“(非)回应”,并在 ForeverGeek 上持续记录该事件,继续质疑该网站的核心前提——其缺乏编辑控制。很快,在没有任何解释的情况下,ForeverGeek 被 Digg.com 解禁,可以随意提交内容。

撇开这个未解决的小插曲不谈,Digg 在流量和资金方面似乎表现良好,并且有计划。最新版本的 Digg 包括涵盖所有类型新闻的新类别,而不仅仅是科学和技术,以及一个“热门 Digg 用户”功能,让你能够查看使用 Digg 网站的最活跃(因此也最有影响力)用户的活动。这种类型的跟踪使得发现你想添加到朋友列表中的人变得容易,以便你可以随时了解他们的 Digging 活动。

有关 Digg.com 及相关主题的更多信息,请查看下一页的链接。

广告

更多信息

相关 十万个为什么 文章

更多精彩链接

来源

  • Alex Bosworth 的博客。“Digg 的动态。”2005 年 12 月 23 日。http://www.sourcelabs.com/blogs/ajb/2005/12/dynamics_of_digg_1.html
  • Andrews, Robert。“Digg 或许会埋葬 Slashdot。”WiredNews。2005 年 11 月 17 日。http://www.wired.com/news/technology/1,69568-0.html
  • Digg.com。“关于 Digg:常见问题。”http://digg.com/faq
  • Digg 博客。http://diggtheblog.blogspot.com/
  • Diggnation。Revision3。http://revision3.com/diggnation
  • Einfeldt, Christian。“挖掘分布式新闻:Digg.com。”Mad Penguin。2005 年 12 月 16 日。http://madpenguin.org/cms/?m=show&id=5796
  • 对 Digg.com 首席执行官 Jay Adelson 的电子邮件采访。2006 年 6 月 14 日。
  • Fioca, Brian。“Digg PHP 的可伸缩性和性能。”O'Reilly Media, Inc.。2006 年 4 月 10 日。http://www.oreillynet.com/onlamp/blog/2006/04/digg_phps_scalability_and_perf.html
  • Gannes, Liz。“凯文·罗斯在 Digg 重组中成为首席执行官。”GigaOm。2010 年 4 月 5 日。(2010 年 4 月 5 日)http://gigaom.com/2010/04/05/kevin-rose-becomes-ceo-in-shake-up-at-digg/
  • Graham-Cumming, John。“Digg 有多少用户?”JGC.org。2008 年 1 月 29 日。(2008 年 10 月 2 日)http://www.jgc.org/blog/2008/01/how-many-users-does-digg-have.html
  • Kopytoff, Verne。“大众新闻网站提供读者想要的内容。”SFGate.com。2006 年 4 月 17 日。http://www.sfgate.com/cgi-bin/article.cgi?f=/c/a/2006/04/17/BUG78I9FMQ1.DTL&hw=digg&sn=001&sc=1000
  • Liedtke, Michael。“互联网初创公司 Digg 获得 2870 万美元注资。”落基山新闻。2008 年 9 月 29 日。(2008 年 10 月 2 日)http://www.rockymountainnews.com/news/2008/sep/29/internet-startup-digg-gets-infusion-of-287/
  • Macgyver。“Digg 已被腐蚀:编辑的游乐场,而非用户驱动的网站。”ForeverGeek.com。2006 年 4 月 20 日。http://forevergeek.com/news/digg_corrupted_editors_playground_not_userdriven_website.php
  • Perez, Sarah。“Digg 市政厅会议 #2 总结。”ReadWriteWeb。2008 年 5 月 13 日。(2008 年 10 月 2 日)http://www.readwriteweb.com/archives/digg_townhall_2_wrapup.php
  • 硅谷侦探。“Digg 能否用于 Sun 股票操纵?”2006 年 3 月 17 日。http://www.siliconvalleysleuth.com/2006/03/digg_is_used_fo.html
  • Splasho。“可疑的 Digging。”Splasho.com。2006 年 4 月 20 日。http://splasho.com/blog/2006/04/20/suspicious-digging/
  • Stone, Brad 和 Steven Levy。“谁在构建下一个网络?”Newsweek.com。2006 年 4 月 3 日。http://www.msnbc.msn.com/id/12011437/site/newsweek/

广告

正在加载...