数字指纹技术如何运作

作者:Wesley Fenlon
在YouTube等网站上寻找电影和音乐很有趣,但未经许可分享受版权保护的材料是违法的。
截图由 十万个为什么.com 工作人员提供

想象一下:经典的 David Bowie 和 Queen 合作的《Under Pressure》突然在你脑海中响起。你多年未曾听过这首歌,突然之间你脑海里除了歌词别无他物。但你记不住所有歌词,于是你本能地上网查找这首歌并试听。你会首先去哪里?你可以去 iTunes,在那里你可能会找到这首99美分的MP3歌曲。但你却去了YouTube。然后你想与朋友分享你的发现,于是你在Twitter上发布了一个链接。几分钟之内,就有十几个人不花一分钱地听着同一首歌。

这正是数字内容创作者不太乐意看到的情况。网络上大部分内容都有人拥有版权,但这些内容却常常未经许可就被分发出去。对于如此容易(且频繁)被免费复制和共享的东西,公司又该如何从中获利呢?

广告

一个答案就是数字指纹识别技术。数字指纹识别技术依赖于复杂的计算机分析,以识别歌曲或视频片段等媒体内容。指纹类比由此而来:就像每个人都有独一无二的指纹一样,每份媒体内容也都有可被智能软件识别的独特特征。但这种识别到底有什么用呢?像 YouTube 这样的网站可以扫描文件,将其指纹与受版权保护材料的数据库进行匹配,从而阻止用户上传受版权保护的文件。听起来很简单,对吧?令人惊讶的是,人们常常将数字指纹识别与水印混淆,或者对这项技术的内容没有清晰的认识。

问题的一部分在于,“数字指纹识别”这个术语实际上可以指代两种完全不同的事物。我们已经讨论过第一种含义,但第二种含义则基于更传统的指纹类比,将您的个人计算机等同于一个可用于追踪您在线活动的在线指纹。这两个概念都指代一个唯一标识符,但功能完全不同——第二种含义与识别受版权保护的歌曲或视频无关。两者都不涉及扫描真实的指纹,但它们无论如何都是非常酷的技术。让我们来看看它们是如何运作的。

 

 

广告

水印与指纹识别

数字指纹和数字水印很容易混淆,但它们是两种截然不同但目标有些相似的技术。在流行文化中,指纹最常出现在间谍电影或悬疑片中,作为人们留下的可见识别标记。然而,数字指纹并非如此运作——您永远不会看到任何数字指纹存在的可见证据。另一方面,水印一词通常指数字文件上完全可见的标记。水印更多是通过令人不快的方式而非智能技术来遏制内容的非法传播 [来源: Milano]。

水印是放置在图像或视频上的标志或其他识别标记,始终可见。水印旨在阻止互联网用户从一个网站获取照片或视频,并在不注明来源的情况下将其用于自己的目的。当照片上印有别人的标志时,很难假装照片是你的!不幸的是,没有什么能真正保证水印的有效性。盗版者仍然可以分享带有水印的视频,而一些带有较小水印的照片可以轻易地裁剪掉,以隐藏其合法所有者的身份。水印的第二种形式是向文件中添加不可感知的少量数据,可用于追踪目的。虽然这听起来可能比可见水印用处更小,但它实际上允许内容所有者通过文件的独特水印来追踪其来源 [来源: Milano]。

广告

数字指纹识别提供了一种更有前景的方式来限制受版权保护材料的传播。文件的构成,你可以称之为它的 DNA,可以被设计用于过滤许可材料的计算机程序分析和识别。这个指纹代表着数字形式的危险信号——当计算机系统知道如何解释其信息时,它就会发出“我受版权保护!”的警告。当然,事情并非如此简单。下一页将深入探讨发出这个危险信号的技术。

数字指纹识别技术

数字指纹识别服务 Audible Magic 承诺帮助公司将其受版权保护的内容变现。
截图由 十万个为什么.com 工作人员提供

与水印不同,数字指纹识别从不涉及修改文件。数字指纹识别最有前景的用途是预防性的,而非基于追踪。要使指纹识别生效,软件必须能够准确识别一段媒体内容,并将该文件与外部数据库关联起来。为此,指纹识别软件会采样音频或视频文件,以提取文件中对该媒体内容独有的微小部分。这些样本可能涉及电影57分钟处构成角色帽子的一小撮红色像素,或者歌曲开始30秒后歌手声音的准确音高 [来源: Milano]。这些都是极其简化的例子——指纹识别需要采样多个标准,以形成对相关媒体内容的准确表示。

一家主要的数字指纹识别公司 Audible Magic,为包括 NBC Universal、Sony Music 和 20th Century Fox 在内的各大内容提供商服务 [来源: Audible Magic]。Audible Magic 自豪地宣称,其 CopySense 技术可以在播放视频片段的五秒内识别其来源,并在十秒内识别音频文件。而且据称,这在任何条件下都适用。Audible Magic 的软件不仅旨在识别电影的原始副本,该公司还声称其软件可以识别用手持相机从电影院屏幕录制下来的媒体内容。

广告

识别基于 Audible Magic 所称的“音频和视频的感知特征”。该系统足够智能,能够看穿音频和视频文件的转换性更改,因此文件格式之间的转码、音频均衡、图像裁剪甚至图片模糊都无法欺骗 CopySense [来源: Audible Magic]。

这是否意味着 Audible Magic 可以识别互联网上的每一段内容?不——指纹识别只适用于已分析并已将参考文件上传到数据库的媒体。该文件包含 Audible Magic 用于识别歌曲或视频的所有感知特征。Audible Magic 的全球版权注册数据库涵盖了其客户的数百万个文件。

这就是数字指纹识别作为版权保护手段的要旨。接下来:第二种指纹识别如何追踪您的在线身份。

广告

数字指纹识别与您的身份

每次您上网冲浪时,都会在网络上留下无形的指纹。
©iStockphoto.com/barisonal

上一页深入探讨了我们通常所理解的数字指纹识别背后的技术,但这个术语有时也指代一种完全不同的数据追踪形式。这可能会令人相当困惑。我们都知道指纹识别通常意味着什么(我们只有一套指纹!),但进入数字世界为歧义留下了空间。近年来,数字指纹识别已被用来描述一种身份追踪方法——实质上,每台计算机都有一个独特的指纹,使其可以在互联网上被追踪。

您可能听说过IP 地址,这是附加到互联网上每台计算机的唯一数字。IP 地址并非计算机的精确身份证。真实的指纹永不改变,但互联网服务提供商(ISP)可以更改用户的 IP 地址。数字指纹识别会考虑其他详细信息来确定您计算机的身份。而这就是事情变得有点可怕的地方:网站读取有关您计算机的各种数据并确定您是谁,这令人震惊地容易。IP 地址只是第一步——它显示了您的 ISP 是谁以及您居住在哪个国家。您在网站上选择的登录身份可能是另一个线索。如果您在多个网站上使用相同的登录名,那么通过简单的 Google 搜索可能很容易追踪到该名称。安装在您计算机上的操作系统,无论是 Windows、Mac OS X 还是 Linux,都会使焦点更加集中。即使您使用的网络浏览器(以及您运行的特定版本,例如 Google Chrome 11.0.696.60 或 Firefox 3.6.17)也会为您的数字指纹添加详细信息 [来源: 华尔街日报]。

广告

如您所见,追踪您在互联网上活动的技术是存在的。但这真的是一件坏事吗?嗯,这取决于您对隐私的重视程度。这项技术的一个用途在于定向广告,它会考虑您的数据,以提供更可能符合您兴趣的广告。如果您曾注意到 Google 广告从您正在浏览的页面中抓取关键词以提供更相关的广告,或者当网站神秘地识别出您居住的城市时感到惊讶,那么您就已经看到了这项技术的初级应用。随着这种追踪变得越来越普遍,广告和追踪公司可能会提供“选择退出”网站(很像电话推销员的“谢绝来电”列表),以保护您的匿名性。尽管如此,您仍应始终了解您的身份被追踪的容易程度。

数字指纹识别的原因

前面两页已经确立了“数字指纹识别”这个术语适用于两种完全不同的技术。当然,它们的共同点是计算机化的识别形式。既然我们已经确定了每种技术的工作原理,那么让我们来探讨它们的具体用途。YouTube 提供了一个简单的切入点。版权侵权行为不断威胁着这个视频网站,2007 年,维亚康姆公司(Viacom)就 YouTube 上可用的视频片段对谷歌提起了10亿美元的诉讼 [来源: CNET]。谷歌自己没有上传这些片段,但它也没有阻止用户上传这些片段。管理一个像 YouTube 这样庞大的网站是一项巨大的挑战——谷歌如何才能阻止未经许可的内容出现?

借助数字指纹识别技术。谷歌使用其称为 YouTube Video Identification 的软件来筛选上传的视频并识别受版权保护的内容。它还赋予版权所有者控制权,可以拒绝上传甚至通过其内容获利 [来源: YouTube]。这种形式的数字指纹识别实际上有两个目的:它保护谷歌免受有害诉讼,并限制受版权保护材料的未经许可传播。理想情况下,这意味着拥有版权的公司和在线托管这些内容的公司都受到指纹识别的保护。内容不会非法传播,像 YouTube 这样的网站也可以避免麻烦的诉讼。

广告

当然,数字指纹识别不必是一种限制性技术。指纹识别的另一个绝佳应用是 Shazam,这是一款音乐识别应用,可以将歌曲的音频样本与音乐数据库进行匹配 [来源: Everything Else Matters Too]。在智能手机上,Shazam 利用麦克风捕捉歌曲的音频,进行分析,并利用这些数据找到匹配项。Shazam 然后会显示关于歌曲和艺术家的信息页面,并提供快速访问音乐商店的途径,在那里可以购买该歌曲的MP3。

我们已经描述了如何根据构成数字指纹的各种特征,使用数字指纹识别来追踪个人电脑在互联网上的活动。同样的追踪技术也可以用于安全目的。利用数字指纹识别的力量,可以识别、追踪甚至逮捕上传和下载非法材料的盗版者和互联网用户。而且由于识别不单独依赖 IP 地址,因此即使盗版者在同一设备上从不同地点访问互联网,仍然可以被锁定。

显然,追踪犯罪分子是数字指纹识别的一项崇高用途——但如果这听起来像是侵犯隐私,那么您可能发现了一些问题。

广告

合法性

Google Ads 为广告商提供根据个人用户量身定制优惠的服务。这是一个强大的营销工具,但它是否侵犯了隐私?
截图由 十万个为什么.com 工作人员提供

正如您现在可能已经发现的那样,数字指纹识别可能是一项强大的——甚至可能具有侵入性的——技术。您喜欢您在网上的一举一动都被追踪的感觉吗,即使这仅仅是为了定向广告的目的?这里有一个更好的问题:它甚至合法吗?

身份追踪指纹识别技术在伦理上站不住脚,未来可能被认为过度侵入且非法。但由于它是一项正在发展的技术,这些法律问题仍在解决中。而且由于互联网是一个全球网络,关于数字指纹识别的法律可能因国家而异,发展方式完全不同。

广告

根据加拿大的指导方针,数字指纹很可能构成个人信息,因此使用该信息可能违反加拿大隐私法。加拿大组织被要求在诉诸指纹识别等方法之前,穷尽一切可能的非侵入性个人识别方法。因为指纹识别“可能会收集比识别在线研究中的欺诈和重复受访者所需更多的信息”,除非获得许可或用尽所有其他机会,否则加拿大组织可能会因追踪个人而惹上麻烦 [来源: Verrinder]。

我们讨论的第一种数字指纹识别形式——将受版权保护媒体的识别特征与数据库匹配——不存在与身份追踪相同的伦理挑战。许可证持有者有权保护其内容,这种形式的指纹识别也绝不侵犯用户隐私。理想情况下,指纹识别将通过阻止许可媒体的非法传播,实际减少版权侵权诉讼的数量。维亚康姆公司对 YouTube 提出的10亿美元诉讼于2010年被法院驳回,因为谷歌被发现符合《数字千年版权法案》(DMCA)。由于该网站在接到通知后删除了非法视频,因此受到 DMCA 的保护,对其用户的行为不承担责任 [来源: Schonfeld]。如果指纹识别技术更好,诉讼可能根本就不会发生。这一说法对指纹识别技术寄予了厚望,这引出了我们的最后一个话题:它究竟效果如何?

广告

数字指纹识别的有效性

受版权内容数字指纹识别在理论上很棒,但它真的能阻止互联网盗版吗?
©iStockphoto.com/Brasil2

数字指纹识别听起来像是打击互联网盗版的完美技术。它能阻止用户传播受版权保护的内容,并可能避免诉讼的麻烦和费用。一旦被组织实施,数字指纹识别是一个高度自动化的系统,这意味着内容提供商和媒体网站的工作量都会减少。当然,所有这些便利都假定了一件关键的事情:数字指纹识别确实有效。

数字指纹识别必须能够识别数千甚至数百万件内容——这些内容可以以多种媒体格式传播,以意想不到的方式裁剪或编辑,甚至是从电影院屏幕录制下来的。视频元素,如颜色、比特率甚至分辨率,都可能因视频而异。面对所有这些变量,数字指纹识别真的能奏效吗?

广告

2007 年,Audible Magic 的 Copysense 指纹识别技术在一个名为 Soapbox 的在线视频网站上接受了测试。Soapbox 是微软的一个项目,允许用户像 YouTube 一样上传视频。即使有 Audible Magic 的指纹识别技术在运作,科技网站 Gigaom 仍然很容易地上传了一段来自喜剧中心《每日秀》的受版权保护的视频 [来源: Gigaom]。该片段花了几天时间才从 Soapbox 上被删除——即使 Gigaom 联系了微软和 Audible Magic 寻求评论。Gigaom 认为该片段随后会被索引并受到保护,以防非法共享,于是他们再次尝试上传。结果成功了。他们在 Myspace 上也取得了类似的成功,Myspace 也采用了 Audible Magic 的指纹识别技术。

Audible Magic 保护着1100万首歌曲、电影和电视节目。但是,几十年来大量的数字媒体内容触手可及,该软件显然无法阻止所有非法上传。数字指纹识别也无法阻止大多数点对点文件共享,这种共享直接在用户之间分发材料。数字指纹识别未来的有效性完全是未知数。如果像 Audible Magic 这样的公司继续改进其识别系统并扩展其指纹数据库,那么用户生成内容的网站将更容易维护,识别媒体的技术也将比以往任何时候都更强大。谁知道呢?20年后,像 Shazam 这样的应用程序可能能够根据吉他独奏的长度来区分两个现场音乐会版本的《自由之鸟》。那可真是精度惊人!

广告

常见问题

数字足迹和数字指纹有什么区别?
数字足迹是指个人在使用互联网时留下的痕迹。数字指纹是一种特定类型的数字足迹,用于识别个人。
什么是数字指纹?
数字指纹是一组可用于识别个人或设备的特征。
如何数字化记录我的指纹?
有几种方法可以数字化记录指纹。一种方法是使用扫描仪捕捉指纹的脊线和谷线。另一种方法是使用相机拍摄指纹的照片。

更多信息

相关文章

  • AudibleMagic.com。“内容所有者。”(2011年5月1日)。http://audiblemagic.com/customers-contentregistration.php
  • AudibleMagic.com。“技术概述。”(2011年5月1日)。http://audiblemagic.com/technology.php
  • Anne Broache 和 Greg Sandoval。“维亚康姆就 YouTube 视频片段起诉谷歌。”2007年3月13日。(2011年5月6日)。http://news.cnet.com/Viacom-sues-Google-over-YouTube-clips/2100-1030_3-6166668.html
  • Businessweek.com。“好莱坞防盗版。”2007年6月11日。(2011年5月2日)。http://www.businessweek.com/magazine/content/07_24/b4038073.htm?campaign_id=rss_tech
  • EverythingElseMattersToo.com。“Shazam 如何工作。”2010年6月3日。(2011年5月7日)。http://everythingelsematterstoo.blogspot.com/2010/11/how-shazam-works.html
  • Liz Gannes。“数字指纹识别有效吗?一项调查报告。”2007年6月8日。(2011年4月27日)。
  • http://gigaom.com/video/does-digital-fingerprinting-work-an-investigative-report/
  • Dominic Milano。“内容控制:数字水印和指纹识别。”(2011年4月28日)。https://www.digimarc.com/resources/docs/Rhozet_wp_Fingerprinting_Watermarking.pdf
  • Erick Schonfeld。“法官驳回维亚康姆诉 YouTube 案(法庭文件)。”2010年6月23日。(2011年5月6日)。http://techcrunch.com/2010/06/23/youtube-declares-victory-in-viacom-case/
  • James Verrinder。“数字指纹识别‘在加拿大可能非法’,MRIA 警告。”2008年9月29日。(2011年5月3日)。http://www.research-live.com/news/legal/digital-fingerprinting-may-be-unlawful-in-canada-warns-mria/4001050.article
  • 华尔街日报。“他们知道什么:您的数字指纹。”2010年11月30日。(2011年4月28日)。http://online.wsj.com/video/what-they-know-your-digital-fingerprint/49B4A220-88A5-4F53-BA89-20BBB0A83CB2.html
  • YouTube.com。“YouTube 视频识别测试版。”(2011年5月5日)。http://www.youtube.com/t/video_id_about

广告

加载中...