内容识别软件的工作原理

内容识别软件可以识别歌曲并保护其免受版权侵犯。
图片由 stock.xchng 提供

你正在排队看电影,此时音响系统播放着一首很棒的歌曲。尽管你喜欢这首歌,但你不知道它叫什么名字或谁唱的。你拿出手机,拨打一个号码,然后将手机对着扬声器。几秒钟后,你收到一条短信,其中包含歌曲名称、艺术家姓名,甚至还有一个可以点击购买复制品的链接。

你呼叫的服务使用内容识别软件来识别歌曲。如果你想了解附近正在播放的歌曲,这些程序很有帮助。它们还可以帮助遏制版权侵权,这对独立艺术家和公司来说都是一个巨大的问题。

广告

点对点网络、文件共享服务以及像 YouTube 这样的巨头为人们提供了大量无需付费即可访问内容的机会。直到最近,公司还不得不依赖人工来检测版权侵权并采取行动。YouTube 等网站通常依靠用户举报不当内容,但有些人并不认为侵犯版权的剪辑是不当的。目前,大多数公司不得不依靠员工来发现专有视频片段并记录报告。这是一个乏味、低效的过程,但感谢内容识别软件,它可能很快就不再必要。在本文中,我们将准确探讨这个过程是如何工作的,以及这种软件如何帮助个人和企业。

软件开发

Limewire 是几种文件共享程序之一,给媒体公司带来了巨大的麻烦。
图片根据 GNU 自由文档许可证使用

几家软件公司计划提供可以分析音频和视频剪辑的程序,将其与内容数据库进行比较,并确定它们是否来自受版权保护的来源。此类软件提供了一种高效且相对廉价的替代方案,可以避免人工梳理互联网上的海量内容。它也比问朋友是否知道广播里是什么歌更可靠。

你可能认为创建一个识别视频或音频内容的程序不应该复杂,但事实证明这是一个真正的挑战。首先,有几十种方法可以编码声音或视频文件,因此创建一个寻找匹配代码的程序并不是很有用。毕竟,从编程语言的角度来看,同一首歌曲的 WAV 文件和 MP3 文件看起来不一样。此外,歌曲和视频可以以不同的比特率录制,这意味着同一首歌曲的两个MP3文件可能不匹配。通过手机识别歌曲的软件必须能够在录音质量或背景噪声干扰的情况下识别音轨。

广告

还有其他挑战。一些视频盗版者会将录制设备带入电影院,并用自己的摄像机拍摄电影。一些放映员曾被发现在放映室设置数字摄像机,在首映之夜录制首映电影。其他绕过合法分发的人可能会裁剪视频或以其他方式修改它。任何旨在查找此类录像的程序都不能仅仅依靠编程语言或相同的文件。

在下一节中,我们将探讨识别音频文件的过程以及它如何应对这些挑战。

广告

内容识别软件 - 音频

软件分段分析歌曲,寻找标签来识别歌曲。
图片由 stock.xchng 提供

识别内容的第一步是建立一个可以与其他文件进行比较的素材数据库。对于唱片公司来说,这包括公司的整个音乐目录。内容识别软件分析每首歌曲并创建一个数字标签来识别该歌曲。这些标签被称为指纹签名

软件分析歌曲的实际声音而不是其编码语言。一些程序分析歌曲的节奏和节拍。另一些则测量歌曲的振幅和频率。指纹识别软件通常从单个录音中抽取几个持续几秒钟的样本。一些公司提供分析整个音频片段的软件,以获得尽可能完整的指纹。至少有一种现有产品会分析歌曲的地标——片段中独特的声学时刻——然后分析地标周围的声音。理想情况下,地标在扫描其他音乐时将易于识别。

广告

这些程序使用算法来分析声音。大多数是某种类型的快速傅里叶变换(FFT)算法。这种数学技术可以接收一系列复杂的信号并跟踪其中的任何变化。这些变化——无论是节奏变化、每分钟节拍数,还是片段中声音的振幅和频率——都被绘制出来并数学地转换为数字指纹。指纹通常以数字形式存在。

一旦唱片公司建立了其数据库,它就可以帮助识别歌曲给潜在客户,或追查版权侵权案件。无论哪种情况,该软件都会以与处理公司目录中歌曲相同的方式分析未知音频片段。它会创建一个哈希,或短代码,这取决于音频文件的内容。该软件将数字指纹分配给这些片段,然后将其与数据库中的指纹进行比较。接下来,我们将准确了解它如何确定歌曲是否相同。

广告

识别声音

该软件匹配代表声波的指纹,以尝试获得匹配。
图片由 stock.xchng 提供

通常,正在分析的声音剪辑并不是歌曲的干净副本。歌曲可能被截断,或者它可能与不同的歌曲相似。这就是算法派上用场的地方。算法的任务是比较指纹并确定传入的声音剪辑是否与数据库中的歌曲(或歌曲的一部分)在某个概率范围内匹配。

识别过程类似于法证专家曾经将嫌疑人的指纹与犯罪现场发现的指纹进行匹配的方式。在复杂的计算机软件和先进的指纹检查方法出现之前,专家会寻找不同指纹之间的相似点。在大多数情况下,专家需要证明至少有16个相似点才能认定指纹匹配。

广告

内容识别软件没有标准概率范围。大多数程序允许客户调整声明匹配所需的相似度级别。例如,您可以调整程序,使其仅在算法确定匹配可能性为95%或更高时才返回匹配结果。如果传入的剪辑不在此范围内,它会向用户发送错误消息。

当程序确定匹配时,关联应用程序可以接管。该应用程序可能会向想知道歌曲标题的人发送信息,或者它可能会在网站上标记一首歌曲,并向相应的唱片公司法律部门发送电子邮件。一些唱片公司已使用此类软件扫描文件共享网站或跟踪流式音频网站上的内容。整个分析和匹配过程只需几秒钟。

在下一节中,我们将探讨视频内容与音频文件相比所带来的不同挑战。

广告

内容识别软件 - 视频

分析视频比分析声音更具挑战性。
图片由 stock.xchng 提供

最近,时代华纳和迪士尼与 YouTube 合作,测试了由谷歌开发的视频内容识别软件。该软件与现有的音频内容识别程序类似,它通过分析内容创建指纹。然后,它将这些信息与数据库中的指纹进行比较,以确定是否存在匹配。然而,视频带来了独特的挑战,这些挑战并非轻易就能克服。

例如,YouTube上的大多数视频限制为10分钟或100兆字节。由于一个剪辑可能包含来自受版权保护的电影电视节目的任何10分钟片段,因此内容识别软件必须以能够从相对较小的样本剪辑中进行有意义的匹配的方式分析整个原始作品。谷歌没有过多透露该软件是如何实现这一点的,但很可能该程序会分析原始内容的重叠块以创建多个指纹。

广告

视频内容识别软件必须能够识别素材,即使上传内容的人已经对其进行了编辑。例如,人们可以通过调整视频的色彩饱和度来欺骗匹配色彩分辨率的软件。裁剪视频或上传用摄像机拍摄的电影片段也可能欺骗识别软件。一些盗版电影是在与屏幕成一定角度的摄像机上拍摄的,这进一步使识别过程复杂化。

开发者正在尝试的一种方法是使用程序根据视频中运动特征的变化分析来生成指纹。即使是这样,如果有人上传了用手持摄像机拍摄的盗版视频,也可能被证明是无效的。在某些情况下,匹配的概率范围可能需要相当宽泛,才能标记所有可能的盗版案件。电影制片厂可能会发现,他们仍然需要真人审查视频剪辑以确认侵权案件。尽管如此,对潜在视频盗版的初步识别将大大提高效率。

视频识别软件仍处于测试阶段,尽管一些公司已经成功地演示了他们的程序。然而,即使软件完善后,识别方面的挑战也不会结束。海量的视频内容带来了巨大的问题。电影和电视台需要不断更新他们的数据库,添加每天发布的所有新内容的指纹。虽然发现盗版的过程可能变得更有效率,但它仍然需要持续的维护和保养。

要了解更多关于内容识别软件的信息,请查看下一页的链接。

广告

常见问题

什么是音频内容识别?
音频内容识别是一种能够根据内容识别和跟踪音频文件的技术。它可以用于跟踪音乐文件、识别广告,甚至可以查找演讲和其他录音片段。

更多精彩信息

相关十万个为什么文章

更多精彩链接

来源

  • Anderson, Nate. "基于运动的分析可以过滤受版权保护的视频剪辑。" Ars Technica. 2007年3月14日. http://arstechnica.com/news.ars/post/20070314-motion-based-analysis-can-filter-copyrighted-video-clips.html
  • Audible Magic Inc. http://www.audiblemagic.com
  • Chen, Steve. "我们的视频ID工具现状。" Google官方博客. 2007年6月14日. http://googleblog.blogspot.com/2007/06/state-of-our-video-id-tools.html
  • Li, Kenneth and Auchard, Eric. "YouTube将与时代华纳、迪士尼测试视频ID功能。" 路透社. 2007年6月11日。
  • MotionDSP http://www.motiondsp.com
  • Relatable.com http://www.relatable.com
  • Roush, Wade. "指纹识别公司打击非法文件共享。" Technology Review. 2002年6月。
  • Stone, Brad and Helft, Miguel. "网络盗版战争中的新武器。" 纽约时报. 2007年2月19日. http://www.nytimes.com/2007/02/19/technology/19video.html?ex=1329541200&en=ac662a919b4ff2cb&ei=5124&partner=permalink&exprod=permalink
  • 美国专利号 6,748,360。
  • 美国专利号 6,990,453。
  • 美国专利号 7,185,201
  • Vijayan, Jaikumar. "指纹工具保护多媒体内容。" Computer World. 2006年3月13日。

广告

加载中...