考虑到每天都有无数新视频涌入 YouTube、TikTok 和 Instagram 等平台,科技和媒体公司也越来越需要理解所有内容的发展趋势。好消息是,由麻省理工学院校友创立的 Netra 公司,正在利用人工智能技术来改进大规模视频分析。其打造的这套系统能够识别活动、对象、情感、位置等信息,然后以新的方式来组织视频、并为其提供上下文。
Netra 联合创始人兼首席技术官 Shashi Kant SM 表示,该公司正在使用 Netra 解决方案,将类似内容分组为亮点或新闻片段、标记暴露或暴力内容、以及改善广告出现的位置。
据悉,Netra 正在帮助将视频与广告内容做得更加匹配,以避免采取容易引发隐私顾虑的传统个人追踪方案(比如 cookie)。
与此同时,Netra 认为此举有助于改善视频内容的可搜索性。在系统完成了对视频的处理之后,用户将能够更好地使用关键词进行检索。
举个例子,在通过 Netra 系统对棒球赛季的视频进行分析处理之后,用户可以轻松搜到每次击打的精彩片段,或者点击查看更多内容、找到缺失的其它曲目列表、以及引发观众愤怒的嘘声场景。
Kant 指出,视频是迄今为止最大的信息资源,从信息的丰富程度和大小上看,它让文本和其它媒体格式都黯然失色,但迄今该领域的高效搜索分析方案仍是一大片空白。
此前,互联网先驱兼 MIT 教授 Tim Berners-Lee 一直致力于提升机器读取互联网数据的能力,而 Kant 曾是他的研究生,并且受到了改善机器存储和信息使用方式的远见启发。
对 Kant 来说,当前的 Web 服务仍停留于信息检索的 1.0 阶段,甚至 Google 在该领域也长期停滞不前。而他们的新目标,就是找到信息检索的新范式。
作为 MIT 100K 创业大赛(当时其实还是 50K 美金)的获胜团队成员,他曾帮助编写了一个面向残障人士的机电矫形器的“主动联合支撑” (Active Joint Brace)解决方案的计算机代码。
2006 年毕业后,Kant 创立了一家使用相关解决方案的人工智能企业(名叫 Cognika)。由于当时 AI 概念已经被鼓吹得有些烂大街,因此 Kant 更倾向于在向投资者和客户推销时使用“认知计算”之类的术语。
2013 年的时候,Kant 又创立了致力于 AI 视频分析的 Netra 。为回应炒作质疑,Netra 决定拿出更有说服力的演示,比如能够根据不同剪辑中发生的事件,快速分析并组织内容的一套解决方案。
这套系统能够分析人们正在做的类似事情、表达的相似情感、以及相似产品的使用等场景,然后为不同的场景生成元数据。但 Kant 表示,Netra 能做到的,其实远不止于关键词标记。
Kant 解释称,Netra 为视频内容分类采用了嵌入式方案。举个例子,当棒球选手达成本垒打的时候,肯定会有相应的特征,而 Netra 可以据此声称一套嵌入算法。
作为捕获内容的数字序列或“向量”,人类常用的标记方案与之有一定的差别。为此,Netra 决定训练一个模型,以专门检测所有的本垒打。
但在表象之下,其实 Netra 还利用一个神经网络,其创建了该视频的嵌入点,并且能够通过其它方式,将相关场景与外出散步等区分开来。
通过定义不同片段之间的关系,Netra 系统允许客户以新的方式来组织和检索其内容。对于媒体公司来说,亦可更好地确定粉丝们的情绪,来确定体育赛事中最激动人心的时刻。
此外他们能够按照不同的主题、位置,根据剪辑中是否包含敏感或令人不安的内容进行分组。在线上广告即将迎来重大转变的关键时刻,这些能力也变得更具现实意义。
比如 Patagonia 等品牌广告公司,可借助 Netra 的系统,将户外服装客户的产品广告放到远足主题的内容旁边,媒体公司也能够在受其赞助的运动员视频片段中给特定运动品牌打广告。