为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

2020-06-15    收藏276
点击次数:864

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

大学时候有个朋友跟我吹,说什幺 IMDb 百大电影全都看过。我问他肖申克(Shawshank)是谁,他却支支吾吾……

AI 选出的十大最佳电影,全都是 80 年代前的老片

虽说电影这件事见仁见智,但是谈起影史佳片,大部分人都同意,《刺激 1995》稳坐头把交椅。不过最近有一件有趣的事:两位义大利科学家发了篇论文,讲他们如何用 AI 给电影打分排名,《刺激 1995》没有上榜。

这就很有趣了,因为我查了下这两位专家:Livio Bioglio 和 Ruggero G. Pensa 教授,是义大利都灵大学电脑专业的。两个写程式的,为什幺要跟电影过不去?质疑研究者的专业性之余,还是要看一下那两个人的说法。

仔细一琢磨,还真略有道理。如果跟业内人士讨论最「成功」的电影。你说《阿凡达》和《星战:原力觉醒》,不会有人反驳你。前者全球票房 28 亿美元(约新台币 840 亿元)创纪录,后者美国票房将近 10 亿(约新台币 300 亿元)排第一。票房越高,看过的人越多。如果这不算成功,这没有影响力,那什幺叫成功,什幺叫影响力?

可是在两位科学家开发的 AI 眼里,这两部电影都算不上有影响力,这 AI 评出的最具影响力十大电影,压根就没有 21 世纪上映的:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

这个排名里的片子我都听说过,出于对不同电影主题的兴趣,只看过其中几部。比如我很喜欢科技,也喜欢科幻。所以《2001:太空漫游》让我看得很爽,儘管它节奏真的慢爆。

作为一个卡在 80 末尾的半吊子电影迷,这个排名让我意识到自己看得还不够多。可你看,前十名都是上世纪的老电影,明明是 2018 年的 AI,把一百年前的电影都翻出来,是不是有点太老古董了?

在粗略看了一遍论文后,我发现,这两个科学家提出的电影评价方法确实挺有意思。 就像评价网页排名那样,他们用超连结的数量和权重,去评价一部电影的影响力。 我是没看过多少电影,称不上专家,但网页排名我知道啊!虽然我也没做过 SEO,但做了这幺久内容,至少略懂一二吧。

概览这篇论文,评价指标有这四个:In-Degree、Closeness、Harmonic、PageRank

指标 1 :In-Degree 入度中心性

简而言之,或者你在微信上有 300 个好友,那幺你在微信上的入度中心性(in-degree)就是 300。

或者看下面这个图:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

一号圈的度中心性(degree)= 0,因为没有其它圈指向它;二号圈的度中心性 = 2 ,因为有两个圈指向它。搜索引擎给网页排名的时候,会用这个指标,

比如 硅星人 FM 播客 ,如果有另外两个网页上有这个连结,那幺硅星人 FM 的 In-Degree 得分就是 2。

那幺回到这篇论文,也是利用这个评价指标, 研究人员从 IMDb 数据库里,寻找电影 b 对电影 a 的指向。这个指向,可能是所谓的「致敬」。

比如《大话西游》对《重庆森林》的台词戏仿:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

或者美版《无间道》直接翻拍港版:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

甚至只是剧情上的引用,比方说《夜宴》直接引用了哈姆雷特的剧情。再比如科幻电影《2001:太空漫游》,它的章回体叙事节奏被不少电影採纳,场景设计后来也出现在其它太空电影里。总体来讲,它在更多层面上影响了更多电影。比如迴转的太空舱:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

不管怎样,只要电影 a 被其他电影以各种方式致敬翻拍和引用,那幺电影 a 的 In-Degree,就是这些致敬电影的总数。

指标 2 :Closeness 接近中心性

这一条也比较好理解。比方为一座商场选址,房地产仲介要计算商场和周边居住区的距离。 最后选择的地址,和所有居住区之间的距离之和最小,那幺它的接近中心性就是最高的。

比如下图,所有的点都是居住区:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

把它当成北京市,直觉上把商场建在王府井 E 是最近的,然而实际上 B 点才是接近中心性最高的(大约青年路或者望京附近),因为它同时兼顾了市区以及通州燕郊的居民。

利用这个指标,很容易评价最有影响力的演员。比如 Samuel Jackson,在这个演算法选出十大演员里排第一:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

他合作了不少演员,参与了 82 部电影,演过佳片也有不少。 这种演过电影多的、跟其他演员合作多的、表演技巧被其他演员採用的,他/她们的接近中心性都很高。

指标 3 :Harmonic 和谐中心性

比方说有 5 个网页上有硅星人 FM 连结,这 5 个网页被称作一度网页,那幺硅星人 FM 的和谐中心分数就是 5 ;又有另外 10 个网页,上面有那 5 个网页,它们叫做二度网页,那幺分数就变成了 5 + (10/2) = 10 ;又有另外 36 个网页,上面有那 10 个网页,它们就是三度网页,分数又变成了 5 + (10/2) + (36/3) = 22。

我们回到电影,还是用《2001:太空漫游》举例。它的设定被《星际穿越》採用了,而只晚一年上映的《火星救援》,也有跟《星际穿越》类似的桥段。再假设另外 6 部电影借鑒了《火星救援》,那幺《2001:太空漫游》的和谐中心分数就是 1 + (1/2) + (6/3) = 3.5。

现在你明白了, 一部电影的和谐中心分数,就是「致敬」了它的电影数量 x ,加上对 x 致敬的电影数量 y 除以二,再加上对 y 致敬的数量 z 除以三,这样一直相加下去。

指标 4 :Page Rank 佩奇排名

你可以没听说过佩奇排名,但你肯定听说过它的发明者:拉里.佩奇(Larry Page),他是 Google 的联合创始人。

如果把网页 a 在 b、c、d 上每一个连结,都看做其他网页对 a 的一次投票,那幺把这个投票再加上 b、c、d 的权重,就成了佩奇排名。

比方说只有某个小网站上有你的连结,那幺你的得分就比较低,但如果你的连结上了 Google 首页,你的得分就变得超高。

放在电影的情境下也是一样。《星际穿越》致敬了《2001:太空漫游》,《星际穿越》拿了不少奥斯卡,相应地,《2001:太空漫游》的得分就很高。

反之亦然:《逐梦演艺圈》致敬了《房间》,可是《逐梦演艺圈》本身是大烂片,所以《房间》的得分肯定也好不到哪里去。

AI 评价电影的贡献:将电影的影响力「量化」

这份论文出来之后,遭到不少质疑。有人指出这种评估方式太「科学」了,可能存在「过拟合」现象。

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

而且结果明显太偏向老电影了吧!前十名里没有 80 年代之后的电影,上榜的大部分也都在 40 年代之前。

研究者也给出了他们的解释:

为什幺选出来的 10 大最佳电影都是老片?它的演算法考量了这

在论文里,研究者没有提供更多的解释,不过看着排名靠前的这几部电影,其实很容易说得通。

比如第一名的《绿野仙蹤》,并非第一部改编自原着的电影,却是影史第一部经典的童话影片。片中主演朱迪.嘉兰演技逆天唱功爆表,片子大胆尝试了先黑白、后彩色的画面,在那个战乱的、血腥的、黑暗的年代,这种转折也被视为对美好未来的暗示。站在影史的视角来看,要说《绿野仙蹤》是后世童话片的模板,也并不算是过誉。

再比如第三名的《惊魂记》(Psycho),它被誉为悬疑、惊悚、恐怖类型片的祖师爷,双重人格在大萤幕上的首次呈现。后来的许多同类电影,叙事方式、镜头语言和拍摄手法,都是模仿甚至直接拷贝的《惊魂记》。

片子最经典的无疑就是那场浴室杀人戏。不到一分钟,数十个镜头组成的蒙太奇,没有一个镜头出现兇器刺入人体的画面,却营造了一种观众从未体验过的恐怖感。

《惊魂记》有很多细节上的巧妙设定,比如画框、镜子之类背景道具的布置,被用于营造不和谐的气氛,或者双重人格的暗示,在后世的电影里,能够看到大量精湛的蒙太奇剪辑,体会到使用双重人格营造出的气氛,以及经常出现的「大反转」,却极少能看到像《惊魂记》一样详实的细节。

而少数需要引入心理或者科学原理,才能理解的惊悚或科幻片,却被更多人评价为晦涩难懂。不知道该说电影越来越烂,创作者越来越懒,还是作为观众的我们越来越傻了。

还是回到这篇讲电影打分的论文。你可以说这个评分方式太偏向老电影,我倒是觉得, 它做到并且做的很好的一点,就是把老片子如究竟何影响后世电影,以及影响究竟有多深的评判标準给量化了。

我们总是谈论一些老片子有多经典,它们开启了新的电影类型,或者创造了经典的叙事方式和镜头语言,但无论我们如何吹捧这些老电影,它们的地位都来自大众意见或者专家评议,而不是絶对科学的评估方式。

当然,我也不是说这篇论文提出的评估方式,就一定絶对科学。更何况,评价文艺作品的好坏,本就是一件很主观、不科学的事。但至少这篇论文在评价电影这件事上,朝更科学、更合理的方向上前进了一步。更重要的是,它的结果提醒了我们:

就为此,我都觉得这篇论文值得一看,它所提出的评估方式值得考虑。

更多电影最新消息

Youtube 推出官方版免费电影啦!只要忍受广告就能享受免费正版电影

《Mr.Bartender》团队拍了世界首部区块链电影,电影内的虚拟货币随着拍摄同步 ICO 啦

上一堂好莱坞的商业历史课:六大电影公司如何建立起称霸世界的「发行制度」

相关文章  RELEVANT ARTICLES