袁茵36氪 如果 这就是大数据…… | 36氪

2018-04-14
字体:
浏览:
文章简介:中国什么时候才能有自己的<纸牌屋>?或许已经为时不远了.印象中,离互联网很远的娱乐圈,已经开始利用大数据进行各种尝试了.前几天,黑豆碰到了老

中国什么时候才能有自己的《纸牌屋》?或许已经为时不远了。印象中,离互联网很远的娱乐圈,已经开始利用大数据进行各种尝试了。

前几天,黑豆碰到了老夏,他就正在做这样的事。老夏名叫夏宗靓,成立了一家名叫艾漫科技的大数据公司。如果把艾漫科技当成影视圈的一个幕后人员,它早就是腕儿了。《小时代》和《北京爱情故事》两部赚得盆满钵盈的电影,幕后都有艾漫科技提供大数据支持。

2013 年《小时代 1》6 月上院线之后,艾漫科技的大数据系统发现观众对郭敬明的导演功力有质疑,同时,某一个男主角的表现非常不能让观众满意,而这个时候《小时代 2》已经拍完。综合大数据结果艾漫建议《小时代 2》在七夕中国情人节档上院线,因为如果等待半年之后上映,关注度下降的同时,郭敬明的导演水平会受到更多质疑。这是中国电影史上都是少见的操作手法,当然,票房的成功验证了这个决策是正确的。

大数据同样可以用于选角和戏份删减。艾漫科技还建议:由于其中某个男演员口碑较差,后续戏份需要删减;而女二号的表现突出,戏份应更多增加。此外,由于小时代系列的 82% 的关注者都是 90 后,而对这个人群的作息时间来讲,晚上十点的排片可能比传统的晚上八点黄金档更合适;还有应更多地在二三线市场进行排片和在营销时重要的宣传点应着重放在“朋友、友情、人性”等。这些建议最终都被片方采纳。

其实黑豆一直认为,大数据做的就是了解“人”的事情。无论现实社会还是虚拟社会,只要我们有了身份、ID 我们就会有所顾忌,所以未必敢表达我们的真实感受。有的时候,我们内心想要的甚至我们自己也说不出来。但这一切都会表现在我们的行为上,谁愿意承认自己八卦呢,但这并不妨碍我们在文章事件曝出后,翻翻三个人的过往情史。

很多人批评《小时代》纸醉金迷,这不妨碍我们依旧看着这部电影,在心里偷偷向往一下,甚至我们都不知道自己在向往。在互联网上,娱乐是用户最重要的几件事之一,大数据能做到的更了不起的事情是——“找到你内心的小恶魔”,并用内容把小恶魔饲养好,转而让我们更加了解自己。

从这个角度看,娱乐信息的确比很多门类更容易直射内心。不过黑豆想到的事情,其它人必然也会想到,这块迟迟发展不起来大概有几个原因:1、中国娱乐产业本身的互联网化程度还比较初级;2、再精准的数据到很流弊的作品之间也少不了“人”的加工,数据再准,没有好导演,一部粗制滥造、各种情节拼凑在一起也未必有人看吧;3、大数据的效果无法像电商那样精准衡量,但背后的技术要求却更高。

互联网圈都有个习惯,一听到大数据,就得问在数据量、技术上有什么优势。其实前几年老夏做的事情都是把非结构化的数据变得结构化,那时百度也提出了类似的概念,你就知道他们做得事情有多难。现在对外,老夏解释类似问题答案很直接:“在中文文字处理上,艾漫科技数据源是最大的,处理速度是最快的,识别是最准的,没有之一。还有就是,不需要人工参与判断。”

老夏常说自己是影视行业的“黑衣人”,掌握着最新科技为影视圈的星球大战保驾护航,任务完成后,就用记忆消除器对着自己闪一下。身在娱乐圈,艾漫科技超过 70% 的人却是技术宅男,不擅长制造话题和绯闻。“就像我们服务器上存储的 1.

4PB 数据一样,艾漫会持续每天海量存储全网数据。”老夏解释,真正做好大数据,需要动态、连续、完整的数据积累,而不是博昙花一现。“到艾漫科技广为人知的时候,我们存储的数据或许已经达到 10PB、甚至 100PB 了,而且这些的数据能发挥的价值远超过容量的价值”。

2012 年《纸牌屋》让人们知道有一种神奇的工具叫大数据,却不知道那时艾漫科技已经在影视商业立项、主创评估、制片辅助、宣传发行、动态票房预估等领域开始尝试了。《小时代》、《北爱》、《最美和声》等知名作品都和艾漫有大数据合作,原来这些好作品都是上了科技手段的。

目前艾漫的电影票房预测已经控制到 10% 的误差,2014 年开始,自己建设了大数据系统的视频网站也开始寻求艾漫科技这样的“外脑”,成功的自制内容有腾讯视频的《探灵档案》、《Are you normal》等。

但老夏只想让大数据成为影视、音乐等娱乐产品的“拐杖”。娱乐和互联网看似风马牛不相及,但越跨界就越有意思。他本身就是个跨界人,毕业于清华大学,在 IT 圈工作多年,后来又进入了音乐圈,曾担任海蝶公司总裁。

最先尝鲜的是那些对高科技很有 Feel 的导演,比如对新锐 90 后口味最了解的郭敬明、导演了《泰坦尼克号》的好莱坞大导演詹姆斯·卡梅隆(他在《深海挑战》中和艾漫进行了大数据合作)。这也是老夏最喜欢的一类客户,他们对大数据的认识更加理性:不需要老夏用数据去证明自己的决策多么睿智、伟大,相反,他们和那些优秀的产品经理一样,更关注用户在想什么。

“大数据不是为了证明什么是对的。它研究的不是因果,而是相关关系。大数据只是在不断提高成功的几率,因为通向成功的路上,变量太多了。”老夏说,“未来每一个影视内容的产生,都是艺术感性创造和大数据理性支持的叠加,缺一不可”。

话说回来,以黑豆对大数据的浅薄理解,一听到创业公司要做大数据还是有些担心的,因为大数据正是 BAT 抓紧在做的事情啊,可真不是创业公司轻易玩得起的。而且优土、爱奇艺等视频网站都在做自己的大数据系统,为买剧、制剧做出指导,和创业公司比起来,他们怎么看都能算得上财大气粗。

但有了技术能力后,艾漫做的事情还是有巨大的市场空间。中国娱乐文化市场很大,但做娱乐文化内容深度挖掘的公司很少。而且这些事情,BAT 也需要,却未必有精力专门搭建团队做的事情。艾漫抓取的是全网的娱乐数据(除了微信朋友圈现在还没开放权限),这些数据多、杂、散、匿。

大公司一讲自己的大数据优势就是自己体系内海量数据的积累,或者完善的账号体系,而艾漫科技可以为任何一个客户提供总平台的数据和分析。一部电影、电视剧或是综艺节目,大数据的作用是分析观众口味是什么,喜欢怎样的桥段,而不是针对个人。《北爱》中艾漫通过内容聚合,发现北京的 80 后的爱情观,尤其是北漂,是玫瑰加房子。

做大数据首先要能正确地理解并搜集数据。在自然语言理解上,艾漫可以在博大精深的汉语中精准的抽取关键词以及观点并做出情感的分析判断(这在一般的大数据体系里是做不到的)。而且在消除歧义上,艾漫也很有心得,文章事件中,他们绝对不会把“演员文章”和“一篇文章”中的两个词弄混。针对相关内容,艾漫可以自动归档,更牛的是,大数据系统可以自动给这些文章做出摘要。

搜集数据之后,还需要挖掘。如果有突发事件曝出,系统可以自动进行全网的时间传播与追踪。听到这里的时候,黑豆邪恶的想了一下,如果再出艳照门,是不是宅男们就不用各大论坛去翻帖子了,始终有最新版的内容看。此外还能根据关键词形成大规模的知识图谱,类似的知识图谱我们其实已经在搜索引擎或者人立方等产品中看到过了,但艾漫的知识图谱是多信息的,你不仅能看到关键人物、或者事件,而且每个关键点上还有相关新闻链接和摘要供阅读。

而且艾漫非常重视来自微博、评论、贴吧等各种社交产品中的数据,因为那背后的才是一个个真实的“人”。这意味着,即便对有了大数据系统的视频网站,艾漫也能告诉它更多,比如谁在讨论什么,这个剧为什么火。

黑豆非常期待的是,很快这些用于寻找人类心中“小恶魔”的大数据系统就要被开发成面向用户的 toC 类产品了。艾漫做影视 To B 类客户服务,是让影视作品都符合目标用户的 YY;做娱乐资讯 To C 类用户服务,则是为了验证老夏自己的 YY。

至少以目前的艾漫的手段,早期产品就可以让用户越来越“懒”:不需要花超过 3 秒的时间就能读懂一篇新闻;甚至不再“读”新闻,直接变成图片来看新闻。媒体的态度不再重要,用户的态度才是最重要的;每个人都不再是信息的孤岛,因为每个人都能找到自己价值观的认同者;每个人都是信息的接收者,也是信息的传播者。

黑豆内心更期待在它的产品入驻了我们手机,对我们有更多了解后,能帮助我们找到内心的小恶魔,毕竟,了解自己这件事吧,太难了。拥有直面真实的自己的勇气,也太难了。比如黑豆自己,当老夏告诉我,每一个社交账号后面的行为,艾漫科技都贴上了 20 个标签的时候,我后背凉飕飕的。我何时是天使,何时是魔鬼,大数据竟然比我还清楚。

但黑豆还是愿意有这样的产品使用,只是要友情提醒先:不要因为我们走得太远,忘了我们为什么出发。