中国影视产品网络满意度研究2019
上QQ阅读APP看书,第一时间看更新

第一节 浙江传媒学院视频监测与分析系统

一 概况

“浙江传媒学院视频监测与分析系统”是对娱乐视频和明星进行受众态度测评的系统。2016年6月开始监测上星频道黄金时间(19:30—22:30)开始播出的电视剧和综艺节目。2017年1月开始对100位娱乐明星进行监测,2017年5月开始监测主要院线上映的电影和6家主流视频网站的网络综艺,2018年8月开始监测6家主流视频网站的网剧,2019年3月开始监测爱奇艺、腾讯视频、优酷视频等3家视频网站的网络大电影。

视频监测与分析系统的建设旨在服务于我校的课程教学和学术研究工作。系统的运作分四步:

第一步:设置监测对象。通过学生完成监测对象的设置,同时录入监测对象的主要属性。

第二步:自动采集数据。计算机自动收集与监测对象相关的新闻、论坛、微博、弹幕、微信公众号、视频网站评价、豆瓣电影网站评论等信息,形成大数据。

第三步:褒贬值计算。利用语义分析技术,计算出每一条新闻、论坛、微博、弹幕、微信公众号、视频网站评价的褒贬值,褒贬值设定在-5 到+5之间。

第四步:数据输出。根据收集和计算的数据,系统生成结果。目前有三类输出结果:一是统计图表,二是原始数据,三是月度汇总数据,以供进一步分析使用。

二 功能

系统由热点趋势、褒贬分析、数据导出、监测对象信息、后台管理、月度汇总、在线褒贬打分七个功能模块组成[1]

(一)热点趋势

热点趋势主要用于反映监测对象的行为指标,包括热点趋势、传播形态分布、相关热词、媒体关注分布等数据。例如,图1-1是江苏卫视综艺《非诚勿扰》2019年1月的热点趋势。系统还能显示最近24小时的前10个热词,允许以Excel数据文件格式导出具体数据。

图1-1 《非诚勿扰》相关热词(2019年2月2日截图)

(二)褒贬分析

褒贬分析是系统最具特色的功能,包括褒贬趋势、褒贬总体分析等数据。图1-2是湖南卫视电视剧《知否知否应是绿肥红瘦》的褒贬趋势。

图1-2 《知否知否应是绿肥红瘦》褒贬趋势(2019年2月2日截图)

(三)数据导出

数据导出是本系统最重要的部分,可以灵活地查询并导出原始数据,本书的主要数据通过这一功能模块获取。

图1-3是以“都挺好”为关键词,进行条件设置,并获取部分检索的结果。设置时间范围从2019年3月1日到2019年4月4日,获取电视剧《都挺好》的弹幕数据2893980条,得出平均褒贬值为0.027。

点击标题,可链接到具体的网址,看到其中具体的评论内容。点击“导出Excel”,可以导出这41624条数据到Excel数据文件,包括了标题、来源、褒贬值、发布日期(精确到秒)等内容。使用该功能时,每一次的每日各类数据分类汇总导出数量不能超过1万条。点击“按日期分组统计导出Excel”,能导出按日统计各类数据条数和褒贬值到Excel数据文件。

图1-3 数据导出检索结果(2019年4月4日截图)

数据导出的条件设置灵活,可以选择不同的“来源类别”(新闻、论坛、微博、弹幕、微信、网站评论、豆瓣评论)、“态度”(正面、中性、负面)和“时间范围”。

数据导出可以多关键词检索,还允许包含简单的逻辑运算。例如,“A B”(AB之间为空格)表示“A”和“B”同时存在(和运算),“A—B”表示有“A”但没有“B”(非运算),“A|B”表示有“A”或有“B”(或运算)。需要特别注意的是,检索的第一个关键词需要通过后台管理预先设定,否则监测与检索的结果将不完整。

(四)后台管理

后台管理包括监测对象设置、监测对象属性设置、褒贬词库管理、数据导出记录等功能,仅管理员有权限使用,一般用户不能使用。监测对象的设置是系统最基础的操作,也是一项持续的工作。在系统中添加和设置监测对象,包括名称、关键词、类型、等级、监控起始时间等信息。

图1-4 被监测对象的设置(2019年2月2日截图)

系统允许同时设置多个关键词,其逻辑运算规则与数据导出模块的设定相同。系统将监测对象分为“一般”“重点”“研究”三个等级,所抓取的信息量随等级依次增加。图1-4即是关于明星“白敬亭”的监测设置,系统将自动收集含有“白敬亭”的信息,监测等级是“重点”,监测日期自2019年1月1日至2019年12月31日。

系统能对被监测的关键词库进行编辑,包括查询、编辑、关闭、删除、导出被监测对象数据等功能。图1-5显示了监测的关键词列表。建议用户将查询和编辑功能结合使用,便于对重播和季播节目进行监测设置。操作方式是,在“关键词”一栏输入所需查询的关键词,点击任意处,以前设置的关键词,包括已关闭的和时间过期的关键词就会显示,可对其进行编辑修改。

图1-5 电影监测对象列表(2019年2月2日截图)

在系统中添加和设置监测对象,包括名称、关键词、类型、等级、监测起始时间等信息表6-3。例如图1-5,对于重播和季播的节目不需重复设置,重新编辑其信息即可。点击“导出Excel”可以定期(目前为每月一次)提供监测对象清单,包括监测对象的名称、关键词、监测开始和结束时间、监测等级、是否关闭等信息。

(五)监测对象信息

监测对象信息用于设置监测对象属性,包括播出平台、制作机构、主创人员、类型等。图1-6是网剧《鬼吹灯之怒晴湘西》的信息设置。该模块仅管理员有权限使用,一般用户不能使用。

图1-6 网剧《鬼吹灯之怒晴湘西》信息设置(2019年2月2日截图)

点击“导出Excel”可以定期(目前为每月一次)提供监测对象信息清单的Excel文件,包括监测对象的名称、关键词、播出平台、类型、主创人员名单、设置者等信息。重播和季播的节目不改变原来的信息,而是新增一条记录。

(六)月度汇总

“月度汇总”模块用于生成电视综艺、电视剧、明星、电影、网络综艺、网剧等监测对象类型的月度汇总数据的Excel文件。汇总的时间原则主要有三类:其一,对于月内开始监测,月内未结束的监测对象,统计监测“开始时间”到当月最后一天的数据;其二,对于当月以前开始监测,当月尚未结束监测的对象,则统计当月全月数据;其三,对于当月以前开始监测,当月结束监测的对象,统计当月1日到“结束日期”的数据。

本团队规定了以下数据采用原则:每天新闻、微博、论坛、弹幕、微信、视频网站评论、豆瓣评论的信息量之和大于等于15条;或者每月新闻、微博、论坛、弹幕、微信、视频网站评论豆瓣评分的信息量之和大于等于400条。2019年5月起,电影、电视剧、电视综艺、网剧、网综、明星调整为每天新闻、微博、论坛、微信、视频网站评论、豆瓣评论的信息量之和大于等于10条;或者每月新闻、微博、论坛、微信、视频网站评论豆瓣评分的信息量之和大于等于300条;网络大电影为每天5条,或每月100条。

平均褒贬值为各条数据褒贬值的简单算术平均数。研究者也可以进一步设计各种权重,得出不同的综合褒贬值。

(七)在线褒贬打分

在线褒贬打分是一个对非系统抓取的数据进行语义分析的接口。有三个功能,一是研究者上传需要评价的Excel数据文件,系统自动计算出文本的褒贬值。这是无对象测评,需要对褒贬值的计算结果进一步分析。二是研究者提供一段文本,系统显示分词、褒贬词、程度副词、原始分值、不分对象评价的褒贬值等详细信息。三是比较句分析,显示比较对象与被比较对象不同的褒贬值。

三 第5版主要升级内容

(一)分对象评价

分对象评价是对同一句、一段、一篇中的多个评价对象给出不同的评分。评价对象是本系统所有的监测对象,包括正在监测和停止监测的电影、电视剧、电视综艺、网络综艺、网剧、明星。系统进行语义分析时,评价对象作为一个词,不再分词、且不评分,下文举例说明。

2018年12月1日,系统收集到《深圳在线》的新闻《综艺嘉宾影响力排名TOP10更新,张雨绮夺冠,杨紫位居次席》[2],内容如下:

“如果你喜欢看综艺节目,我想这个夜晚的你一定不会过得无聊,时下多档综艺正在热播中,有音乐类综艺《梦想的声音》和《蒙面唱将猜猜猜》,有明星真人秀综艺《明星大侦探》和《亲爱的客栈》,还有演员表演类综艺《我就是演员》,相信总有一档综艺节目是你的菜。

一档受欢迎的电视剧少不了高人气电视演员的加盟,比如《镇魂》男主朱一龙,比如《你和我的倾城时光》女主赵丽颖,一档成功的综艺节目同样少不了高人气的综艺嘉宾,那么谁才是当下曝光度最高的综艺嘉宾呢?一起来看最新出炉的综艺嘉宾影响力TOP10榜单!

本期综艺嘉宾TOP10榜单变动幅度较大,影响力最大的五位综艺嘉宾依次是张雨绮、杨紫、吴亦凡、邓伦、经超,紧随其后的五位综艺嘉宾依次是白敬亭、张钧甯、朱正廷、魏大勋以及陈伟霆,其中参加《挑战吧太空》的女明星张雨绮夺冠,在《亲爱的客栈》中表现出色的杨紫居次席,吴亦凡排第三,邓伦、经超背靠背进前五。”

该新闻涉及17个评价对象,分别是《梦想的声音》《蒙面唱将猜猜猜》《明星大侦探》《亲爱的客栈》《我就是演员》《挑战吧太空》6档电视综艺,电视剧《你和我的倾城时光》,朱一龙、赵丽颖、张雨绮、杨紫、吴亦凡、邓伦、白敬亭、张钧甯、魏大勋和陈伟霆10位明星。新闻中涉及的网剧《镇魂》和明星经超、朱正廷,系统没有监测。其中《挑战吧太空》的正式名称是《挑战吧!太空》,系统中监测的是正式名称,分对象评价时,应不考虑监测对象中的标点符号,将《挑战吧太空》和《挑战吧!太空》作为一个评价对象。

1.评价对象出现1次

《梦想的声音》《蒙面唱将猜猜猜》《明星大侦探》《我就是演员》4档电视综艺仅出现1次,在第一自然段,褒贬值均为2.33。电视综艺《挑战吧太空》在第三自然段出现1次,褒贬值为2.5。电视剧《你和我的倾城时光》、“赵丽颖”在第二自然段各出现1次,褒贬值均为2.0。明星“白敬亭”“张钧甯”“魏大勋”“陈伟霆”在第二段各出现1次,褒贬值均为2.5。图1-7是《梦想的声音》《明星大侦探》《你和我的倾城时光》的检索结果。

图1-7 分对象评分结果(2019年2月3日截图)

2.评价对象出现多次

《亲爱的客栈》在第一、第三自然段出现,褒贬值为2.42。明星“张雨绮”“杨紫”各出现3次,分别在标题和第三自然段,褒贬值均为2.5,明星“吴亦凡”“邓伦”在第三自然段各出现2次,褒贬值均为2.5。图1-8是“张雨绮”检索结果。

图1-8 明星“张雨绮”检索结果(2019年2月3日截图)

(二)比较句评价

比较句的操作界定,一个句子中有两个或两个以上评价对象和比较词。评价对象为所有监测对象,含电影、电视剧、网剧、明星、电视综艺、网络综艺、网络大电影,包括停止监测的对象。比较词是判断比较句的关键标识,是一种特殊的褒贬词,有褒贬值。

根据比较句的一般句型,分差比、等比两大类,再分肯定和否定。相关规则通过句式和赋值规则表达。句式只列出比较句的必需成分,可以增加成分(程度副词等);赋值规则中的褒贬词值等于褒贬词与程度副词之值的乘积。例句中“/”“()”分别表示分词符和褒贬值。A、B分别表示评价对象A和评价对象B。

1.肯定差比

1.1 句式:A+比(比起、较、相比)+B+褒贬词。

赋值规则:比较词值=1;B=褒贬词值;

A=比较词褒贬值×B×程度词值 或

=B×1.5(没有程度副词或程度词值小于1.5);

例1:《/我不是药神/》/比/《/战狼2/》/好看(2.0)/多(2.0)/了/。

《我不是药神》=1×2×2=4,《战狼2》=2

例2:《/我不是药神/》/比/《/战狼2/》/好看(2.0)/。

《我不是药神》=1×2×1.5=3,《战狼2》=2

例3:《/我不是药神/》/比/《/战狼2/》/好看(2.0)/一些(0.5)/。

《我不是药神》=1×2×1.5=3,《战狼2》=2

例4:黄轩/比/杨颖/演/得/好(2.0)/。

黄轩=2×1.5=3,杨颖=2

1.2句式:(在……褒贬词……方面),A+优于(强于、好于、高于、高过、胜过、超过、超越、好过)+B。

赋值规则:比较词值=2;B=比较词值=2

A=褒贬词值×比较词值或

=B×1.5(没有程度词或程度词值小于1.5);

例1:《/我不是药神/》/超越(2.0)/《/战狼2/》/多(2.0)/了/。

《我不是药神》=2×2=4,《战狼2》=2

例2:《/我不是药神/》/超越(2.0)/《/战狼2/》/。

《我不是药神》=2×1.5=3,《战狼2》=2

例3:在/耐看(2.0)/程度/上/,/《/我不是药神/》/远远(1.5)/超越(2.0)/《/战狼2/》/。

《我不是药神》=2×2×1.5=6,《战狼2》=2

例4:在/暴力(-1.0)/程度/上/,/《/战狼2/》/远远(1.5)/超过(2.0)/《/我不是药神/》/。

《战狼2》=-1×1.5×2=-3,《我不是药神》= 2

1.3 句式:(在……褒贬词……方面),A+有别于(区别于、不同于)+B。

赋值规则:比较词值=1;B=A=0;

例1:在/低俗(-2.0)/上/,/《/花千骨/》/有别于/《/楚乔传/》/。

《花千骨》=0;《楚乔传》=0

1.4句式:(在……方面),A+与(同、跟、和)+B+存在差异(差距、差别、区别)。

赋值规则:比较词值=1;评价对象B=评价对象A=0;或根据后续文本判断。

例1:在/演技/上/,/黄轩/与/杨颖/存在差异/。

黄轩=杨颖=0

1.5句式:对于(针对)A来说,B在……方面+褒贬词(稍逊一筹、相形见绌、更胜一筹)。

赋值规则:比较词值=1;A=-1×褒贬词词值;B=褒贬词词值;

例1:对于/《/战狼2/》/来说/,/《/我不是药神/》/在/剧情/上/稍逊一筹(-1.0)/。

《战狼2》=(-1)×(-1)=1,《我不是药神》=-1

例2:对于/《/战狼2/》/来说/,/《/我不是药神/》/在/剧情/上/更胜一筹(2.0)/。

《战狼2》=-2×1=-2,《我不是药神》=2

2.否定差比

2.1 平级否定差比

句式:A+不比(没有、不如、不及、比不上、亚于、逊色于、劣于、弱于)B+褒贬词。

赋值规则:比较词值=1;A =B/2;B=褒贬词值;

例1:《/战狼2/》/不及(1.0)//《/我不是药神/》/好看(2.0)/。

《战狼2》=2/2=1,《我不是药神》=2

例2:《/我不是药神/》/不及(1.0)//《/战狼2/》/难看(-1.0)/。

《我不是药神》=(-1)/2=-0.5,《战狼2》=-1

2.2倍级否定差比

句式:A+非常不如(非常比不上、很不如、很不及、很比不上、十分不如、十分不及、十分比不上、尤为不如、尤为不及、尤为比不上、甚为不如、甚为不及、甚为比不上)B+褒贬词。

赋值规则:比较词值=2;B=比较词值×褒贬词值;评价对象A=B/4;

例1:《/战狼2/》/很不及(2.0)//《/我不是药神/》/好看(2.0)/。

《战狼2》=4/4=1,《我不是药神》=2×2=4

例2:《/我不是药神/》/很不及(2.0)//《/战狼2/》/暴力(-1.0)/。

《战狼2》=(-1)×2=-2,《我不是药神》=(-2)/4=-0.25

2.3倍级否定差比

句式:A+很大程度上不如(很大程度上不及、很大程度上比不上、很大程度上逊色于、很大程度上劣于、很大程度上弱于)B+褒贬词。

赋值规则:比较词值=1.5;B=比较词值×褒贬词词值;评价对象A=B/3;

例1:《/战狼2/》/在很大程度上不及/《/我不是药神/》/好看(2.0)/。

《战狼2》=3/3=1,《我不是药神》=1.5×2=3

2.4半倍级否定差比

句式:A+有点不如(有点比不上、有点不及、有点逊色于、有一点儿比不上、有一点儿不如、有一点儿不及、有一点儿逊色于、略不及、略不如、略比不上、略逊色于、略劣于、略弱于、略亚于、稍稍不如、稍稍不及、稍稍比不上、稍亚于、稍逊色于、稍劣于、稍弱于)B+褒贬词。

赋值规则:比较词值=0.5;B=比较词值×褒贬词值;评价对象A=B/1.5;

例1:《/战狼2/》/有一点儿不及//《/我不是药神/》/好看(2.0)/。

《战狼2》=1/1.5=0.67,《我不是药神》=0.5×2=1

2.5 句式:A在……方面(上)没有(不如、不及、比不上、亚于、逊色于、劣于、弱于)B+(褒义词)。

赋值规则:比较词值=1;B=比较词值×(褒义词);A=-1×比较词值;

例1:杨颖/在/演技/上/不及/赵丽颖/。

杨颖=(-1)×1=-1,赵丽颖=1

2.6 句式:A(在……方面)没有(不如、不及、比不上、亚于、逊色于、劣于、弱于)B+贬义词。

赋值规则:比较词值=1;B=比较词值×贬义词;A=0.5×B;

例1:/杨颖/在/演技/上/不及/赵丽颖/差(-1.0)/。

杨颖=0.5×(-1)=-0.5,赵丽颖=1×(-1)=-1

2.7句式:A+没有比+B+褒贬词

赋值规则:比较词值=1;A =B/2;B=比较词值×褒贬词值;

例1:《/我不是药神/》/没有比/《/战狼2/》/难看(-2.0)/。

《我不是药神》=(-2)/2 =-1,《战狼2》=(-2)×1=-2

例2:《/我不是药神/》/没有比/《/战狼2/》/好看(2.0)/。

《我不是药神》=2/2=1,《战狼2》=1×2=2

3.肯定等比

3.1句式:A+跟(与、和、同)+B(C、D……)一样(差不多一样、几乎一样、完全一样、很一样、非常一样、如出一辙、一模一样、雷同、相同、相似、类似、近似、差不多)+褒贬词

赋值规则:比较词值=1;A=B=C……=褒贬词值;

例1:《/人民的名义/》/的/侯勇/和/吴刚/一样/精彩(2.0)/。

《人民的名义》=侯勇=吴刚=1

例2:《/创业时代/》/中/杨颖/和/《/宝贝儿/》/中/杨幂/的/表演/一样/差(-1.0)/。

《创业时代》=杨颖=宝贝儿=杨幂=-1

3.2 句式:(在……方面),A+相当于(等于、等价于、近似于、不相上下、旗鼓相当)+B。

赋值规则:比较词值=1;A=B=程度词×褒贬词值;

例1:在/演员/演技/好(2.0)/方面/,/《/我不是药神/》/相当于/《/战狼2/》。

《我不是药神》=《战狼2》=2

例2:在/暴力(-1.0)/程度/上/,/《/我不是药神/》/近似于/《/战狼2/》/。

《我不是药神》=《战狼2》=-1

3.3句式:在……(褒贬词)方面,A可与B媲美(比美、分庭抗礼、平分秋色、平起平坐、差不多)。

赋值规则:比较词值=1;A=B=褒贬词×比较词值;

例1:在/耐看(2.0)/度/上/,/《/战狼2/》/可与/《/我不是药神/》/平分秋色/。

《战狼2》=《我不是药神》=2×1=2

例2:在暴力(-1)度上,/《/战狼2/》/可与/《/我不是药神/》/平分秋色/。

《战狼2》=《我不是药神》=-1×1=-1

3.4 句式:在……(褒贬词)方面,A与(跟、和、同)B一样(差不多一样、几乎一样、完全一样、很一样、非常一样、如出一辙、一模一样、相同、相似、类似、近似、差不多)

赋值规则:比较词值=1;A=B=褒贬词×比较词值;

例1:/演员/演技/方面/,/《/我不是药神/》/和/《/战狼2/》/差不多/。

《战狼2》=《我不是药神》=1

3.5句式:像(犹如、如同、堪比)A,B+褒贬词。

赋值规则:比较词值=1;A=B=褒贬词值;

例1:如同/《/战狼2/》/一样/,/《/我不是药神/》/也/具有/独特(1.0)/的/优势(1.0)/。

《我不是药神》=《战狼2》=1

4.否定等比

4.1句式:A+跟(与、和、同)+B不一样(几乎不一样、完全不一样、很不一样、非常不一样、天差地别、不可同日而语、迥异)

赋值规则:比较词值=1;A=B=0;

例1:/《/我不是药神/》/同/《/战狼2/》/不可同日而语/。

《我不是药神》=《战狼2》=0

4.2句式:A的+褒贬词+跟(与、和、同)+B+不一样(几乎不一样、完全不一样、很不一样、非常不一样、天差地别、不可同日而语、迥异、不相同、不相似、不类似、不近似、不一样、差很多)

赋值规则:比较词值=1;A=褒贬词值;B=-1×褒贬词值;

例1:《/我不是药神/》/的/伟大(2.0)/意义/同/《/战狼2/》/不可同日而语/。

《我不是药神》=2,《战狼2》=-2

例2:《/战狼2/》/的/暴力(-1.0)/同/《/我不是药神/》/不可同日而语/。

《战狼2》=-1;《我不是药神》=(-1)×(-1)=1

5.其他

5.1 句式:A+有(像)B+这么(那么)+褒贬词。

赋值规则:比较词值=1;A=B=褒贬词值;

例1:《/我不是药神/》/有/《/战狼2/》/这么/好看(2.0)/。

《我不是药神》=《战狼2》=2

5.2句式:A+没有(不像)B+这么(那么)+褒贬词

赋值规则:比较词值=-1;B=褒贬词值;A=比较词值×褒贬词值;

例1:《/我不是药神/》/没有/《/战狼2/》/这么/好看(2.0)/。

《我不是药神》=(-1)×2=-2,《战狼2》=2

例2:《/我不是药神/》/没有/《/战狼2/》/这么/难看(-2.0)/。

《我不是药神》=(-1)×(-2)=2,《战狼2》=-2

5.3 句式:A+跟(同、和)B+这么(那么)

赋值规则:比较词值=1;A=B=褒贬词值;

例1:《/我不是药神/》/同/《/战狼2/》/这么/好看(2.0)/。

《我不是药神》=《战狼2》=2

5.4 句式:比起A,B+更(还)+褒贬词(更、还同时是程度副词)

赋值规则:比较词值=1;A=褒贬词值;

B=A×程度词值或 =A×1.5(没有程度副词或程度词值小于1.5);

例1:比起/《/我不是药神/》/,/《/战狼2/》/更(2)好(2.0)/看/。

《我不是药神》=2,《战狼2》=2×2=4

例2:比起/《/我不是药神/》/,/《/战狼2/》/还(1)好(2.0)/看/。

《我不是药神》=2,《战狼2》=2×1.5=3

例3:比起/《/我不是药神/》/,/《/战狼2/》/更(2)难(-2.0)/看/。

《/我不是药神/》=-2,《战狼2》=(-2)×2=-4

5.5句式:比起A,B没有更+褒贬词

赋值规则:比较词值=1;A=B=褒贬词值;

例1:比起/《/我不是药神/》/,/《/战狼2/》/没有更/好(2.0)/看/。

《我不是药神》=《战狼2》=2

5.6 句式:A与B相比(对比、比较),A更(还)+褒贬词

赋值规则:比较词值=1;B=褒贬词词值;

A=B×程度词值或=B×1.5(没有程度副词或程度词值小于1.5);

例1:《/我不是药神/》/与/《/战狼2/》/相比/,/《/我不是药神/》/更(2)好(2.0)/看/。

《我不是药神》= 2×2=4,《战狼2》=2

例2:《/我不是药神/》/与/《/战狼2/》/相比/,/《/我不是药神/》/还(1)好(2.0)/看/。

《我不是药神》= 2×1.5=3;《战狼2》=2

5.7句式:A与B相比(对比、比较),B更+褒贬词

赋值规则:比较词值=1;A=褒贬词词值;

B=A×程度词值 或 =A×1.5(没有程度副词或程度词值小于1.5);

例1:《/我不是药神/》/与/《/战狼2/》/相比/,/《/战狼2/》/更(2)/好(2.0)看/。

《战狼2》= 2,《我不是药神》=2×2

例2:《/我不是药神/》/与/《/战狼2/》/相比/,/《/战狼2/》/更(2)/难(-2.0)看/。

《战狼2》=(-2)×2=-4,《我不是药神》=-2

5.8 句式:较(较之、比较)B,A还(更)+褒贬词

赋值规则:比较词值=1;A=褒贬词词值;

B=A×程度词值 或 =A×1.5(没有程度副词或程度词值小于1.5);

例1:较之/《/我不是药神/》/,/《/战狼2/》/更(2)/好(2.0)看/。

《战狼2》=2×2=4,《我不是药神》=2

例2:较之/《/我不是药神/》/,/《/战狼2/》/还(1)/难(-2.0)看/。

《战狼2》=(-2×1.5)=-3,《我不是药神》=-2

5.9 句式:较(较之、比较)B,A没有更+褒贬词

例1:较之/《/我不是药神/》/,/《/战狼2/》/没有更/好(2.0)/看/。

《我不是药神》=《战狼2》=2

(三)其他

1.增加豆瓣评论数据

根据监测对象,收集电影、电视剧、电视综艺、网络综艺和网剧的豆瓣评论和豆瓣评分。豆瓣评价每天收集,豆瓣评分每月收集一次。

2.数据收集

为了提升收集信息准确性,系统在收集新闻、论坛、微信时,对电影、电视剧、电视综艺、网络综艺、网剧和网络大电影等视频产品只抓取有书名号的信息。如收集电影《影》的信息,对“影响”“影子”“影”等不抓取,只抓取含有“影”的信息。增加书名号,虽然会漏抓取部分应抓取的信息,但可以极大提升如电影《影》、电视综艺《非常完美》等使用常用词为名称的视频产品收集信息的准确程度。