排行榜指标的权重设置

来源 :当代作家 | 被引量 : 0次 | 上传用户:fengjintao1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  排行榜是以数据为基础,数据指标的完备与否就成为排行榜的结果是否科学有公信力的前提。指标设置越多,越趋向科学、合理。问题是,文学作品的许多指标无法量化统计,有些能够量化统计的,又无法取得完整的数据。能够取得完整数据的指标,其价值和置信度也不同。比如我们要谈论一个诗人的影响力,我们就渴望知道:他有多少作品传世,作品有多少版本,历代刻印发行量多大,码洋多少,多少人学习、模仿、谈论过、选过他的作品,海外知名度如何,石刻作品多少次,多少地方有他的遗迹和纪念地,美誉度或恶评如何,画像有多少,有关他的文物拍卖价多高……总之,这些指标越多越详细越好。可惜,它们大部分无法取得准确的统计数据。
  我们在做《唐诗排行榜》时,考虑过要统计每一首诗对后世诗人创作的影响,但数据采集相当困难。做《宋词排行榜》时,为了统计每首宋词对后世词人的影响,我们采集了后世词人追和宋词的情况,但这也只是后世词人学习仿效宋词的一个方面,创作方法和创作精神上的仿效暂时还没有好的办法采集数据来统计。
  对比“国家综合实力排行榜”、“城市综合竞争实力排行榜”的数十个指标,我们的唐诗宋词排行榜只用三、五个指标,当然太少,难以让人信服。努力寻找新的排行指标,增加指标的丰富度,借以提高可信度,将是改进文学影响力评价指标体系的主要途径。理想的情况应该找到十种以上的排行数据源,然后进行数据处理。我们目前能考虑到的作品影响力的评价指标,大约可分三类:作品的典范性、美誉度和传阅度。权重的设置,主要有客观赋权和主观赋权两种。客观赋权,是以定量分析的方法,根据数据的完备程度、分布密度和活跃程度等计算出各指标的权重;主观赋权,是用定性分析的方法,根据各个指标影响因子的大小来人为设定各指标的权重。主观赋权法,又有专家评判法和层次分析法两种。唐诗宋词排行榜主要用主观赋权法中的专家评判法,虽然有一定的学理依据,但因为是初次尝试,没有前行的成果可资借鉴,也未经众多专家的讨论形成共识,所以对相关权重的设定,能是“一家之言”,未必能得到公众和专家学者的认可。
  文学排行榜评价指标的权重设置,最理想的状态是客观赋权法和主观赋权法相结合。可以考虑:各种类别的指标用客观赋权法,通过软件计算来确定;而各个具体指标,用主观赋权法来设置,定性分析中参用定量数据。比如选本,既要考虑选本这一大类指标在整个评价指标体系中的权重(用客观赋权法计算),又要考虑每个选本指标的权重差异。试举几个宋词选本为例说明:
  南宋曾慥的《乐府雅词》编成于南宋高宗绍兴十六年(1146年),黄升的《花庵词选》成书于理宗淳祐九年(1249年),明代陈耀文的《花草稡编》初刻于万历十一年(1583年),清代朱彝尊编选的《词综》始刊于清康熙三十年(1691年),近人朱彊邨《宋词三百首》初印于1924年,宋词排行榜中采用选本最晚的一种是2003年高等教育出版社出版的《中国古代文学作品选》。从传播、出版的周期(时间长度)来看,如果以2008年统计得出《宋词排行榜》的结果为下限,那么,《乐府雅词》的出版周期已有862年,《花庵词选》的周期有759年,《花草稡编》有425年,《词综》有317年,《宋词三百首》为84年,《中国古代文学作品选》仅5年。传播周期越长,其传阅度应该越高,到达率、知晓率应该越高。如果不加区别地将每个选本入选的数据同等看待,当然是不公平、不合理的。这还仅仅是时间上的传播周期的差别,还没考虑空间上的传播广度。传播广度无法用数据来衡量,但可以依据每个选本的版本种数(印次)、印数(发行量)来评估。发行数百万册的《宋词三百首》肯定比发行几万册的《中国古代文学作品选》的到达率、传播广度要大得多。因此,每一部词选,由于传播周期(长度)和发行量(广度)不同,而具备不同的传播含金量,也就是传播实际效率。因此,在统计不同作品入选频次之前,应对所有词选进行这种含金量的系数评定,使每一部词选都有不同的传播效率系数。一首作品入选不同的词选,即获得不同的系数积分。这与现代电视的收视率统计原理大致相同。
  传播周期与传播广度又如何设定分值?唐诗宋词排行榜是按朝代来区分权重,尚嫌粗略。是否可以按年限来计算传播周期的得分?比如,上述《乐府雅词》的周期为862年,如果1年计1分,那么其传播周期得分为862分,而《宋词三百首》得84分,《中国古代文学作品选》得5分(具体统计时当然会对这些数值作标准化处理,否则数值过大,不便于比较分析)。那些出版年代不详的选本,可以据其成书的时代虚拟一个大致的周期时限。传播广度的得分,古代词选按版本种类计算(如1种版本得1分),现代词选按版次计算(重印或再版1次计1分),现代词选还应考虑其印数的多少。传播周期数与版本(版次)数的乘积,经过标准化处理后转换成选本的效率系数。这些印数和发行量的数据,现在有的是可以获得的。时过境迁之后,就很难说了。所以,我们应该注意搜集和保存这些出版发行量的资料数据。
  在考量每个选本的传播周期时,还应考虑每个选本的传播时间差。这二者表面看起来,都涉及选本出版的時间长度,但实际上还是有区别,传播周期是就选本在整个传播历程中的长度而言,传播时间差是指同时代的选本出现的先后早晚。如唐诗选本中,盛唐的选本只可能入选初、盛唐人的诗作,无法入选此后中、晚唐的诗篇,以盛唐选本来统计和比较整个唐代诗人诗作的人选篇次,显然对中、晚唐的诗人不公平,因为他们没有“入选权”。同样,宋人词选中,南宋初期成书的《乐府雅词》,就无法入选南宋中叶以后的词人,如辛弃疾、张孝祥、陆游和姜夔、吴文英等人都没有“入选权”;在黄升的《花庵词选》中,宋末的周密、王沂孙、张炎、蒋捷和文天祥等人,也没有机会入选。初唐人与晚唐人相差了两百多年,宋初的词人比宋末的词人早了近三百年,前者有更多的传播机会。把他们进行同等的传播数量统计,必须将这个时间差考虑进去,以权重系数抹平彼此的时间差。评点数据中,对同时代被评的作家作品,也受这种时间差的影响,必须一并考虑其权重以平衡客观数据存在的差异。
其他文献
在汽车还没有翻过小山——附近的人都把这稍稍隆起的土堆称为小山——的顶部时,卡拉就已经听到声音了。那是她呀,她想。是贾米森太太——西尔维亚——从希腊度假回来了。她站在马厩房门的后面——只是在更靠内里一些的地方,这样就不至于一下子让人瞥见——朝贾米森太太驾车必定会经过的那条路望过去,贾米森太太就住在这条路上她和克拉克的家再进去半英里路的地方。  倘若开车的人是准备拐向他们家大门的,车子现在应当减速了。
这是妈妈的背影,矮小的身躯,佝偻的背梁;满头的白发,就像那初冬的寒霜;低着头一言不发,迷茫地走向前方。但是我知道,那弯曲的后背,曾经是挺直的脊梁。是那矮小的身躯,把千斤重担扛。为了家庭的安宁,为了孩子们的成长。我也知道,那滿头的白发,曾经戴过美丽的红妆。是岁月的征尘,把一头黑发染成秋霜。但那每一根发丝,都绽放着无私奉献的光芒。亲爱的妈妈,请您回头看看,您已经走了很长的路,再不用那么脚步匆忙。请您停
这里贾珠又将状子看了一遍,仍复揣在怀内,登上靴子,戴了个便帽儿,走上大堂,叫过潘又安来嘱咐道:“我到外边走走,老爷要问我,你就说老太太差我买绸缎去了。”潘又安问道:“大爷坐车去还是骑马去呢?”贾珠道:“车马一概不用,步行逛逛也好,也不用小厮们跟随。再者,老爷面前不必说才刚儿老太太回来路上有人告状的话。”潘又安忙答应了一个“是”。贾珠遂从角门步行走出。  原来冯渊的寓所即在衙门后街,时常冯渊请贾珠到
我按他说的,拐进转盘式交叉路口的左数第二条路,尽头处果然有一座俨然往昔别墅的格调优。雅的古式建筑。院子点缀着形状别致的石块和石雕灯笼等物,草木也都修剪得整整齐齐。看来这地方以前可能是某人的别墅园地。由此有拐穿过树林,眼前出现一座三层高的钢筋混凝土楼房。虽说是三层,但由于建在仿佛地面被掘开的凹陷处,并没特别给人以威严之感。建筑物造型简练,显得十分洁净。  大厅在二楼。我上了几级楼梯,打开一扇大大的玻
是如何的一种感觉?在小巷独步,偶然抬头,别人院墙里的凤凰花探出簇簇火红,而那种花儿是几年没见过的,故乡生长的植物。  凤凰花这种植物喜欢展现自己的红色,仿佛他就是为离别而生的。年少时喜欢粘一只只凤凰花成一只只蝶,登上高楼去随风散放,她旋转飘落的姿态曾经赢得许多童稚的笑声,往事就也像这一只只蝶飘去,它们纵使旋落的姿态各不相同,终究都会消逝了。  想起凤凰花,遂想起平生未尽的志事;想起凤凰花,遂想起非
喜逢太平盛世,国人一派复兴民族文化之景观,国学也受到空前重视。这实在可喜可贺。我觉得中国人理当说好中国话,写好中国字,画好中国画,打好中国拳。才不愧炎黄子孙,龙的传人。  假期又是教师充电大好时机,我也喜结八方良师益友,在网络课堂的各个平台里,学习热情高涨,每天忙的不亦乐乎,学习实在让人感到快乐无比,想想八月末就要开学,对假期的学习还意犹未尽。  梅蘭竹菊是学画中国画必学的基础课,不光是学技法,更
春节前,我和当年开展生本教育的深圳市南山区沙河小学的汪洪校长,以及当时的三位副校长和主任(现在分别在4所学校担任校長),一起回忆既往岁月。他们为我展示了六年级孩子吴伊甸的文章《风》(全文较长,此处只列出片段)。  今夜月光清凉,习习清凉中带着一丝古老的怀想。  有这样一个人,他在风中昂首阔步,与世无争,从未被世俗所污染;有这样一个人,他绣口一吐就是“半个盛唐”。  ……  这股风席卷万世,并没有因
不出三天,地方上就开始在一条新开的小河边上,再次为秦大造屋。   “他们到底要撵我走呢。”秦大拄着拐,久久地站在她的艾地里。她想着秦大,想着当年的梦想,想着那一地的麦子,想着月光下她跟秦大醉了似地走在田埂上,想着她从乡下到区里、县里的奔波与劳顿…她在风里着老泪。   房子盖好了。   人们来让秦大搬家。她说:“我想搬,早搬了。前些年,不是也给我盖过房子,我搬了吗?   “这回是必须搬!” 
萬丈青丝倩影飘,千年情爱似今朝。  百分娇媚说难尽,十载相思到碧霄。  ——改稿于2016年2月25日
【学习要点】  小说是一种叙事性的文学体裁,它以刻画人物为中心,通过完整的故事情节和具体环境描写来反映社会生活。人物、故事情节和环境是小说的三个要素。阅读小说,与阅读一般的记叙文有很多相似之处,但同时还应根据小说的特点,着重分析小说中的人物、故事情节和环境描写,这样才能比较全面深刻地理解和欣赏小说作品。  【解题思路】  一、把握故事情节。把握好故事情节,是读懂小说的关键,也是整体感知文章的起点。