内容摘要:大数据时代仿佛有着无限风光的险峰,但对文学批评家来说,值得全心全力攀登。
关键词:文学作品;分析;研究;采样;样本;抽样;文学批评家;文学史;文学生产;思维
作者简介:
当前,文学生态发生了巨大变化,文学生产从来没有像今天这样呈爆炸式地生长。仅以长篇小说而论,我国每年正式出版四五千部。曾几何时,人们以拥书为乐,或辗转流通,或细细摩挲品味,世间故有买书、借书、藏书乃至窃书的掌故流传。今时今日,当读者面对海量的文学作品时,可随心见性自由处置,但也有被淹没于文学汪洋大海之感。
在大数据时代之前,人们可以通过数据和分析来验证猜想。以1980年代的文学为例,文学之所以能成为社会热点,与文学生产相对有限且思想表现主要集中在思想启蒙上有直接关系,还与出版流通相对缓慢有关。如研究改革文学,彼时的文学批评家完全可以穷尽有限的文本,搜集资料仍以手工为主。即便遗漏一些文本,批评家所作的推论仍然基本有效。事实证明,与1980年代文学创作一脉相承的文学批评,完成了时代的使命,成为了中国当代文学史的有机组成部分。那一代批评家艰苦努力的研究工作、身心皆投入文学的态度,为他们赢得了后人的感佩。
新世纪以来,科技的进步进一步拓展了人类的认识疆域。在大数据时代,文学作品浩如烟海,研究者们穷其膂力,也可能只见冰山一角。任何试图掌握全部数据信息的研究行为,都变得不再现实。因此,文学批评应当及时调整姿态,选择恰切的研究对象,以期最精确、准确地把握时代和它的文学。如何建设文学批评的云计算的“筋斗云”和“七十二变”,掌控高速快捷、变化多端的大数据文学,进行分析、预测,使文学认知更加科学化,便成为文学批评的前提。
以往,人们依赖抽样数据,截取片段作分析,却难以获得实证数据,只能纯粹借助局部的数据分析能力去发现未知领域的规律。无论如何,这样的认识存在局限,必然流于肤浅、表面。文学研究一度成为最受争议和怀疑的门类,因为它远离实证数据,其抽样分析结果、归纳得出的理论与动态的现实很难相符。
当前,文学生产的速度超乎我们的想象,任何人都不能读尽当年的文学作品。在大数据时代,我们面对文学整体时,只有抽取随机样本。文学批评家也将逐渐接受这个事实,将作为研究对象的“样本”等同于“全体”;但是,文学批评对象的选择,却不能“装进篮子里就是菜”,这就涉及文学批评的标准问题。统计学家的实践表明,采样分析的精确性仅仅与采样的随机性有关,而不与采样的数量有关。大数据时代如何选择批评对象,实际上就是使用何种文学标准进行抽样分析,这也是确立何种方法论的艰难选择。







