你大概想不到,鲁迅写了上千万字,用到的汉字却还不到《新华字典》的一半。
这话听着像开玩笑,却是真事。2015年,国家社科基金重大项目有个调查,鲁迅一生写下的东西,光是能统计到的就有1500万字左右。其中创作部分大约1000万字,手稿现存大约600万字,剩下400万字不知散落到哪里去了——可能是搬家时丢了,也可能是战乱中毁了,还有可能压在某个收藏家的箱底还没露面。
但不管怎么写,鲁迅用的字并不多。有学者拿计算机统计了《鲁迅全集》三百多万字的纯文本,发现他翻来覆去用的大约也就5500到6000个不同的汉字。这数字是什么概念?《新华字典》收录了13000多个字,鲁迅连一半都没用上。要是单看他的小说,比如《呐喊》《彷徨》,字数更少——大约12万字的体量,不重复的汉字只有3051个。这恰好和国家语委公布的《现代汉语常用字表》一模一样,3500字。
换句话说,你只要认得日常最常用的那三千多个汉字,鲁迅的小说里就没有你不认识的字。
那问题来了,一个人写了上千万字,怎么就用这么点字?
答案藏在两个地方。一个是鲁迅的修改习惯,一个是鲁迅的阅读量。
先说修改。鲁迅写文章有个怪癖——他特别喜欢加转折词。上海交通大学有个研究手稿的学者叫王锡荣,带着团队把鲁迅的手稿翻了个遍,发现一个有意思的事:鲁迅在手稿上修改的时候,转折词从来只增不减。今天写了个“但”,明天改成“但是”,后天又在前面加个“然而”。《记念刘和珍君》那篇文章大家都读过,全文2344个字,光“但”就用了15次,“却”用了8次,“然而”用了5次,“可是”用了1次,加起来30多个转折。平均每80个字就要转一下。
这意味着什么?意味着鲁迅的语言是在不停地对话、辩证、推翻自己。他不是那种“我说完了你就信了”的写法,而是一边写一边质疑,一边肯定一边否定。这种写法不需要认识多少生僻字,但需要你把每个常用字都用出花来。
另一个原因是阅读量。鲁迅到底读了多少书?北京鲁迅博物馆有个数据:他一生读书4000多种,藏书13000多册。但有意思的是,他的藏书大多是“常本”,也就是市面上最常见的那种版本,不是什么海内孤本。许广平后来回忆说,鲁迅对善本、珍本“购买力未必很高”,常常只能买些便宜货。1912年冬天,他在琉璃厂花七角钱买了一本《晚笑堂画传》,买完了还在日记里吐槽说画得“甚恶”。年底盘点时又感叹,那些有本事的人把古书当古董玩,自己这种没钱的读书人,每个月只能花二十多块大洋“收拾破书数册以自怡说”。
就是这么个买“破书”的人,靠着这些普通得不能再普通的书,读出了一个上千万字的作家。
更耐人寻味的是,鲁迅写那么多字,并不是在舒服的环境里写的。1930年代在上海,他被特务盯上,搬了好几次家,稿纸、钢笔就装在帆布包里,走到哪儿写到哪儿。咖啡馆的角落、旅馆的房间,都是他的书房。晚年肺结核加肋膜炎,体重不到80斤,连起身都费劲,就靠在躺椅上,拿棉被垫着写。去世前一个月,他还写了七篇杂文,将近一万字。
一个写了几千万字的人,用的字还没你手机里的输入法字库多。这说明一个道理:写作这事,从来就不是比谁认的字多。
