编者按:“近代以前的中国历史,由于统计资料的缺乏,很难诉诸系统的计量研究。迄至清季,新式统计开始出现,但局限于海关等少数经济领域。民国时期,各部门的统计逐渐完善起来,这就使得计量方法有了广泛的应用空间。”本文论述了民国时期政府统计资料的史料价值及其使用中遇到的具体困难。本文出自《民国时期社会发展的计量研究与政府统计资料利用》,载《大数据与中国历史研究》第1辑。马敏,华中师范大学中国近代史研究所教授;陆汉文,华中师范大学社会学院教授。
民国政府卷帙浩繁的统计资料既有其值得珍视和利用的一面,也有其需谨慎对待的另一面。然而,也许正是这种状况使历史研究本身具有“仁者见仁,智者见智”的学术魅力,给我们的研究工作留下了很大的空间。诚如有研究者所指出的,即使比较可信的资料,也可能会有不足或遗漏,需要经过史料的考证、评估等过程,才能够得出可靠的研究结论。退一步说,即使最不可信的资料,也并非毫无价值,其中总会蕴藏着一些真实的东西,关键在于我们如何去发掘、甄别和利用。因此,研究者在微观层面上对具体统计资料的恰当评估和谨慎利用就显得尤为重要。例如,自杀作为一种意外变故,政府机关是不可能统计清楚的。内政部通过各城市公安机关统计的上海、南京等31个城市1932年自杀人数共1277人,而实际上仅上海市1932年的自杀人数即多于该数,自杀统计遗漏之惊人由此可见一斑。因此,根据政府统计直接计算自杀总人数及在总人口中所占比例等总体数据没有什么意义。但是考虑到通常情况下不同性别、不同年龄、不同原因自杀者被遗漏的概率应该相差不大,且不同城市的结构性误差可相互抵消一些,存在惊人遗漏的各城市自杀统计仍可以视为自杀总体的一个有代表性的样本,包含着非常有用的信息,可用以推论城市自杀现象的结构特征,如自杀者性别构成、自杀者年龄构成、自杀原因等。可见,只要研究者能够真正重视并认真检视民国政府的统计资料,就完全可能发掘出这些数据的价值,使之成为历史研究中的有用史料。
不仅如此,与文字资料相比,民国时期的政府统计资料还具有非常独特的价值。首先,政府统计旨在周知国势民情以及政府工作绩效,作为政府施政之参考及社会各界之借镜。因此,历史上遗留下来的政府统计资料实际上是时人和今人可以共享的“文本”。透过“文本”,我们不仅可以明了时人对处身其中的国家和社会的认识和概括,而且可以提出我们今天的解释,并在与时人的概括相比较的过程中,达成与时人的对话,进而更好地进入“文本”,更透彻地理解历史。另一方面,由于同一历史时期世界上许多国家都已建立起比较完善的统计制度,收集有丰富的统计资料,并且不同国家的统计方案和规则也有很多相通的地方,这就使得以政府统计资料为依据开展民国时期我国与世界上其他一些国家的比较研究不仅可能,而且非常便利。这有助于认识当时的中国与其他国家的差距。国民政府主计处统计局汇编《中华民国统计提要(二十九年辑)》专辟“国际比较”一类资料即显明了这种可能性。同样,以统计资料为依据,对民国时期的中国与当代中国及其他一些发展中国家进行比较,可以帮助我们更好地理解中国社会主义建设取得的成就,及反过来以当代中国及其他一些发展中国家为参照更好地评价民国历史。实际上,统计资料算得上对具有不同传统及发展模式的国家或同一国家的不同历史阶段进行比较的最好依据之一。当然,比较并不是简单地看数据的表面差异,而是要以一定的理论和指标体系为指导,深入数据的背后,寻找深层次的东西。
其次,民国政府的统计资料涉及国势民情的方方面面,不仅包括政治的、经济的、人口的,而且包括教育的、卫生的、社会的;不仅包括城市的,而且包括农村的;不仅包括上层的,而且包括下层民众的;等等。所以,这些统计资料是民国时期遗留下来的涉及范围极为广阔的史料类型,不仅史料基础已很扎实的政治史、经济史等可以从中受益,而且社会史之类史料基础相对较薄弱的研究领域也可以直接扎根其中。比如,我们的很多研究成果,包括政治史、经济史等等,经常面临的问题就是,众多的档案文献记载的主要是精英人物的活动,因而很难写出包含普通人物的历史。统计资料则由于往往包括总体的数据,注重面上的情况,而有助于我们克服这样的问题。又如,社会史作为一种新的研究“范式”,强调“综合的”、“整体的”取向,但社会生活千头万绪,包罗万象,社会史研究要避免“琐碎化”的陷阱,除了理论方面的建设外,史料的选择也很重要。如果史料本就极为琐碎零乱,其“结构化”自然很困难。由于是按照特定目的和程序或完整的统计方案而收集汇编的,民国时期尤其是主计处成立后的许多统计资料本来就具有“综合的”、“整体的”和“结构化的”特点,因此,这些资料用于社会史研究具有不可替代的长处。
再次,统计资料主要是以数字形式表达的史料,而数字显然是最精练、最便于使用的记录符号,这就使得统计资料具有其他很多史料无法比拟的优势。在方法论意义上,统计资料有助于计量史学的理论与方法在中国的运用。计量史学作为一种方法论路径,只能用于那些可以用数字表达出来的史料。近代以前的中国历史,由于统计资料的缺乏,很难诉诸系统的计量研究。迄至清季,新式统计开始出现,但局限于海关等少数经济领域。民国时期,各部门的统计逐渐完善起来,这就使得计量方法有了广泛的应用空间,可以用中国的经验数据检验计量史学相关理论和方法的适用性和解释力,建构和发展中国的计量史学科体系。另一方面,尽管计量史学也有自身的缺陷,但对于具有深厚、悠久人文史传统,习惯于“定性”分析的中国史学界来说,计量方法仍然具有不可替代的作用和独特的优势,可借以深化许多已有研究成果,或实现新的突破。比如,现代统计方法和计算机软件技术的迅猛发展和密切结合,使得统计资料的使用和分析变得非常方便,在没有计算机的情况下无法真正应用于实践的一些多元分析技术,现在可以轻松地通过统计软件完成,我们因此可以将更多因素纳入历史研究的视野,将表面上看来互不相干的一些变量引入统计模型,经过反复运算,寻找其深层联系,从而有可能提出新的问题,发现历史的新面相。
最后,民国时期的政府统计资料是在特定的统计制度下,由特定的人员按照特定的程序和方法收集汇编的,绝大多数统计表格都附录有资料来源及其他具体说明,因而其甄别考证等工作一般而言应有轨可循。此外,以数字形式表达的史料相互印证的机会更多。比如,不同年份的数据可以根据变化的趋势和可能性相互印证,不同类型的统计数据可以根据彼此的依存关系相互印证,不同地域的统计数据可以根据地域差异相互印证,等等。所以,未经细致考证的统计资料比其他史料更容易露出破绽,这就给统计资料的考证提出了更高的要求。换言之,以统计资料为依据进行研究,必须更注重其可靠性、可信性,更注重考证功夫。在这个意义上,以统计资料为依据的研究更值得信赖,更科学。
另外需要提及的是,尽管政府统计资料具有很高的史料价值,但在民国史研究中的利用还面临着其他一些不容忽视的具体困难。比如,政府统计浩如烟海,其发掘和整理工作异常繁重。除主计处统计局汇编的综合性统计资料(如《中华民国统计年鉴》等)比较集中外,在当时各种杂志、报纸、学术著作、年鉴、中央政府各部门出版物、地方政府出版物等载体上都散布有大量的政府统计资料,系统搜集和整理这些资料的难度极大。迄今为止,尚无关于民国时期政府统计的大型汇编资料问世,而在这方面单凭个别研究者的努力是很难取得巨大成效的。又如,因时局的动荡,民国时期政府统计在时间上的连续性不强,很多数据在一些年份上存在残缺不全的情况,这使得长时段的纵向比较和趋势分析常常成为无米之炊。尽管部分领域残缺的数据(如物价)可以通过各种方法估算出来,得出一个连续序列,但这毕竟提高了数据误差的可能性。再如,中国地域辽阔,区域差异鲜明,同样的数字在不同的地方可能有不同含义,需要做不同的解释。这就要求研究者的数据分析工作能够将抽象的数字与各地丰富多彩的现实生活联系起来,做出恰如其分的分析和解释。这些都在一定程度上为利用统计资料进行历史研究增加了难度,提出了更高的要求。
本文原刊:社科文献出版社近代史主题微信号