2.2 中英文语料的选择与输入
自莎剧全集问世以来,英文版本为数众多,受到人们推崇的版本主要有牛津版(1743)、撒缪尔·约翰逊版(1765)、里德版(1803)、和河畔版(1974),以及阿登系列版本(1899,1958,1995),等等。牛津版是托马斯·汉默(Sir Thomas Hanmer)编辑的6卷本《莎士比亚作品集》,分别于1743年和1770年在牛津出版。该版本是早期版本中校勘比较仔细的。撒缪尔·约翰逊版是由《英语辞典》编撰者撒缪尔·约翰逊编辑的8卷本《莎士比亚戏剧集》,1765年在伦敦出版。该版本收入许多莎学名家的相关评论和编者所作的注释。里德版是里德主编的莎学史上规模最大的21卷本《第一集注本》(The First Variorum)。该版本收入相关莎学评论和注释,并附有词汇索引。河畔版,即伊文斯(G.Blakemore Evans)主编的一卷本《河畔本莎士比亚》(The Riverside Shakespeare)(波士顿,1974),是目前在莎士比亚课堂教学中受到师生欢迎的版本。《阿登版莎士比亚》首版主编是著名莎士比亚学者克雷格(W.J.Craig,1899——1906),后由另一著名莎士比亚学者珂斯(R.H.Case,1909——1924)继任主编。第二版又称《新阿登版莎士比亚》,主编是莎学家厄里斯-菲莫尔(UnaEllis-Fermor,1946——1958)教授,由缪修安出版公司(Methuen&Co.Ltd.)出版,收入莎士比亚37个剧本、两首长诗和所有十四行诗。第3版《阿登版莎士比亚》由伦敦勒尔宁(Thomson Learning)公司出版,共收38个剧本。经过讨论,我们选择莎剧全集的牛津版作为语料库的英文语料。牛津版是公认校勘准确的版本,而且莎剧的不同语言译本均译自该版本。本语料库拟选择梁实秋、朱生豪和方平翻译的3种莎剧全集作为中文语料,其中梁译本和朱译本都译自牛津版。此外,牛津版莎剧全集的电子版可以从互联网上免费下载,能省去英文语料输入的大量工作。
就莎剧全集的汉译本而言,比较知名的主要有曹未风译本、朱译本、梁译本和方译本。曹未风译本由贵阳文通书局于1942年至1944年之间出版,收入曹未风译的莎剧剧本11部。朱译本最早由世界书局出版(1947),后来分别由作家出版社(1954)、人民文学出版社(1978)、时代文艺出版社(1996)和译林出版社(1998)等出版,收入莎剧共37部,其中31部为朱生豪所译。梁实秋译本由台湾远东图书公司出版(1967),收入梁实秋翻译的全部莎剧剧本。1995年,内蒙古文化出版社和中国广播电视出版社同期出版梁实秋翻译的《莎士比亚全集》。方译本《新莎士比亚全集》(河北教育出版社,2000),是由方平和梁宗岱参照欧美当代备受重视的Bevington全集本(1992年)与Riverside全集本(1974年),以诗体方式译出,以更接近原作体裁和风格,重现原作的意境与情态。我们根据译本的影响及所收莎剧剧本是否齐全,最终确定了朱译本、梁译本和方译本为语料库的中文语料。
确定语料库的中英文文本之后,我们便开始进行中英文语料的输入。牛津版莎剧全集和朱译本可从网上直接下载,并直接转化成TXT格式。梁译本也可从网上下载,但其格式为PDF格式,需转换成TXT格式。方译本目前还不能从网上下载,还需要使用高速扫描仪扫描或人工输入。为保证语料库的语料质量以及研究的可靠性,我们组织人力仔细校对输入后的语料,检查语料是否有倒码、拼写错误以及具体内容与蓝本出入等现象,并及时予以更正。