培训测试

汉字应用水平测试用字的统计与分级

发布日期:2011-09-09   来源:   
 
“汉字应用水平测试研究”课题组
孙曼均  执笔
(教育部语言文字应用研究所  北京  100010)
 
 [内容提要]本文论述了《汉字应用水平测试字表》的编制过程,包括测试字表编制的主要依据,编制总原则和具体原则,编制经过,以及测试字表分级的目的、依据、原则、标准和方法。在编制过程我们认识到:1.编制《汉字应用水平测试字表》,并对汉字进行应用水平分级,是我国字表编制史上的首次尝试,也是现代汉字学、汉字教学、测试学相结合的一种尝试;2.任何字表字量字种的确定和分级都必须采用定量与定性相结合的综合方法;3.《汉字应用水平测试字表》的编制过程是从字到词,再从词到字,建立字词对应关系。总之,《汉字应用水平测试字表》体现了实际测查与字频数据的结合,定量统计与定性分析的结合,科学理论与经验知识的结合,汉字学、词汇学、统计学与测试学等多学科的结合,它把对汉字大量零散的定性认识,与汉字的实际应用数据和字频统计结果,汇集在一起,形成一个整体,最终达到较为完整和系统的定量认识的过程。
 
[关键词]汉字;应用水平;测试字表
 
Scale and Stastics of Chinese Characters Proficiency Testing
 
Sun Manjun
 
Abstract: We compile the table that includes main basis, general principles and details, courses, destinations for how to divide scale and way of testing. 4.During the course of compiling we get to know that: 1) This is the first time for us to Compile of the  “Test Table of Chinese characters proficiency” and divide the scale for Chinese characters proficiency in the history in our country.  It is also a beneficial try for the incorporation of modern philology, Chinese characters teaching and Chinese characters testing. 2) We must have qualitative analysis to determine quantity, variety of table of characters. 3) We construct a kind of relation between characters and words. In general, this table of characters mainly reflects incorporation between practice and data about frequency of characters, quality statistics and qualitative analysis, scientific theory and experienced knowledge, philology, lexicology, statistics and testing and so on.  We will gradually experience a long course from piecemeal of quality realization on Chinese characters and applied characters, which include some data about frequency statistics to systematic study.
 
    Key words: Chinese characters ;proficiency; test table
 
[作者简介] 孙曼均,女,语言文字应用研究所,副研究员。研究方向为现代汉字、现代汉语词汇等。
 
*“汉字应用水平测试研究”课题研究在科研经费上得到广东教育出版社的大力支持,特此鸣谢!
“汉字应用水平测试研究”课题组成员是张一清、佟乐泉、孙曼均、陈菲。
1.前言
1.1. “汉字应用水平测试研究”课题是国家语委“十五”科研规划重点项目,它的目的是要研制一套科学的标准化汉字应用水平测试体系,以检验社会上与汉字使用有密切关系的一些行业的从业人员在书面交际过程中掌握和应用汉字所达到的程度。不同的人使用汉字的数量不同,掌握汉字的程度及汉字应用的水平也有较大差异。根据我们的调查,一些与汉字应用有关的行业和部门早就迫切希望制定一个切实可行的汉字应用水平测试标准,作为考核、录用和培训从业人员的依据之一。因此,制定汉字应用水平等级标准和编制汉字应用水平测试大纲不仅是对社会上不同人群汉字实际使用情况的客观反映,也是为了满足社会对提高人们语言文字水平的一种迫切需求。
 
汉字应用水平测试在我国尚属首次,这是一项具有开创性的关于汉字应用水平的量化研究,其研究成果不仅能丰富现代汉字学、测试学等学科的内容,而且对提高全社会的语言文字规范意识和应用水平,进而提高人们的文化素养,促进社会应用汉字的规范化和标准化,起到积极的推动和促进作用。这对我国语言文字应用的理论和实践都具有非常重要的意义。
 
1.2.这项课题研究的重点之一就是确定测试用字的数量和范围,以便据此逐步建立汉字应用水平等级标准及测试大纲,并建设相应的测试题库。
 
《汉字应用水平测试字表》是这项课题的基础性工作,也是今后测试的重要内容。它将为汉字应用水平等级标准的划分、测试大纲的编写及题库的建设等提供基本的内容和大致的范围。没有测试字表,测试就无从谈起。鉴于汉字应用水平测试在我国历史上还是首次,它不同于以往的语文水平测试或书面语测试,它面向社会上使用文字较多的行业和人群,针对人们汉字使用中的各种实际问题,应用性很强;因此,汉字应用水平测试字表必然不同于已有的常用字表和通用字表,其字种和字量必须能够真实反映出社会上使用文字较多行业和人群的汉字应用的实际情况。
 
2.汉字统计的历史及现状
 
    2.1.历史上我国就有对常用汉字和通用汉字的统计。编写常用汉字字表是中国语文教育的传统,也是古代语文教学的基础。古时的蒙学课本就是典型而突出的例子,南北朝的《千字文》共有汉字1000个;宋代的《百家姓》共有汉字576个,《三字经》共有汉字1248个。西汉的字书《仓颉篇》有汉字3300个,清代的《文字蒙求》则从《说文解字》收录的9353个汉字中选取2044个常用字,附加字义的解释。这些文字学习教材都是选取当时的常用汉字汇编成册,供儿童学习汉字用,它们可以算得上是中国古代的常用字表。历代的字书则反映了不同时代通行的汉字字量和字种,是对当时使用的汉字的统计和汇编。虽然随着时代的推移,字书所收汉字的数量日益庞大,到了现代,大型辞书所收汉字大多有数万之巨;但是除掉其中的异体字、罕用字、方言字、古字甚至废字,古往今来,就在社会上应用的汉字而言,一般都在万字之内,人们日常使用的汉字也大致在3000~6000字之间。
 
2.2.我国现代意义的动态性字频统计是教育家陈鹤琴于1928年完成的,统计出常用汉字4261个。从1928年到1988年的60年间,我国进行的汉字统计资料(重点是对常用汉字的统计)约有十几种。在这些字表中,有两个字表特别值得注意。一个是《信息交换用汉字编码字符集·基本集》,这是中国最大的一次字频统计工作。在数以亿计的浩瀚文献资料中,统计出实际通用的汉字数为6763个,其中有3000多个汉字的累积使用频度达到了99.9%,另3000多个累积频度不到0.1%。这个成果说明了常用汉字与次常用汉字的数量不足7000个,框定了电脑汉字输入常用字的范围,为国家制定汉字库标准提供了重要的科学依据。另一个是当代汉字整理与统计研究的重要里程碑,即国家语委于1988年完成的《现代汉语常用字表》和《现代汉语通用字表》,这两个字表按照汉字的频率和使用度,确定了2500个常用字、1000个次常用字和包括上述两类字在内的7000个通用字。这个成果说明了当代汉字使用的范围在7000字以内,常用汉字的范围在3500字之内,由此确定了教学用字以及出版印刷、辞书编纂、信息处理等通用汉字的范围。
 
2.3.据新华社最新统计信息(见《北京晚报》2001.9.26),目前汉字的总数虽已超过了8万,而历代日常书面语常用的汉字数量一般都在三四千个。据统计,李白994首7.7万字的诗文里,用字3560个,杜甫1500余首诗作用字4350个,白居易3000余首诗共18万字,用字4600个。老舍的代表作《骆驼祥子》共用汉字量10万余,单字仅有2413个。66万字的《毛泽东选集》1-4卷的用字量为2891个,毛泽东公开出版的全部著作也仅用单字3136个。《孙中山全集》的用字量为2673个。
 
    从上述统计资料可以看出,无论在中国古代还是当代,对常用汉字的选择大都在2000~4000字之间浮动,即3000字上下;而通用汉字则一般在7000字以内,基本为6000字左右。这些材料和数据是我们编制《汉字应用水平测试字表》的重要参考依据。
 
2.4.在编制测试字表的过程中,我们遇到了一些问题。主要是目前我们对现代汉字的研究还缺乏一些最基础的定量研究,对现代汉字的实际应用情况缺乏宏观掌握和微观分析。比如,对不同文化程度、不同行业等不同人群的识字量,人们往往凭语感来估算,却没有源于实际调查的科学准确的统计数据,心中无数;又如,对汉字诸如构词能力等诸因素尚无全面而精细的定量分析;等等。这就为测试字表的编制带来了很大的困难,也使进一步提高全社会的汉字应用水平无所依据。而现有的常用字表和通用字表,一个是反映受过基本教育、具有中等文化程度的人的常用识字量,一个是反映远远大于一般人识字量的现代汉字流通、应用的范围,它们都不能代表社会人群的实际识字量,更反映不出具有不同文化水平、分属不同行业的人们对汉字实际掌握的字量和字种。因此,现有的各种字表都不能作为汉字应用水平测试所需要的测试用字表。
 
    2.5.根据以上情况,课题组经过认真分析研究、多方征求意见,决定应为汉字应用水平测试编制专用的汉字测试字表。《汉字应用水平测试字表》的字量和字种应以常用汉字为基础,但要高于常用汉字;应在通用字的范围之内,但应低于通用字;测试用字必须要从实际中来,要能够精确反映受测人群的汉字实际使用情况。课题组决定,以3500个常用字为测试用字的基本内容,在7000通用字的范围内,对社会上经常使用文字的人群进行实际测查,根据掌握的第一手数据来选取测试用字;同时,依据国家语委语料库的汉字频率统计数据,对经测查而筛选出来的汉字进行必要的人工干预。测试用字字量和字种的大致框架由此确定。
 
   3.《汉字应用水平测试字表》的编制
 
    3.1.测试字表编制的依据和原则
 
3.1.1.编制的主要依据
 
测试字表编制的主要依据是《现代汉语常用字表》和《现代汉语通用字表》,实际测查统计结果,以及国家语委两个大规模语料库的字频统计数据。
 
    上面已经说过,我们首先确定《汉字应用水平测试字表》应以《现代汉语常用字表》和《现代汉语通用字表》为重要依据,即测试字表以《现代汉语常用字表》为基础,测试用字包括3500个常用字;测试字表以《现代汉语通用字表》为选字的基本范围,字量要低于7000字,字种则基本在7000字之内选定。
 
其次,鉴于上面所述我们面临的问题,我们认为确定《汉字应用水平测试字表》的字量和字种必须首先进行实际调查,以掌握社会上与文字使用密切的相关人群的汉字实际使用情况,并以此作为《汉字应用水平测试字表》的重要依据。在研制《汉字应用水平测试字表》的过程中,无论是对测试用字字量的统计和字种的选取,还是对测试用字进行分级,我们都是以课题组测查的实际数据作为主要参数的。
 
    另外,我们充分利用了国家语委两个大规模语料库的字频统计数据,以此对实际测查的汉字字量和字种进行增删和调整。这两个语料库,一个是国家语委于1990年开始建设,反映现代汉语全貌的国家级“现代汉语大型通用语料库”,其库容量为7000万汉字,时间跨度从1919年至今(其中1977年至今的语料选取比例为50%)。另一个是语用所于2002年承接,面向中文信息处理领域,为自然语言处理研究服务的国家高技术研究发展计划(863计划)《智能化中文信息处理平台》课题的子课题“超大规模通用平衡语料库”,其库容量为15亿字(2002年第一期完成7000万字),时间跨度以近十年为主(特别以近三年为主,1989年以前为辅)。
 
3.1.2.编制总原则是实际定量统计与专家定性分析相结合
 
 
 
首先进行目标定性,然后根据定量原则为主、定性原则为辅的选字原则,对实际测查的汉字进行筛选,以其中识别率高的字、在语料库中经查询频率高、使用度大的字,作为选字的基本范围,再采用人工联想的定性方法作为定量标准的补充。
 
    即从定性到定量统计,从实际测查到字频统计,再到专家干预。如此反复,不断使之更完善,更接近实际。
 
    3.1.3.汉字筛选的具体原则
 
1)  规范性原则:从语言学的角度,测试用字应为普通话语词范围内的用字,方言用字一律不收;测试用字应为规范的现代汉字字型,不规范的字型不收。如:囡、伢、嬷、甭、掼、矬、撸等,《现代汉语词典》均注明为方言用字,测试字表不收。又如:垅,是“垄”的异体字,虽然目前它尚在7000通用字内,也不予收入。
 
2)应用性原则:从应用语言学的角度,测试用字应在现代汉字的范围内选字,要充分考虑到现代汉字的实际使用情况。对于一些常用的口语用字,如:洇、焯、磴、硌、蕻、痄、搽等,虽然这些字在书面语中较少使用,字频统计或统计不到或频率很低,但在日常生活中却较常用,我们则适当选取。对于文言用字,除现在还使用的或有构词(包括成语)能力的,一般不收,如:筮、笏、耜、骒、黼等,这些字指称的古代事物已经消亡,在现代汉语中既不再使用,又无构词能力,则不予选取。
 
    3)常用性原则:依据频率统计的原理,测试用字应以实际人群的汉字识别率以及在语料库中的统计频率为重要参数,即选取高识别率和高频率的字。
 
    4)均匀性原则:同样依据频率统计的原理,测试用字还要考虑到其在语料库中的覆盖率,即选取分布广泛、覆盖率大的字。
 
    5)联想性原则:任何字表的编制,都不能完全依照频率,必要而适当的人工干预必不可少。对一些成系列的字要进行纵横相关的多种联想,综合考虑其取舍。如:天干地支、节气用字,数字的汉字大写用字,民族名称,省、自治区、直辖市的简称和别称,地、县级以上的地名用字以及连绵字等,我们都是综合考虑,平等对待,成系列收取;其中为保持地县级以上的地名用字的完整性,我们收入了琊、埗、埇、猇等4个7000通用字以外的县级地名用字。对动植物名称,金属、化学元素名称以及姓氏、人名用字等则根据常用程度和频率的高低决定取舍。
 
6)等级性原则:测试用字既要能反映出被试的汉字实际使用情况,又要便于测试等级的确定;因此,测试用字要根据识别率和字频的高低,覆盖范围的大小,构词能力的强弱及其构成词语的常用程度分出等级。
 
以上6条原则不是孤立的,而是综合运用以决定取舍。
 
    3.2.测试字表编制经过
 
    从目标定性开始,到定量统计,再回到定性筛选,最后形成限定性等级字表。这就是测试字表产生的基本过程。
 
    3.2.1.首先进行目标定性。确定3500常用字为测试字表的核心内容,同时确定在7000通用字范围内确定字量,筛选其他字种。
 
    3.2.2.用7000字除外3500常用字余下的3500字进行实际测查。经研究决定,在使用汉字较多的行业中,选定对汉字掌握的广度和深度有着不同层次的三种人群,即中等教育程度、高等教育程度、具有高等教育程度又从事文字工作的三种人群作为测试对象。经过实际测试,依照实测人群掌握汉字的平均水准,筛选出其中识别率高的2023个字作为备选字。实际测查结果不仅较为准确地反映了使用汉字较多行业的人群实际掌握汉字的数量,即高限为5500字上下,低限为4000字上下(均含3500字);而且基本上筛出了相应的字种。从源于实际的第一手材料筛选备选字,避免了用传统主观方法确定字表时受专家个人文化素养、专业学科、社会地位以及个人用字习惯等影响而造成的缺陷。
 
3.2.3.对备选字实施人工干预。课题组与专家根据语感,采用群体性联想的方法逐字进行定性分析,以此作为上述定量统计的补充。这时的定性分析避免和减少了实际测查中的种种不完善所造成的背景干扰,进一步完善备选字。
 
3.2.4.对备选字进行字频统计。将备选字放到语委的两个语料库中进行分类的频率和覆盖率统计,依据统计结果对备选字再次增删、调整,从中确定了2000个备选字。测试用字的字量至此基本确定。再一次的定量统计可以纠正实测的客观误差和人工干预的主观偏见。
 
    3.2.5. 对备选字再次实施人工干预。采用专家集体审读会、专家个人分头审读和课题组集体讨论等多种方法,在2000字的范围内对备选字种又进行多次调整,使备选字更加科学、系统和完善。
 
    3.2.6.汉字应用水平测试不是测试单个的汉字,而是以词语为单位,在具体语境中进行测试,这样才能体现被试的汉字应用水平。这种测试方式决定了测试不仅需要测试字表,还需要测试词表。课题组经研究决定采用《现代汉语通用词表》为测试词表。因此,课题组又对《现代汉语通用词表》中的用字进行了字量和字频统计,将备选字与《现代汉语通用词表》中的用字进行对比,结果绝大部分字种重合,《现代汉语通用词表》中有287个字种备选字没有,这些字大多是一些口语用字和方言用字;备选字中有473个字种《现代汉语通用词表》没有,这些字中大部分是姓氏、人名用字及地、县级地名用字。课题组又对这一小部分不重合的字种逐一分析,对备选字再做调整。如:对词表用字中的一些普通话常用的口语用字,我们作了适当增收。
 
总之,课题组将备选字从定性分析到定量统计,从定量统计再回到定性分析,循环反复多次,分别将几种不同的定量统计数据放在一起相互参照研究,对备选字多次增删、调整,历经9稿,终于形成《汉字应用水平测试字表(初稿)》。定性——定量——深化——应用,这就是制订《汉字应用水平测试字表》的循环过程。
 
3.3测试字表的分级
 
    3.3.1.分级的目的
 
    1)将测试用字等级系列化,以反映汉字应用水平的不同层次和阶段,同时也为人们掌握汉字、提高汉字应用水平提供方便。
 
    2)为等级标准、测试大纲的制定和编写提供总目标和分期目标,为测试提供统一性的命题及评分依据。
 
    3.3.2.分级的依据
 
    1)必须从实际应用出发,将实测的汉字识别率和动态性的字频统计结合起来,作为分级的主要依据。
 
    2)分级时不仅要考虑汉字本身形、音、义等问题,还要考虑到汉字的构词能力以及所构成词语的情况。
 
    3.3.3.分级原则
 
1)在分级过程中,要以《现代汉语常用字表》为分级构成的最核心内容和测试用字字量的底线;以《现代汉语通用字表》为选字范围,除个别字之外,测试用字基本上应在7000字范围之内。
 
2)  在分级过程中,仍然要运用定量统计与定性分析相结合的方法,在一定范围内进行必要的定向联想以调整字种的级别。如:对连绵字分级时,我们采用了这样的原则:如果构成连绵词的字不再构成其他的连绵词,即两个字都不具有构成其他词的能力,则以该连绵词的第一个字的识别率和字频为准,将第二个字与第一个字一起放在同一级别;如果构成连绵词的字各自还能构成其他的词,或两个字的构词能力有显著差异,即两个字分别具有不同的构词能力,则依每个字的识别率和字频,分别放入不同的级别。
 
3)测试用字的总量及测试用字的分级要考虑到相应的词汇总量及词汇分级。
 
3.3.4.分级的标准和方法
 
    测试用字分级共有3个界标:4000字种(3500常用字+500字),4500字种(3500常用字+500字+500字),5500字种(3500常用字+500字+500字+1000字)。这3个级别分别为测试字表甲表(4000字),乙表(4500字),丙表(5500字)。
 
    1)3500常用字是国家现行的规范标准,是经过几十年科研、教学的积累和实践,并在较广泛的语料中反复统计后得出的第一个权威的常用汉字量,它已经得到了人们的共识。这一共识与当前我国汉字教学、应用的基础阶段的汉字量相一致。因此,我们尊重这一科研成果,将3500常用字全部纳入第一个分级界标内,由此构成测试字表甲表的核心内容。
 
    由于3500常用字是目前初中教育阶段应掌握的汉字量,代表具有中等偏下文化水平人群的识字量;而根据我们的实际测查,具有高中文化程度的人群一般识字量为4000字左右。因此,根据这类实测人群的识别率(实测的具体过程见另文)和语料库的字频统计,又筛选出500字,与3500常用字合并,形成测试字表的甲表;即甲表含全部常用字,又增加500字,共计4000字,作为第一个分级界标。
 
    2)实测结果显示,具有大学文化程度的人群一般识字量为4500字左右。因此,根据这类实测人群的识别率和语料库的字频统计,再筛选出500字,与甲表合并,形成测试字表乙表;即乙表含全部甲表字,又增加500字,共计4500字,作为第二个分级界标。
 
3)实测结果显示,具有大学文化水平以上,从事文字工作,且具有较高汉字应用水平
 
的人群的识字量为5500字左右。因此,根据这类实测人群的识别率和语料库的字频统计,再筛选出1000字,与乙表合并,形成测试字表丙表;即丙表含全部甲、乙表字,又增加1000字,共计5500字,作为第三个分级界标。
 
总之,对于汉字应用水平测试来说,高级水平应掌握4500~5500字,中级水平应掌握4000~4500字,基本水平应掌握3500~4000字。
 
课题组在从定性分析到定量统计,从定量统计再到定性分析,循环反复筛选、调整测试用字的同时,在保持每个等级字量不变的情况下,对每个等级中的字种(除外3500常用字,常用字是测试用字的底线,全部在甲表内),也反复进行了多次调整,使之更平衡与协调。因此,与筛选、确定测试用字的字量和字种相同,分级时,也是以实测的汉字识别率和语料库的字频数据为主,但并不完全依据识别率和字频数据,仍然要运用定量与定性相结合的方法。
 
4.编制测试字表过程中的几点认识
 
    4.1.编制《汉字应用水平测试字表》,并对汉字进行应用水平分级,这在我国字表编制史上是首次,也是现代汉字学、汉字教学、测试学相结合的一种有益尝试。
 
    在编制字表和分级的过程中,我们发现:现代汉字研究中还有不少空白和盲点,尤其是现代汉字应用研究领域,还缺乏宏观的、系统的、动态的、精细的定量研究和统计数据,缺乏对汉字应用各个层面实际情况的调查,这是现代汉字研究的一个很大缺憾,应当引起汉字学界的重视。时代和社会以及其他科学、其他行业的发展,对语言文字提出了新的、更高的要求,语言文字研究的传统理论和经验与之相比有其局限性,这就要求语言文字研究要力求发展和创新,以不断适应新的时代要求。因此,对于编制汉字应用水平测试字表来说,就必须进行新的探索,那就是实施实际测查,这是非常重要和必不可少的。正是基于这种认识,课题组首先对从事与文字工作相关的几个不同层次的人群(即今后的受测者)汉字应用的实际情况进行摸底测查,对这些人群的识字量分别进行统计,并首次将这种源于实际的测查数据与语料库的字频数据结合起来,相互比照,共同作为确定字表的字量和字种、实行分级的重要参数。从而使我们对当前汉字实际应用的字量、字种及等级的确定,有了扎实而可靠的基础。
 
    4.2.任何字表字量字种的确定和分级都必须采用定量与定性相结合的综合方法。
 
    编制字表应以实测的识别率和字频统计数据为重要依据,但是,实际测查和字频统计会受到语料的选取及其年代、文体、内容,调查的时间、方式以及被试各方面的情况等等诸多背景因素的影响,有些数据会与实际情况相差甚远;在使用不同语料统计出来的汉字频度表中,最常用汉字的排列顺序都有一定差别,至于次常用汉字,差别会更显著,尤其是目前国内汉语语料库的建设还有待完善。另外,汉字的问题很复杂,有些情况仅仅依据数据统计解决不了。因此,对于一个科学和完善的字表,其字量、字种的确定仍离不开必要的人工干预,定性分析具有同样的重要性。《汉字应用水平测试字表》的编制,正是科学理论、定量统计与专家、课题组的定性分析相结合的成果。它充分利用国家语委的两个大型语料库,汇集了数种统计数据、专家与课题组对汉字的知识、分析和评判,把各种相关的科学理论、实验数据与人的经验知识结合起来,形成了有机的系统工程。
 
    4.3.《汉字应用水平测试字表》的编制过程是从字到词,再从词到字,建立字-词对应关系。
 
    现有的各种字表,包括《现代汉语常用字表》和《现代汉语通用字表》,都有一个共同的特点,即定量统计和定性分析的对象都是单个的汉字,虽然要考虑汉字的构词能力,但并不涉及词语的数量和分级。而用于HSK考试的《汉字等级大纲》中的常用汉字总表及分级汉字表,是从词到字,即其字量、字种的确定和分级是在源于词汇总表及词汇分级的基础上,参照《现代汉语常用字表》进行的。
 
    与上述各种字表不同的是,《汉字应用水平测试字表》因定位于应用水平,因此在测试时不可能只测单个的汉字,而是要以词语为单位,在具体的语境中测查被试的汉字掌握情况,这样才能体现被试汉字应用的水平和程度。考查的对象和目的是汉字,而考查的环境是词语,测试是以词带字。这就要求《汉字应用水平测试字表》在编制过程中,必须使单个的汉字与它所构成的词语建立联系。这体现在两个方面:一是测试用字不是从词表中筛选出来的,而是源于汉字的实际识别率和字频数据,但是我们将测试用字与测试词表的用字进行了比照分析,并依据词表用字频率和汉字的构词能力以及其构成词语的常用程度对测试用字做了字种和级别上的相应调整,进行了一次从字到词,再从词到字的循环过程。二是要有一个“测试用字词对应表”,将测试用字与测试词表中的词语建立联系,使之衔接,形成字与词的对应关系。
 
    由此可见,《汉字应用水平测试字表》的编制,体现了实际测查与字频数据的结合,定量统计与定性分析的结合,科学理论与经验知识的结合,汉字学、词汇学、统计学与测试学等多学科的结合。《汉字应用水平测试字表》的编制过程,就是把对汉字大量零散的定性认识,与汉字的实际应用数据和字频统计结果,汇集在一起,形成一个整体,最终达到较为完整和系统的定量认识的过程。
 
参考文献
 
[1]《现代汉语定量分析》,陈原主编,上海教育出版社,1989。
 
[2]《现代汉语用字信息分析》,陈原主编,上海教育出版社,1993。
 
[3]《现代汉字学》,高家莺、范可育、费锦昌编著,高等教育出版社,1993。
 
[4]《汉字问题学术讨论会论文集》,中国社会科学院语言文字应用研究所,语文出版社,1988。
 
[5]《现代汉语常用字表》,国家语言文字工作委员会汉字处,语文出版社,1988。
 
[6]《现代汉语通用字表》,国家语言文字工作委员会汉字处,语文出版社,1989。
 
[7]《GB13000.1字符集汉字字序(笔画序)规范》,国家语言文字工作委员会,上海教育出版社,2000。
 
[8]《汉语水平词汇与汉字等级大纲》,国家对外汉语教学领导小组办公室、汉语水平考试部,北京语言学院出版社,1992。
 
[9]《现代汉语词典》,中国社会科学院语言研究所词典编辑室,商务印书馆,2002。
 
[10]《现代汉语规范字典》,李行健主编,语文出版社,1998。
 
“汉字应用水平测试研究”课题组
 
提要  汉字应用水平测试的目的是衡量中等以上受教育程度人群在以规范汉字为媒介的阅读或书面表达等活动中,使用汉字所达到的水平。这项测试既遵循国家通用语言文字的相关规范和标准,也遵循汉语汉字的约定俗成和使用规律,同时还采用了教育测量学的理论与方法构建测评体系。在确定测试范围及内容、测试形式、评分依据及标准、分数体系等过程中,广泛运用了语料库语言学、计算语言学、教育测量学等理论成果及操作方法,达到了理论与实践的有机结合。
 
关键词  汉字  应用水平  等级  测试大纲  研制报告
 
《汉字应用水平等级及测试大纲》是国家语言文字应用“十五”科研规划重点项目“汉字应用水平测试研究”的最终成果,经专家鉴定委员会鉴定和国家语言文字工作委员会语言文字规范(标准)审定委员会审定后,2006年8月28日由中华人民共和国教育部和国家语言文字工作委员会作为语言文字规范(GF2002—2006)向社会正式发布,2007年2月1日起试行。
 
该项目由教育部语言文字应用管理司和语言文字信息管理司提出,批准立项时间是2002年11月,项目批准号WT105-31。项目研制任务由教育部语言文字应用研究所普通话和语言教学研究室承担。该项目是国家语委重点科研项目“汉字应用水平等级标准及测试大纲研究”的延续项目,前一项目属于调研性项目,工作重点是了解社会上有关行业汉字应用的现状和需求,特别是用于评核相关人员汉字应用水平的需求,为开展课题研究和将来开展测评工作提供依据和参考。
 
2002年延续立项后,明确了后续项目为标准研制项目,主要任务是在前一项目调查的基础上建立一整套科学的、标准化的测评系统和测量工具,用来衡量有关行业从业人员及高等院校学生等人群应用汉字的能力和水平。研制的主要内容包括作为标准颁布的汉字应用水平等级、汉字应用水平测试大纲,以及作为标准附件的汉字应用水平测试字表和作为测评系统辅助部分的汉字应用水平测试词语表、试题、试卷和题库等。
 
从2002年至2004年,课题组先后三次进行了相关行业人群和在校大学生识字情况调查,涉及的调查对象主要有新闻出版行业的编辑、记者,高等院校学生,中小学教师等,总计3600余人;然后整理、分析了调查数据;同时还对上述人群进行了试题、试卷方面的预测和试测。调研的省市有北京、天津、上海、河北、黑龙江、广东等。科研合作单位先后有广东教育出版社、山西大学、北京师范大学、北京教育学院等。在研制过程中,课题组还就汉字应用水平等级、汉字应用水平测试大纲和汉字应用水平测试字表反复征求了海内外30多位语言文字学、语言教学和教育测量学等领域专家的意见,并召开了10余次专家咨询、研讨和评审会。2005年还征求了全国15个地方语委办的意见。课题组对专家和各地语委办的意见做了深入、细致的分析和讨论,吸收了其中绝大多数意见和建议,进一步完善了测评系统。
 
下面就《汉字应用水平等级及测试大纲》一些主要内容的研制情况分别做一点说明。
 
一、研制《汉字应用水平测试字表》
 
    《汉字应用水平测试字表》(以下简称《字表》)是这项课题的重点之一,因为建立测评系统很重要的一点就是测评的内容范围,对这项课题而言,就是确定测试用字的数量和范围,以便据此逐步建立汉字应用水平等级及测试大纲,并建设相应的测试题库,为等级的划分、测试大纲的编写及题库的建设等提供基本的内容和大致的范围。
 
研制《字表》,首先要考虑几个方面的问题:第一,《字表》与国家已经颁布过的有关汉字的规范或标准,特别是几种字表之间的关系;第二,《字表》与汉语真实文本中汉字使用情况的关系;第三,《字表》与相关人群掌握汉字情况的关系;第四,《字表》与现代汉语通用词语用字情况的关系;第五,《字表》与汉字自身系统性之间的关系。这几种关系是研制《字表》的最根本问题,既涉及到国家法律、政策层面的规范和标准,也涉及到现实社会语言生活的状况,比如汉字的使用频率、覆盖率、构词情况以及人们掌握汉字的平均数量和集中情况等,同时还涉及到汉字字形、读音、意义等方面的系统性,比如天干地支、节气等特定表义范畴的系列用字等。
 
按照上述思路,课题组以《现代汉语常用字表》所收3500常用字为测试用字的基本内容,在《现代汉语通用字表》所收7000通用字范围内,对社会上经常使用文字的人群先后三次进行了识字情况测查,并根据所获得的数据初步筛选了测试用字;同时,依据国家语委“现代汉语大型通用语料库”和国家高技术研究发展计划(863计划)《智能化中文信息处理平台》课题的子课题“超大规模通用平衡语料库”的汉字频率统计数据,对经测查而筛选出来的汉字进行了必要的对比分析和调整;随后,通过和测试词语表用字情况的对比,并着重考察了低频字的分布、构词能力、意义范畴等,对《字表》又做了部分微调;最终确定了测试用字的大致框架。
 
    在研制《字表》过程中,我们所遵循的选字原则主要有以下几条:
 
1)规范性原则:测试用字均为规范的现代汉字字形,不规范的字形不收,如异体字;另外,属于方言语词范围的用字也一律不收,如:囡、伢、嬷、甭、掼、矬、撸等。
 
2)应用性原则:筛选测试用字均以抽样人群识字情况测查数据和语料库中字频的统计数据为重要参数,选取高识别率和高频率的字。同时依据频率统计原理,测试用字还要考虑到其在语料库中的覆盖率,尽量选取分布广泛、覆盖率大的字。另外,充分考虑现代汉字的实际使用情况,对于一些常用的口语用字,如:洇、焯、磴、硌、蕻、痄、搽等,虽然这些字在书面语中较少使用,字频统计或统计不到或频率很低,但在日常生活中却较常用,因此也适当选取了一些;对于现代通用汉字之外的文言用字,如:筮、笏、耜、骒等,一般不收。
 
 
 
3)系统性原则:对一些成系列的字要进行纵横相关的多种联想,综合考虑其取舍。如:天干地支、节气用字,数字的汉字大写用字,民族名称,省、自治区、直辖市的简称和别称,地、县级以上的地名用字以及连绵字等,我们都综合考虑,平等对待,成系列收取;其中为保持地县级以上的地名用字的完整性,我们收入了琊、埗、埇、猇等4个7000通用字以外的县级地名用字。对动植物名称,金属、化学元素名称以及姓氏、人名用字等则根据常用程度和频率的高低决定取舍。
 
在研制过程中,以上3条原则都不是孤立的,而是综合运用以决定字的取舍。最终,《字表》确定为5500字,并分成三个子表,其中甲表4000字;乙表500字;丙表1000字,成为《汉字应用水平等级及测试大纲》的附录A(规范性附录)。
 
《字表》的具体研制过程详见《语言文字应用》2004年第1期63-70页《汉字应用水平测试用字的统计与分级》。
 
二、研制《汉字应用水平等级》
 
    研制《汉字应用水平等级》,实际上就是建立汉字应用水平的评价体系。与此同时,再依照一定的方法确定测量工具和测量方法。
 
建立一种特定的评价体系,实际上就相当于对人的身高、体重等指标或数据按照一定的参考值给予判断一样,例如是正常,还是偏高、偏矮,等等。进行这样的判断,大致又需要若干前提。其中主要有目标参照或常摸参照,也就是绝对标准或相对标准。前者是以要达到的目标为参照,重点考察、衡量所收集到的评价客体的数据与目标之间距离的大小,例如一个健身计划,目标是每位参与者都要将当前体重减少20千克,那么,计划结束时,评价健身效果就是考察每位参与者所减少的体重与20千克这个目标之间的差距。后者则是以常模数据为参照,重点考察、衡量所收集到的评价客体的数据与常模数据之间的差异,例如判断一名中国城市12岁男童身高方面的发育情况,就可以将他的身高数据与中国城市12岁男童身高方面的常模数据进行比较,然后对其发育情况进行推断和评估。
 
汉字应用水平等级一方面要明确使用汉字的目标,即绝对标准,例如关于汉字字形、读音、意义及用法方面的规范及依据;另一方面,也要以相关人群识字量调查、语料库的字频统计等数据为基础,整理出可供参照的相对标准。
 
在汉字应用水平等级中,目标和参照标准都要十分明确。首先,使用者在以规范汉字为媒介的阅读和书写活动中,辨别和使用法定的国家通用文字,必须遵循国家颁布的汉字字形规范、读音规范,而且还要了解和掌握汉字在权威工具书中的普通话读音和现代汉语义项及用法,并在应用过程中与其保持一致。评价使用者水平的高低,主要考察他们辨别和使用汉字时,在字形、读音、意义及用法几方面的表现与目标之间的差异程度。其次,源自一些实际调查、试测的客观数据,经严格的整理、分析后,也可以形成评价的参照标准。在能够掌握和使用的汉字数量方面,按照相关人群识字量调查收集到的平均识字量、集中识字量(众数)以及现代汉语真实文本中汉字的使用频度、分布情况等数据,三个等级的参照标准由低到高依次确定为3500-4000、4000-4500和4500-5500个汉字。与此同时,汉字应用水平测试并不是识字量的竞赛,因此能够掌握和使用的汉字数量也不是衡量水平高低的唯一参照标准。根据4000→4500→5500三级字量以及具体的汉字,考察它们在不同类别现代汉语真实文本中的使用频度、分布情况等数据,就可以从一个侧面建立起使用者阅读、书写综合表现的参照标准,因为不同数量、不同范围的汉字在不同类别文本中的覆盖率也是不同的,如果使用者所能驾御的汉字在数量和范围方面都是确定的,那么就可以推断他在应对不同类别汉语文献时可能具有的表现,例如他在阅读不同类别汉语文献时,碰到生字的概率肯定是不统一的,而这一点将直接影响到阅读的顺畅性。另外,不同人群在识字量调查和试测中的表现明显具有群体性特征,这些特征就可以固化为汉字应用水平不同等级的参照标准,例如是否具备了接受不同程度教育的汉字基础;是否具备了接受某种与汉字应用密切相关的工作任务的基本条件;在汉字应用水平测试中的基本表现,等等。作为汉字应用水平的评价体系,汉字应用水平等级主要由使用汉字时的规范性、准确性目标和基于实际调查、试测数据而构建的参照标准两部分组合而成。
 
在汉字应用水平等级中,还应当明确不同等级所对应的答对率、导出分数等最基本的测试表现,从而使评价体系与具体的测量工具和测量方法能够有明确的对应关系。
 
关于《汉字应用水平等级》的具体研制过程,详见《语言文字应用》2004年第1期56-62页“《汉字应用水平等级标准》研制报告”。
 
三、研制《汉字应用水平测试大纲》
 
    研制测试大纲,要解决的问题主要有:测试的目的、性质和用途;测试的对象;测试的内容范围和形式;试题类型和试卷构成;评分依据;分数体系,等等。
 
关于测试目的,有测试本身的目的和由测试影响所及而预期的目的。前一个目的非常明确,就是通过测试的方法衡量应试者在阅读、书面表达以及其他与汉字应用有关的活动中,掌握汉字形、音、义以及使用汉字的正确程度和准确程度。后一个目的指的是测试本身并不是最终目的,而是通过测试提高使用者掌握汉字、应用汉字的能力和水平,其重要性更体现在贯彻《中华人民共和国国家通用语言文字法》,提高我国国民的语言文字规范意识,提倡准确、健康地使用国家通用语言文字,完善汉字应用环境,弘扬中华文化。
 
就测试本身的目的而言,这是衡量测试效度的最重要依据。一个测试的有效性如何,关键在于是否实现了测试目的。这个问题主要涉及试题、试卷的质量。如果试题的内容、形式和试卷的结构能够反映汉字应用的实际情况;试题的难度、鉴别度等指标适当,拼合试卷的程序规范,能够反映出不同能力水平的差异,那么,这样的测试就达到了预期目的。
 
在研制测试大纲过程中,课题组在逐步明确测试目的的同时,围绕测试内容、试题、试卷等相关问题进行了大量的数据采集、研究分析等工作,从收集到的数据和分析结果看,试卷的有效性非常显著。
 
 
 
测试的性质往往取决于测试的规模和标准化程度,反过来它也影响测试的规模和标准化程度。汉字应用水平测试是由教育部和国家语委组织研制并组织实施的一项国家级语言类标准化测试。它的信度、效度、施测程序、评分程序、题库的容量等都要符合和满足大规模标准化测试的要求。
 
测试的用途主要涉及预期的测验使用者,这里既有个人,也包括团体;既包括应试者,也包括希望测验结果能够为某种决策提供参考的单位或部门等。为满足这些潜在的需求,汉字应用水平测试须要尽可能准确、明确地向使用者提供测试结果,并合理地解释这些结果,而且这种解释必须具有稳定性和一致性。
 
    测试对象与测试用途密切相关,它要解决的主要是谁来参加测试;或者说测试更适用于哪些应试者;测试分数和分数解释能提供什么信息;这些信息能够用于什么目的,等等。这些问题将直接影响到确定测试内容、编制试题、设定测试时限,等等。汉字应用水平测试是一项体现国家语言文字方针政策的举措,被赋予了衡量并间接提高有关行业从业人员和学生汉字应用水平的功能,因此,测试用途就必须体现这种功能。通过实际调查与试测,这项测试定位于“适用于公务员,编辑、记者、校对和文字录入人员,各级各类学校教师,文秘及办公室工作人员,广告业从业人员,中文字幕机操作人员,高等学校和专科类中等学校学生以及日常工作与汉字应用紧密相关的其他人员;同时也适用于想要了解自己汉字应用水平和能力的其他人士。”这些由测试用途而界定的测试对象,是一种可供操作的界定,而对于测试对象的概括性表述,则应当具有明确测试对象背景资格的作用,因此,在《汉字应用水平等级及测试大纲》中,与此相关的表述为“本规范规定了具有中等以上受教育程度人群使用汉字应当达到的水平”。
 
 
 
关于测试形式,汉字应用水平测试选择了集体作答的纸笔测验,试题卷和答题纸分开,以便机器阅卷。从将来的发展趋势看,计算机化无纸测验、计算机辅助自适应测验、基于网络技术支持的网上测验等,都是需要进一步研究的问题。
 
此外,由于考虑到机器阅卷,试题类型必须满足客观性要求,避免主观判断,因此,绝大部分试题都采用了四选一形式的选择题;另外还有一部分需要阅卷者依据统一标准判断的书写题。另外,根据汉字应用水平测试的目的,试卷构成要比较全面地反映应试者的汉字应用水平,因此,汉字的识别和书写、汉字形音义各要素的均衡等,都要反映在每一套试卷中。最后还有测试时间,应当充分考虑获得信息最大化所需的试题量以及与此相关的合理时限。
 
关于评分标准,也就是汉字形音义的正确与否如何判定,这里面存在着两种情况:一种是国家已经颁布了标准或规范的,比如规范汉字及其字形;另一种是国家还没有制定、颁布规范或标准,而是见于各权威工具书、并被广泛认可的研究成果,比如除《普通话异读词审音表》所涉及的汉字及读音之外的其他汉字的读音。课题组最终确定的评分依据为:字形指汉字的规范字形,规范字形的依据是《现代汉语通用字表》;字音指汉字的普通话读音,其依据是《普通话异读词审音表》和权威工具书中汉字的普通话读音;字义指权威工具书中汉字在现代汉语中的义项,以及某些字在部分词语中的特殊用法。
 
依照评分标准判断应试者在每一道试题以及整套试卷上的作答情况,就初步形成了应试者在特定试卷上所获得的原始分数,而对于标准化测试,原始分数并不是足以形成评价的最终分数,因此需要对原始分数按一定规则进行处理,从而产生导出分数。汉字应用水平测试采用的导出分数是500分为平均分,满分为800分。导出分数称HZC分数。
 
 
 
HZC分数是评价应试者汉字应用水平的主要依据。此外,考虑到汉字应用的现实状况、常用汉字的数量及范围、不同应试者个人的语言生活环境及经验等,为了更切近使用汉字的实际情况,并减少和避免由于个人因素的不确定性对测试结果产生误差影响,在用HZC分数确定应试者的汉字应用水平等级之前,测试大纲又规定了进入等级的标准。这个标准定为:对涉及测试字表甲表范围的试题,由于所涉及的汉字都是识别率和使用频率比较高的汉字,作答正确率必须达到80%(含)以上。满足此条件后,HZC分数在200分(含)至500分(不含)之间的,汉字应用水平评定为三级;HZC分数在500分(含)至600分(不含)之间的,汉字应用水平评定为二级;HZC分数达到600分(含)以上的,汉字应用水平评定为一级。
 
这里需要说明的是,80%的作答正确率指的是如果把涉及测试字表甲表的所有内容都编制成试题,那么作答正确率应当达到80%,但是具体到每一套试卷,都是在全部测试内容中进行抽样的结果,是一个具有一定代表性的样本,这个样本与全部测试内容的总体存在着一定的对应关系,因此首先要控制不同试卷之间总体质量的平衡,其次也要按照每一套试卷的特殊性,对测试结果进行转换,转换的目的是求出每套试卷的作答正确率和总体作答正确率之间的对应关系,确定试卷作答正确率中的哪一点,投射到总体作答正确率中相当于80%。所以说80%的作答正确率是一种转换后的结果。
 
最后,测试大纲还明确了测试的操作流程及备考要点,以便测试的使用者了解这项测试的相关信息。
 
四、研制汉字应用水平测试词语表、试题、试卷和题库等
 
    汉字测试既针对汉字本身的属性,也针对汉字的使用情况,比如字形问题,既有笔画、偏旁和结构等方面的对错问题,也有具体使用中的正误问题,最明显的例子就是错字和别字。因此,衡量人使用汉字的正确程度和准确程度,既要针对单个的汉字,也要针对具体使用环境中的用字。课题组根据测试的目的、性质、需求等,同时参照词频统计数据和若干种权威工具书,以及一些关于成语、固定表达形式等材料,按照规范性、系统性原则,经过反复筛选、整理,确定了作为汉字使用环境及试题范围的参考词语46000余条,编制成《汉字应用水平测试词语表》列为附录B(资料性附录)。
 
除了使用环境的依托问题,汉字测试的本质还是要围绕汉字本身的形音义等属性。因此,课题组对汉字的形、音、义做了适用于测试的梳理,比如易错易混的笔画、部件、结构及整字,多音字的若干读音,汉字的现代汉语义项等。以汉字的读音为例,经过反复讨论修改,考核的要点最终落实为由于多音混淆而产生的错误,如揣度、提防、屏弃等;常见的读音错误,如缄、讪、炽等;不常用字的读音错误,如籼、膪、莠,等等。
 
在编制试题过程中,课题组逐渐认识到,汉字测试具有非常明显的特殊性,其中最突出的例子是相同类型、同一内容范畴的试题,其答案具有可组合性,例如:在词语中判断用字是否正确的四选一试题,如果确定在一份试卷中可以容纳10个题目,那么40个答案则可组合出91390道试题;而这些试题再以10个一组满足试卷需求,则会形成一个更可观的数量。当然,这里面还有两个问题需要解决:第一,因为有些相同的答案出现在不同的试题中,从而可能导致同一份试卷中出现相同的项目,这就需要有查重的筛选机制,当然这类筛选性程序就涉及到试题的指标标注、题库管理及拼卷程序等问题了;第二,这40个答案所有可能的组合虽然能够生成数量巨大的试题,但是,对标准化测试来说,每一道试题都是独立的,在正式使用前都要经过试测的检验,都需要标注相关的指标,以备拼合试卷时使用。
 
为检验试题试卷的质量,获取有关数据,课题组先后两次抽取具有一定代表性的样本数千名,进行了模拟实测。试测数据提供了非常必要的和重要的信息,其中一些主要信息如下:第一,根据预期分别代表汉字应用水平初、中、高三种程度的受测群体,在识字量调查(在字表上标出认识的字)和试测中的表现相关程度很高,三种人群识字量和试测得分的排序完全一致,调查结果进一步验证了此前做过的同类调查,试测得分组间差异显著,表明测验的效度较高;第二,整份试卷难易度适中,总体上稍稍偏低;第三,占总题量93%强的试题,鉴别度参数在可接受范围,表明绝大多数试题具有较好的鉴别作用;第四,选择判断试题与书写试题经因素分析,表明所考查的不是同一种能力,这也证实了汉字应用的综合性,要求各项能力均衡发展,不可偏废,特别是汉字应用水平测试更不能顾此失彼;第五,根据试题贡献率指标,可以看出题量不必太大,这个结果与此前一些专家的建议基本吻合,因此,两次试测题量虽然分别为200和170,但实测题量最终确定为130。
 
实测结果也为等级标准和应试人测验得分的对应关系提供了重要参考。实测结果表明:根据预期分别代表汉字应用水平初、中、高三种程度的受测群体,对占总题量70%涉及测试字表甲表内容的试题,按照试题的能力参数和特征参数,经转换后,作答正确率达到或超过80%的人分别占该受测人群总体的80.1%、82.5%和84.3%;三种程度的受测群体在这部分测试内容上的平均答对率分别为80.5%、81.7%和89.6%。代表汉字应用水平初、中程度的受测群体,虽然在平均答对率上差异不显著,但是所答对的试题质量上却有显著差异,因此获得的HZC分数也有显著差异。
 
实测结果除了满足试题、试卷的需求外,对于题库建设更具有非常重要的作用,因为根据实测数据,可以量化试题的各项指标,而这些指标是判断试题是否可以进入题库的重要依据,同时也是计算机生成试卷的必要条件。
 
给试题标注各项指标,涉及到题库的管理系统和运行系统。根据汉字应用水平测试的特殊性和题库建设的最新研究成果及其发展趋势,课题组采用项目反应理论(IRT)作试题分析和题库建设的基础;与此同时,题库还划分字形、字音、字义和综合运用几个部分,构建板块框架,进行板块管理,每一个进入题库的试题都要标注所要考查的方面,并且标注作为考点的字属于测试字表中的哪一级,以此满足试卷各部分按一定比例进行拼合的需求;最后,题库的运行系统中,还要包括查重、筛选的过滤程序,避免考点重复,尤其是涉及字形判断、书写方面的试题,不能在考查其他任何方面的试题中出现。
 
五、有待进一步研究解决的几个主要问题
 
    从2002年底到现在,汉字应用水平测试的主体框架已经初现端倪,基本上能够满足实测的需求了,课题组感谢各方面的专家和同行在项目进行过程中所给予的支持和帮助,并将不断改进和完善测试框架和系统,以满足社会的需求。
 
在今后几年时间里,还有一些问题需要继续探索和研究。第一是根据国家语言文字政策、语言文字规范和标准的发展对测试的有关内容适时进行调整。第二是适应社会语文生活发展、变化的现实,处理好汉字应用水平测试的相关内容。第三是测试手段的现代化和多样化,比如计算机辅助测试、计算机化自适应测试等。第四是研究针对特定人群的等级标准和HZC分数对应,以至开发专门用于特定人群的测评子系统。第五是针对社会上整理传统文献等需求,以及台、港、澳和海外汉字应用的现状,研究涉及繁体字的测评方案问题。
 
参考文献
 
1.教育部 国家语委 2006 《汉字应用水平等级及测试大纲》,广州:广东教育出版社
 
2.国家对外汉语教学领导小组办公室汉语水平考试部 1992 《汉语水平词汇与汉字等级大纲》,北京:北京语言学院出版社
 
3.张敏强 1998 《教育测量学》,北京:人民教育出版社
 
4.田万海 1995 《数学教学测量与评估》,上海:上海教育出版社
 
5.许嘉璐 1999 《语言文字学及其应用研究》,广州:广东教育出版社
 
6.张一清 2004 《汉字应用水平等级标准》研制报告,《语言文字应用》第1期,56-62页
 
7.孙曼均 2004 汉字应用水平测试用字的统计与分级,《语言文字应用》第1期,63-70页
 
8.Bernard Spolsky 1999 《Measured Words》,上海:上海外语教育出版社
 
分享到:

相关信息