对外汉语教学中的字词识记探讨
信息在师生交互中的定量分析:
这里,我们采用香农()的信息量分析方法讨论文字符号信息,例如英语,设文字信号的信息量H,则H是信号个数n的以2为底的对数:
H=logn/log2
英文有 26个字母,每个字母的信息量
H=log26/log2 =4.700
我们假设汉字有1000个,则每个汉字的信息量是
H= log1000/log2 =9.966
常用汉字为2500个,则每个汉字的信息量为
H= log2500/log2 =11.288
我们不可能随意增加大量一辈子也用不到的汉字,来无限地增加每个汉字的信息量。但是信息量不能无条件地按符号的个数来计算,只有各符号的可能性一样,都等于1/n时才行。
推广而知,事实上信息量应按符号的可能性(数学上叫概率大小)来计算,它是概率的负对数。对于二进制数,每个符号的概率都等于1/2,按负对数计算:
log〖1/n〗=-(log1-logn )=-(0-logn )=logn
这就是我们前面使用的公式的来源。如果符号i的概率P_i不等于1/n,则
H_i=-log〖P_i 〗
因为各个符号的概率P_i不相等,对于总体来说,平均信息量就是它们的加权平均
H=-K∑_(i=1)^n▒〖p_i log〖p_i 〗 〗
whereK is a positive constant, merely amounts to a choice of a unit of measure
(以上式子除以log2,就可化为以比特为单位)。
从以上的分析可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大,比较复杂。因而中文比英文简洁。一件事实是,联合国的5种语言的文件厚度以中文的最薄。正是因为汉字少且信息量大,极容易造成偏误,因此我们在汉语识记教学中,可以从这方面入手,从信息量最小的字词入手,由浅入深,循序渐进进行识记教学。不能将英语词汇教学法照搬到汉语教学中。
教师传递的知识信息,通过感官传递到学生大脑,这个过程总需要一定的时间间隔Δt。根据香农公式:
C=B log〖(1+p/N〗)
维纳-香农公式:
S=B∆t log〖(1+p/N〗)
传递最大信息量S,由传递信号的频带宽B、传递时间间隔Δt、信息平均功率P、噪声平均功率N决定。因此,在一定时间内,频带宽愈大,信噪比P/N愈高,传递信息愈多。对于人的记忆而言.在式中,如果时间间隔Δt太短,则人是难以辨认和储存其信息的。如果时间△t大于一定时间,则该传输的信息可以由短时记忆贮存到长时记忆中去。
因此我们可以得出以下结论:
1 心绪平稳时候是最佳记忆
从信息论公式也能看出,噪声的功率越小,我们接受到的信息越多,我认为这一环节是极为重要的,它能够排除内外干扰,使大脑处于最佳状态,保证记忆的顺利进行。在信息输入储存到输出的整个过程,都受到种种“噪声”的干扰,致使输出的信息失真。当人们将信息输入后,提取时也存在不准确现象,这也是内外不利因素干扰导致的。
从香农熵理论中,我们还可以得出,每个汉字的信息量是非常巨大的,换句话说,不确定度也大。这样我们就应该增加信息平均功率P,减小信息传输各种干扰,即N,从而达到最大传输信息的作用。所以我认为,汉语识记必须进行大量且不间断的有效输入,例如,通过提高声音来提醒学生上课了,表情丰富的教师比表情冷漠的教师能传输更多的信息;有肢体动作的教师比呆板的教师能传授更多的信息。
2 汉语应以感性认识为基础
人耳可接受的声波频带宽为 20-20000Hz, 声波为机械波;人眼可观察到的光波频带宽为3.9×〖10〗^14-7.5×〖10〗^14Hz,所以,从香农信息论的频带宽来看,在相同时间内,光波比声波能向人体传授更多的信息量。
大量的事实也表明,事物的形象是信息储存的最佳方式。但是语言是第二信号,是这些形象记忆的抽象化表述。17世纪捷克著名教学家夸美纽斯谈到教学法时,主张“应该使学生先学习感性的,然后是理性的”。由于汉语是一种象形文字,其本身就是以感性存在的,“a graphic a character”就是这个道理,因此汉语识记更应该感性认识为主导。
二、学生如何对汉字进行长时记忆:
认知心理学家奥斯贝尔(Ausubel)把信息的编码过程看作为概念归纳过程( subsuming)。用他的话来说, 归纳就是把有意义的信息归入现存的知识结构, 而意义的形成取决于新信息能否与现存知识联系起来。完全陌生的信息, 或者说, 完全无法与现存知识建立联系的信息, 是毫无意义的( Ausubel 1968)。换句话说, 要使新信息存入长久记忆中, 就必须设法把新信息与现存知识联系起来, 使它富有意义。只有那些富有意义的信息才能储存在长久的记忆中。
Atkinson和Shiffrin最早在1968年提出了记忆信息三级加工模型,又在1969年对其进行了扩展,首次提出长时记忆是一种“自寻址记忆”,即信息所在位置是按信息的内容来确定的。这样的组织类似图书馆的书架排列。其中,短时记忆中的信息通过复述或者精细复述进入长时记忆,记忆系统加工的信息归根结底要在长时记忆中贮存。
北京语言大学(1986)计算了在131万个词的阅读材料中,出现过多少个汉字。结果发现出现一次以上的字只有4574个。这就是说,只要认识4574个汉字,就可以阅读当代中文的各种材料。同时,Just和Carpenter(1987)的实验发现,中文阅读的注视时间可以由词的频率来预测;但是,我认为,阅读的注视时间也是受中文词内的字的频率影响的,这个实验在一定程度上说明,中文可能是以字的形式贮存在心理词典之中的。
显然,在汉语词汇习得的研究中,语义记忆的研究更有价值。下面我分别用两个主流的语义记忆模型来解释按“字”贮存在记忆中的记忆方法。
层次网络模型
我们首先用Collins&Quillian(1969)提出的层次网络模型来解释。在这个模型中,语义记忆的基本单元是概念,每个概念具有一定的特征。有关概念按逻辑的上下级关系组织起来,用连线连接,构成一个有层次的网络系统。
在我看来,这个层次结构模型对概念的特征相应的实行分级贮存。在每一级概念的水平上,只贮存该级概念独有的特征,而同一级的各概念所具有的共同特征则贮存于上一级概念的水平上。我采用“逐字处理”的观点看待汉语词汇的信息贮存,发现汉语的词库天然地适合用这一模型来描述,如果说印欧语的词库中各概念之间还依赖关系的话,那么汉语的大量词汇几乎可以直接体现这种层级关系。
(插图)
在上面这个模型里,单个的“字”是天然的结点,不管是存取还是提取,以“字”为节点,比传统按双音节或多音节词输入的方式,具有音节少、语义概括性强而单位总数少的特点,这能够符合长时记忆规律的角度,得到合理性论证。相反,放弃汉语的天然规律,而像印欧语那样按词输入,是违背记忆规律的。
激活扩散模型
Collins和Loftus(1975/)又提出了激活扩散模型,其原理是以语义联系或语义相似性将概念组织起来。
在我看来,激活扩散模型用语义联系取代了层次结构,因此比层次网络模型更加全面和灵活。层次网络模型带有严格的逻辑性质,但是激活扩散模型适合个人,具有很大弹性,可容纳更多的不确定性和模糊性。
(插图)
我认为,在这个模型中,概念之间相互联系的结点是单个的“字”。常用“字”的总量是有限的,因此按字贮存是非常节省空间的,但同时又能通过“字”与“字”的组合,构成无数的概念,这种特性非常符合“认知经济”原则,也可以说是汉语在记忆领域的特有的优势。和层次网络模型相比,采用激活网络模型,“字”不仅能够代表一级概念,而且可以在更多方向上发挥灵活的构件作用,其功能得到了更好的体现。