您當前的位置:首頁 > 書法

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

作者:由 柯洛伊 發表于 書法時間:2014-03-05

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?郭一實2016-07-15 13:17:02

記得一段時間之前,我看過這個問題。不過由於沒有一個可以線上測試的漢字識字量的網站(應用),於是身為程式設計師的我,就自己做了一個判斷漢字識字量的應用。

測漢字:

http://

hanzi。sjz。io

網站裡的漢字的總量大概是1W多一點,每次抽取60個漢字。每個漢字對應一個識字量,選擇相應的漢字,會計算總的識字量,對照出來,就是你會的識字量了。

不過為何我一個大學畢業的,每次測試的都是4000多一點的識字量呢?難道我的應用不準確?我很好奇。

截圖如下:

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

歡迎大家提意見!

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?知乎使用者7u0a4x2019-08-31 13:06:55

(多圖)

一個普通高中畢業的中國人,識字量大約是4000-5000個。

在《通用規範漢字表》裡,一級字表(常用字)有3500個。

我從中抽取幾頁,大家看一下:

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

可以看到,都是生活中很常見的字,高中畢業生認識這些字毫無問題。

然後二級字表有3000個,抽幾頁大家看一下:

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

可見出現了一些生僻字,不過高中畢業生(語文不太差的話)保守估計也該認識其中三四成。

三級字表還有1000+個字,不過我覺得一般人認不出幾個:

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?

反正這一頁我認識的字不多,還都是從歷史、文學類書籍上認識的,比如璦琿條約的璦、王翦的翦、涅槃的槃、錢鍾書的鍾、“項王按劍而跽”的跽,諸此等等。在日常生活中幾乎不可能用到這些字。

所以估計一般高中畢業生認識的字大約4000-5000字。

特別說明:這裡的“高中畢業生”指的不是高三剛畢業的學生。

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?李雁北2019-09-08 20:26:33

作為研究過nlp的人來說一句

漢語在現存的各種語言中,可以算是相當獨樹一幟的了,而關鍵就在於這個漢字。很多人覺得:漢語是靠字組成詞,靠片語成句子,這點和很多語言不同——它們都是靠詞彙組成句子,缺少了字這個單位

這個說法不能算是完全準確,因為如果完全一個事物一個單詞,那需要的詞彙量也太多了。很多人說到雞鴨鵝蛋蛋或者豬牛羊肉的問題,這在nlp上確實是一個有趣的事情。比如說,有些人認為“雞蛋”是一個詞;“鴨蛋”不是詞,而是片語。其理由是,雞蛋因為非常常用,所以是詞,而除此之外任何卵生動物都可以組成xx蛋(比如鴕鳥蛋)這樣的片語,如果當作是詞彙的話,所有動物的蛋就都是詞了

初看這個問題,確實感覺中文陷阱很多,但仔細想想卻不盡然。比如說egg是雞蛋,duck egg不是鴨蛋嗎?或者這種說法對於說英語的人是不會產生歧義的。再比如牛肉是beef,豬肉是pork,但是說cow meat,pig meat也沒有人會覺得“聽不懂”了,當然也有一些喜歡賣弄的人堅決抵制這種做法。我是學計算機的,計算機領域可是非常喜歡片語的,比如中央處理器CPU,central processing unit,這三個單詞都是非常常用的簡單詞彙,而組成這個片語後基本也是原本的意思,英語使用者看到這個詞(不是縮寫的話)也是能大概猜出它是幹什麼用的

我們可以看出,這種用簡單片語成複雜詞的現象,在其他語言中也並不少見,可以說,越到概念複雜的領域,不同語言的區別就越小,越容易造詞

但是問題來了,如果真的如我所說,漢語在造詞方面並非一枝獨秀,那為什麼我們感覺還是那麼不同呢?

關鍵有兩點:虛詞實體化、“詞綴化”

(後面一個概念是我自己的,所以加上了雙引號)

首先我們學外語時往往最開始接觸的陌生概念就是“變形”。比如說英語的go goes went gone going等。都是go,為什麼要變形?因為要靠變形表示時態。比如今天做的和明天要做的,昨天做完的,用不同單詞表示,才能符合語法要求。但僅僅理解到這裡是不夠的——為什麼要有這樣的語法?說到底語法是人創造出來的,總結出來的,是總結大家都說的話再進行編纂的——那為什麼要這麼說話?

為了方便

實際上自然語言的傳達速度是非常之慢的,文字化可以加速很多,但依然很慢。為此必不可少的就是刪去一切冗餘的東西,讓那些你已經知道的東西不再顯示出來就好了(可以理解為某種意義上的壓縮演算法)。因此,如果我們用不同詞彙表達不同內容,就能節省很多時間。一些語言分陰陽性估計也有這方面考慮。(比如“男性俘虜”和“女性俘虜”,那待遇肯定是不同的……)實際上中文某正程度來說也存在這個現象,比如鳳凰這個詞就是一公一母,古代很多動物雌雄都是不同詞彙,而這英語裡和很常見

說了那麼多,這和中文什麼關係?關係是,中文把這些變形所包含的含義,抽象出來構成了詞。比如說“我吃飯了”,“我正在吃飯”,“我吃過飯了”,其中的“我吃飯”三個字完全沒變,只是加了幾個字就改變了時態。換句話說這幾個字就擔負起了“改變時態”這個功能。(文言文自然是不一樣,但本身那就是慢慢讀的高壓版本,看白話文小說(比如水滸傳)的話就能感覺和現代漢語相似度很高)

而這種情況其實在英語裡也存在,比如我們特別喜歡的-ed,-ing。沒錯,這就是詞綴!漢語的字(這裡是我的理論)其實可以充當詞綴的作用!

比如說雞蛋,我們可以理解為是“雞”的“蛋”這樣的兩個名詞從屬關係的組合,也可以理解為“雞生的”修飾“蛋”這個詞。再比如“蛋花湯”,也可以理解為“蛋花”修飾“湯”,意思是“有蛋花的”“湯”,而“蛋花”可以再拆解為“蛋”“的形狀起來像花”(這還是個定義後置)

也就是說 漢字的每一個字,都可以成為詞綴!

這是漢語最大的武器和美麗,也是它靈活的關鍵。有的人喜歡說中文意和,英語形和,我倒認為這是不求甚解。中文是把詞語的修飾功能下放到每一個基本單元,由此產生了無數種詞性與語用不相同的詭異局面。如果按照英語那種固定詞性決定固定用法的方式來分析中文,那必定是要吃苦頭的

所以最後回到這個問題——實際上這個問題沒有什麼意義,因為一個漢字與一個單詞的價值不同,一個漢語片語與一個英語片語的價值倒可能相當——但如果只是討論複雜概念的理解認知,那其實就等於考學歷了……

普通高中畢業的中國人的漢語識字量有多少, 漢語詞彙量又有多少?Sal Tian2019-09-13 20:32:28

以下教你如何估計你心理詞庫中的詞彙量。準備任何一種標準字典(如果只想算識字量)或詞典(想只算識字量就只看字,想算詞彙量就字詞都算上)以備查閱。

記下這本詞典的總詞彙量。如果詞典上沒說,就選有代表性的一頁,用這一頁的詞條數量乘以詞典的總頁數。

在詞典裡隨機選出4頁,比如第50頁、75頁、125頁、和303頁,數一下這些頁面上詞條的數目。

這其中有多少詞是你認識的?

在這4頁裡面的詞條,你認識的詞的百分比是多少?

用詞典的總詞數(1)乘以算出來的百分比(4),就是你大概的詞彙量。

(不只適用於漢語)

改編自:

An Introduction to Language (Eighth Edition)

標簽: 漢字  識字  比如  片語  詞彙量