【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
上一篇 : 俄罗斯妹子***漂亮热情,中国男人是不是很喜欢娶?
下一篇 : 伊朗和以色列停战了,这是伊朗怂了,还是以色列怂了?
为什么利用无线电***很快就会被警察抓到?...
Rust1.86才正式稳定trait的upcast,为什么在rust中这个特性实现如此复杂?...
美国下场轰炸伊朗,这次我国为什么要这么直白的谴责美国?...
现在个人博客不能备案了吗?...