2 搜狗实验室(Sogou Labs)
3 Acollection of Chinese corpora and frequency lists
4 Corpus-basedLanguage Study
TheLancaster Los Angeles Spoken Chinese Corpus
5 lingcorpus.iis.sinica.edu.tw
收费:中央研究院-中文剖析樹檢索系統
6 LivacOnline
7 哈工大信息检索研究中心(HIT CIR)语言技术平台共享资源和程序步骤
8 ToRCH2014语料库 布朗家族中文语料库
9 CCL语料库 模式查询
10 candlewill/Dialog_Corpus
11 MarkWuNLP/MultiTurnResponseSelection
12 Short-TextConversation
13 语料库在线--资源共享
14 BCC语料库
15 LDC语料库 据说有一些中文文本
16 公布一批中文文本分类的新闻语料库 | 我爱自然语言处理
17 THCHS-30 清华大学大学生30小时语音
18 数据下载 - BosonNLP
19 北京宇音天下科技有限公司-下载中心
20 水木社区-源于清华的高知社群
21 语料库 - 自然语言处理与信息检索共享平台 NLPIR.org - Poweredby SupeSite
(参考链接:https://www.zhihu.com/question/21177095)
原文出处:http://corpus.njau.edu.cn/wiki/003
相关文章阅读
几个常见的汉语语料库分析
分词介绍
新时代人民日报分词模型