中文 英文 内容伪原创的近义词词库处理进度

中文和英文 内容伪原创的词库制作

伪原创的意思是将同一句话的意思 使用相关关键词的近义词代替
替换掉内容 保证内容可读性的前提下 实现较好的SEO效果

所以制作了几份语料库
暂时作为自用 无计划发布 有计划做个详细的类别
比如计算机 单独制作一个计算机类的词库

近义词最标准和接近原意的
截图演示

近义词库
近义词库


简体中文
========================
语料来自北京语言大学
已完成 YES
65267 个词
5447 个成语
57681 个字 高频字 使用频率比较高的字
待完成 No

美式美语
192740 常用类 语料来自华尔街日报语料库
250153 高频类 语料来自美国华盛顿大学 University of Washington

英式美语
192737 常用类 语料来自英国某大学

中文近义词获得方式为各大在线词典 各大学的开源实验室 搜索引擎采集
英文近义词获得方式为国外大学的实验室 和商业语言API 在线词典
已完成的均全部经过人工初步校队了

这个等英文词库 全部弄完 基本上算是国内最完整 词汇量最大的语料资源了
不知道市场行情会怎么样

格式为TXT

你认为你需要吗?

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注