垃圾站 自动化垃圾站 可以考虑的方式以及系统架构和想法

垃圾站 自动化垃圾站PHP系统的想法

构造N个数据源
针对百度的话 可以考虑和百度不对付的站点
比如360 腾讯的数据

后台
=============================
定时自动抓取热门词汇和微博的热门话题
使用分词组件 分词后存到数据库 最好使用JSON格式存储到数据库
后续方便些 数据量大 直接查询出后在客户端解析

前台
=============================
提取数据 显示词和词组 加个链接
解析词组 抓取内容源
比如热门词汇 你好

提取N份内容
1. 从百度百科提取
2. 从互动百科提取
3. 从不对付的站点提取

提取后组合为一个页面
显示给搜索引擎收录 获得流量

这种模式不知道效果如何,
国外有几个这种形式的站点流量很大

还有另外一个模式
提取一个词组的相关内容
然后显示每个相关条目的部分内容
10-20个组成一个页面列表
点击进入条目的简单介绍 类似于简介
留个链接 到源网站的网页
这个模式国外的一个站 获得的流量应该是最大的
很离谱 看起来很离谱 经常可以搜索到这个站去… bigresource 你是不是也中过标?

One thought on “垃圾站 自动化垃圾站 可以考虑的方式以及系统架构和想法

  1. chen

    搜“bigresouce 垃圾”到这里,求合作

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注