投递文章投递文章 投稿指南 RSS订阅RSS订阅

DEDECMS完整采集教程:列表设置篇

来源:DEDE论坛 发布时间:2008-05-18 收藏 投稿 字体:【

------------------------------------- http://hi.baidu.com/4410828 ----------------------------------------

www.dede.comhtml教程中的数据库为例,地址是

http://www.dedecms.com/web-art/htmlbase/HTML/index.html

一,打开dedecms,进入【采集节点管理】,新建一个节点,模型我们就选择

------------------------------------- http://hi.baidu.com/4410828 ----------------------------------------

二,填写节点的基本信息:

名称就自己定义吧。

编码就比较重要,大家可以在页面点击右键来看该页面的编码。

来源就自己定义吧。

防盗链就看目标站点的有无刷新限制,有就设置一下超时时间。

------------------------------------- http://hi.baidu.com/4410828 ----------------------------------------

三,设置采集列表:

我们要采集的列表是这样的:

而我们要设置的列表是这样的:

下面我们来说明一下这个设置是怎么填的。

来源网址很重要的。列表的获取就是从这里得到的。

自己打开:http://www.dedecms.com/web-art/htmlbase/HTML/list_33_2.html

看看分页的规律。不难看出吧?

然后我们在设置列表分页时,就转换为变量值的形式:

http://www.dedecms.com/web-art/htmlbase/HTML/list_33_[var:分页] .html

而变量起始值是1,结束值是3,就代表1至3的列表页了。

正则配置网址就看本身是否有比较特定的文章网址字符。例如page1.html之类的。

下面的html范围就比较重要。

我们看原dede的列表。我们在浏览器里查看源文件。

查找以下代码:

看到这里,你一定要认识常用的html代码。

这里要复制代码起始就是那个文章列表的表格的开始部分吧。

下面就是文章列表的表格的结束部分的代码:

都相应地复制过去,这样列表的获取就成功了。

下面的制定网址就不用说吧?你想特别采集什么网址,就直接填上吧。

顶一下
(0)
0%
踩一下
(0)
0%
本文Tags:
  • 表情:
  •    
  • 评价:
用户名: 密码: 匿名 注册
最新评论 查看所有评论
About iTtang - 联系我们  - 专题列表 - 友情链接  -  高级搜索  -  帮助中心  -  您的意见