中国网管论坛's Archiver

yyzx 发表于 2006-11-1 17:43

DEDE分页采集的问题

[size=2]是关于采集分页的事
遇到不解
采集后的第二页连接地址是原采集点的第二页,只不过COM前边的网址不是原先的
这是欲要采集的原地址页
[/size][url=http://www.txwb.com/Article/serverHelp/rjjs/200611/3185_2.html][size=2][color=#0000ff]http://www.txwb.com/Article/serverHelp/rjjs/200611/3185_2.html[/color][/size][/url]

[size=2]
采集后的地址变成

[/size][url=http://www.333.com/Article/serverHelp/rjjs/200611/3185_2.html][size=2][color=#0000ff]http://www.333.com/Article/serverHelp/rjjs/200611/3185_2.html[/color][/size][/url]

[size=2]而不是
[/size][url=http://www.333.com/dede/html/shengfangxinwen/20061101/889_2.html][size=2][color=#0000ff]http://www.333.com/dede/html/shengfangxinwen/20061101/889_2.html[/color][/size][/url]

[size=2]这是什么原因?[/size]

木木 发表于 2006-11-1 17:44

分页采集,没有玩过 :P

soudata.net 发表于 2007-3-31 10:34

dede3.1分页文字采集过滤规则详说(图)

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:

[img]http://wen.soudata.net/bbs//70_316_f9fdccca78d4765.gif[/img]


太难转了,自己去看吧,反正挺详细的 [url=http://wen.soudata.net/bbs/read.php?tid-1290.html][b][color=red]dede3.1分页文字采集及过滤规则详说(图)[/color][/b][/url]

[[i] 本帖最后由 soudata.net 于 2007-3-31 10:36 编辑 [/i]]

页: [1]

Powered by Discuz! Archiver 6.1.0  © 1999-2008 bbs.bitsCN.com