DEDE分页采集的问题
[size=2]是关于采集分页的事遇到不解
采集后的第二页连接地址是原采集点的第二页,只不过COM前边的网址不是原先的
这是欲要采集的原地址页
[/size][url=http://www.txwb.com/Article/serverHelp/rjjs/200611/3185_2.html][size=2][color=#0000ff]http://www.txwb.com/Article/serverHelp/rjjs/200611/3185_2.html[/color][/size][/url]
[size=2]
采集后的地址变成
[/size][url=http://www.333.com/Article/serverHelp/rjjs/200611/3185_2.html][size=2][color=#0000ff]http://www.333.com/Article/serverHelp/rjjs/200611/3185_2.html[/color][/size][/url]
[size=2]而不是
[/size][url=http://www.333.com/dede/html/shengfangxinwen/20061101/889_2.html][size=2][color=#0000ff]http://www.333.com/dede/html/shengfangxinwen/20061101/889_2.html[/color][/size][/url]
[size=2]这是什么原因?[/size] 分页采集,没有玩过 :P dede3.1分页文字采集过滤规则详说(图)
本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题
一、范例部分
范例分页区域代码:
范例分页区域代码:
[img]http://wen.soudata.net/bbs//70_316_f9fdccca78d4765.gif[/img]
太难转了,自己去看吧,反正挺详细的 [url=http://wen.soudata.net/bbs/read.php?tid-1290.html][b][color=red]dede3.1分页文字采集及过滤规则详说(图)[/color][/b][/url]
[[i] 本帖最后由 soudata.net 于 2007-3-31 10:36 编辑 [/i]]
页:
[1]
