展示SiteFactory分页采集图片教程案例_动易Cms教程

编辑Tag赚U币
教程Tag:暂无Tag,欢迎添加,赚取U币!
看到好多网友都遇到过我之前遇到的问题 所以写个采集教程大家共享下 以解决大家遇到的一些采集问题

理论我就不多说了 可以看动易的手册教程 下面就用一个案例来说明分页采集的方法

采集网站案例地址:http://windows.chinaitlab.com/List_96.html


图片点击可在新窗口打开查看

 

添加采集项目


建立项目:
图片点击可在新窗口打开查看

 

列表设置

列表开始代码:<div class="row2 border_kuang">

列表结束代码:<!-- 分页开始 -->

 

链接开始代码:· <a href="

链接结束代码:" target=_blank title="


列表采集效果:
图片点击可在新窗口打开查看

 

页面列表:
图片点击可在新窗口打开查看

列表设置时注意 列表开始代码和列表结束代码 要取列表开始和结束的一些唯一的代码 可用测试列表来测试列表是否正确 如果不正确重新查找正确的代码 可用查找命令查找代码是否唯一

链接开始代码和链接结束代码 取列表中链接地址前和后的一些链接代码 可点测试链接进行链接测试 如果不正确 去掉"号前后的代码试试

 

 列表分页设置 (可以根据自己的需要选择是否有列表分页)


图片点击可在新窗口打开查看


批量指定分页URL代码:

http://windows.chinaitlab.com/List_96_{$ID}.html 

ID范围: 10 - 1


图片点击可在新窗口打开查看


手动添加分页URL代码:

http://windows.chinaitlab.com/List_96_10.html

http://windows.chinaitlab.com/List_96_9.html

http://windows.chinaitlab.com/List_96_8.html

http://windows.chinaitlab.com/List_96_7.html

http://windows.chinaitlab.com/List_96_6.html

http://windows.chinaitlab.com/List_96_5.html

http://windows.chinaitlab.com/List_96_4.html

http://windows.chinaitlab.com/List_96_3.html

http://windows.chinaitlab.com/List_96_2.html

http://windows.chinaitlab.com/List_96_1.html
 



基本上现在的网站的列表分页还是比较规则的 大多可以用 批量指定分页URL代码 和手动添加分页URL代码 来解决

 

 内容页采集设置 


图片点击可在新窗口打开查看

标题设置 (由于重点讲分页设置 所以在此 完整标题  副标题 关键字 和简介 设置成和标题一样的采集规则了 大家可以根据自己的需要自己设置 )

选中 使用采集规则


 字段设置开始:
 <title>

 字段设置结束:-Windows频道-中国IT实验室</title>


 

文章内容


采集内容效果图:
图片点击可在新窗口打开查看

字段设置开始:<div class="Article_content">

字段设置结束:<div align=right style="margin:3px 0;">

文章内容采集规则设置中字段设置开始:和字段设置结束:也是找文章正文的开始和结束代码


测试采集下一页效果:
图片点击可在新窗口打开查看

分页设置


分页代码开始:[1]

分页代码结束:.html'>下一页

分页URL开始代码:<a href='

分页URL结束代码:'>

 

分页代码开始一般找文章分页列表地址的开始和结束部分唯一代码 多尝试几次就明白

<P></p><p align='center'><b><font color='red'>[1]</font> <a href='http://windows.chinaitlab.com/info/757581_2.html'>[2]</a> <a href='http://windows.chinaitlab.com/info/757581_3.html'>[3]</a> <a href='http://windows.chinaitlab.com/info/757581_4.html'>[4]</a> <a href='http://windows.chinaitlab.com/info/757581_5.html'>[5]</a> <a href='http://windows.chinaitlab.com/info/757581_6.html'>[6]</a> <a href='http://windows.chinaitlab.com/info/757581_7.html'>[7]</a> <a href='http://windows.chinaitlab.com/info/757581_8.html'>[8]</a> <a href='http://windows.chinaitlab.com/info/757581_9.html'>[9]</a> <a href='http://windows.chinaitlab.com/info/757581_10.html'>[10]</a> <a href='http://windows.chinaitlab.com/info/757581_2.html'>下一页</a> </b></p>

是否保存远程图片 是否保存图片可以根据自己的需要 保存的话就保存到自己的网站服务器了 还有一点是相对链接的图片最好保存 要不也是显示不了图片的


字段采集页面效果:
图片点击可在新窗口打开查看


正在采集中效果图:
图片点击可在新窗口打开查看



采集后内容页显示效果:
图片点击可在新窗口打开查看

然后保存测试就可以了 测试完可以采集一些看下效果 如果文章显示不正确说明采集规则设置有问题 可以重新设置或修改下就可以 由于每个网站的采集规则都不太一样 所以可以根据每个网站的规则自行设置 多测试多制作规则就了解其中的规律了,也由于一个网站的局限性只能说说采集的一些常用和实用的一些功能 其他的一些功能可以参考手册也可以自己研究哈 我也是用户所以难免有错误或疏忽的地方也请大家指正和包涵哦。

查看更多 动易Cms教程  动易Cms模板

来源:模板无忧//所属分类:动易Cms教程/更新时间:2009-07-28
相关动易Cms教程