DedeCMS采集教程:过滤替换的技巧_DedeCms教程

编辑Tag赚U币
教程Tag:暂无Tag,欢迎添加,赚取U币!
DedeCMS采集教程:过滤替换的技巧
根据我个人织梦dedecms采集过程总结了一些经验,写出来供大家参考。
  1.采集去除链接
  1. [Copy to clipboard]CODE: 
  2.    
  3.   {dede:trim}]*)>([^<]*){/dede:trim} 
  4.    
  5.   -------------------------------- 
  6.    
  7.   让field:title 标题突破30这个长度,修改代码的方法 
  8.    
  9.   找到./include/inc_arcpart_view.php 
  10.    
  11.   行291 : 
  12.    
  13.   if($titlelen=="") $titlelen = 30
  14.    
  15.   修改为 
  16.    
  17.   if($titlelen=="") $titlelen = 60
  18.    
  19.   就可以了,然后,你可以这样调用了 
  20.    
  21.   {dede:channelArtlist typeid='0' col=1 tablewidth='100%'
  22.    
  23.   {dede:arclist row="10"
  24.    
  25.   [field:title function="cn_substr('@me',38)" /] 
  26.    
  27.   {/dede:arclist} 
  28.    
  29.   {/dede:channelArtlist} 
  30.    
  31.   把这个延伸一下:关于inc_arcpart_view.php 
  32.    
  33.   function GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160
  34.    
  35.   $imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword=""
  36.    
  37.   $innertext="",$tablewidth="100",$arcid=0,$idlist=""
  这里的参数都可以更改你实际需要的模板元素尺寸大小.
  
  2. 采集过虑中去掉链接保留文字的方法!
  
  柏老大的方法是{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}
  
  这样做会去掉<a hf.......>与</a>之间的字符!这样整个文章就少了部分字符,不完整了!
  
  后来我多次测试,总算找到了正确的使用方法!如下:
  1. {dede:trim}<a([^>]*)>{/dede:trim} 
  2.   
  3.  {dede:trim}</a>{/dede:trim} 
  4.   
  5.  做成两条采集规则就可以了! 
  6.   
  7.  在实际使用中好像([^<]*)([^>]*)两条一起使用才行! 
  3. 过滤div
  1. {dede:trim}]*)>{/dede:trim} 
  2.   
  3.  {dede:trim} 
  4.   
  5.  {/dede:trim} 
  6.   
  7.  过滤js 
  8.   
  9.  {dede:trim}]*)>([^<]*){/dede:trim} 
  10.   
  11.  过滤未知变量字符 
  12.   
  13.  固定(.*)固定  
  4.dede万能过滤代码
  
  以下是常用的正则表达式标签
  1. {dede:trim}<tbody(.*)>{/dede:trim} 
  2.   
  3.  {dede:trim}</tbody>{/dede:trim} 
  4.   
  5.  {dede:trim}<table(.*)>{/dede:trim} 
  6.   
  7.  {dede:trim}</table>{/dede:trim} 
  8.   
  9.  {dede:trim}<tr(.*)>{/dede:trim} 
  10.   
  11.  {dede:trim}</tr>{/dede:trim} 
  12.   
  13.  {dede:trim}<td(.*)>{/dede:trim} 
  14.   
  15.  {dede:trim}</td>{/dede:trim} 
  16.   
  17.  {dede:trim}<font(.*)>{/dede:trim} 
  18.   
  19.  {dede:trim}</font>{/dede:trim} 
  20.   
  21.  {dede:trim}<a(.*)>{/dede:trim} 
  22.   
  23.  {dede:trim}</a>{/dede:trim} 
  24.   
  25.  {dede:trim}<param(.*)>{/dede:trim} 
  26.   
  27.  {dede:trim}<embed(.*)</embed>{/dede:trim} 
  28.   
  29.  {dede:trim}<object(.*)</object>{/dede:trim} 
  30.   
  31.  {dede:trim}<iframe(.*)</iframe>{/dede:trim} 
  32.   
  33.  {dede:trim}<form(.*)</form>{/dede:trim} 
  34.   
  35.  {dede:trim}<input(.*)>{/dede:trim} 
  36.   
  37.  {dede:trim}<script(.*)</script>{/dede:trim} 
  38.   
  39.  {dede:trim}<style(.*)</style>{/dede:trim} 
  40.   
  41.  {dede:trim}<!--(.*)-->{/dede:trim} 
  42.   
  43.  以下为不常用的正则表达式标签 
  44.   
  45.  {dede:trim}<div(.*)>{/dede:trim} 
  46.   
  47.  {dede:trim}</div>{/dede:trim} 
  48.   
  49.  {dede:trim}<center(.*)>{/dede:trim} 
  50.   
  51.  {dede:trim}</center>{/dede:trim} 
  52.   
  53.  {dede:trim}<p(.*)>{/dede:trim} 
  54.   
  55.  {dede:trim}</p>{/dede:trim} 
  56.   
  57.  {dede:trim}<span(.*)>{dede:trim} 
  58.   
  59.  {dede:trim}</span>{dede:trim} 
  60.   
  61.  {dede:trim}<img(.*)>{/dede:trim} 
以上内容仅供大家学习参考,希望对你有所帮助。  
 

查看更多 DedeCms教程  织梦模板  织梦DedeCms视频教程  织梦dedecms专题

来源:模板无忧//所属分类:DedeCms教程/更新时间:2020-05-30
相关DedeCms教程