1.采集去除链接
[Copy to
clipboard]CODE:
{dede:trim}]*)>([^<]*){/dede:trim}
--------------------------------
让field:title
标题突破30这个长度,修改代码的方法
找到./include/inc_arcpart_view.php
行291
:
if($titlelen=="") $titlelen = 30;
修改为
if($titlelen=="")
$titlelen = 60;
就可以了,然后,你可以这样调用了
{dede:channelArtlist
typeid=‘0‘ col=1 tablewidth=‘100%‘}
{dede:arclist
row="10"}
[field:title function="cn_substr(‘@me‘,38)"
/]
{/dede:arclist}
{/dede:channelArtlist}
把这个延伸一下:关于inc_arcpart_view.php
function
GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160,
$imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword="",
$innertext="",$tablewidth="100",$arcid=0,$idlist="")
这里的参数都可以更改你实际需要的模板元素尺寸大小.
2.
采集过虑中去掉链接保留文字的方法!
柏老大的方法是{dede:trim}<a
([^>]*)>([^<]*)</a>{/dede:trim}
这样做会去掉<a
hf.......>与</a>之间的字符!这样整个文章就少了部分字符,不完整了!
后来我多次测试,总算找到了正确的使用方法!如下:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
做成两条采集规则就可以了!
在实际使用中好像([^<]*)([^>]*)两条一起使用才行!
3.
过滤div
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
过滤js
{dede:trim}]*)>([^<]*){/dede:trim}
过滤未知变量字符
固定(.*)固定
4.dede万能过滤代码
以下是常用的正则表达式标签
{dede:trim}<tbody(.*)>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table(.*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<tr(.*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<td(.*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<font(.*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a(.*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<param(.*)>{/dede:trim}
{dede:trim}<embed(.*)</embed>{/dede:trim}
{dede:trim}<object(.*)</object>{/dede:trim}
{dede:trim}<iframe(.*)</iframe>{/dede:trim}
{dede:trim}<form(.*)</form>{/dede:trim}
{dede:trim}<input(.*)>{/dede:trim}
{dede:trim}<script(.*)</script>{/dede:trim}
{dede:trim}<style(.*)</style>{/dede:trim}
{dede:trim}<!--(.*)-->{/dede:trim}
以下为不常用的正则表达式标签
{dede:trim}<div(.*)>{/dede:trim}
{dede:trim}</div>{/dede:trim}
{dede:trim}<center(.*)>{/dede:trim}
{dede:trim}</center>{/dede:trim}
{dede:trim}<p(.*)>{/dede:trim}
{dede:trim}</p>{/dede:trim}
{dede:trim}<span(.*)>{dede:trim}
{dede:trim}</span>{dede:trim}
{dede:trim}<img(.*)>{/dede:trim}
/////////////////////////////////////
5.织梦标题不全,鼠标指向显示全部的代码:
{dede:arclist titlelen=‘100‘}
[field:title function=‘ (
strlen("@me")>40 ? cn_substr("@me",40): "@me" )
‘/]
{/dede:arclist}
6.dede/inc/inc_archives_functions.php第100行(flash频道远程flash本地化的BUG)
$cfg_uploaddir
= $GLOBALS[‘media_dir‘];
修改成
$cfg_uploaddir =
$GLOBALS[‘cfg_other_medias‘];
6.发布时间,来源,作者可以通过@me函数实现,如:在自定义处理接口:处输入
@me = "Azure·【博】" 就表示来源为“Azure·【博】”
7.
内容的替换:在所采集的文章内容中有多媒体,使用的是相对路径,采集的时候又不想下载,最好的办法就是将地址替换成媒体的实际地址。可以这样实现,在文章内容规则部分的自定义处理接口:处输入@me=str_replace(‘src="str1‘,‘src="str2‘,@me);
这样采集出来的文章中的所有的str1就被替换成str2!
DEDECMS采集规则,过滤,替换文章内的部分内容
时间: 2024-11-05 16:01:52
DEDECMS采集规则,过滤,替换文章内的部分内容的相关文章
【内容建设】以DEDECMS为例,讲解站内文章编辑的一些注意点,有益无害
以DEDECMS为例,讲解站内文章编辑的一些注意点,有益无害. 1. 标题:尽量拓展长尾词,攻略性为主 2. 自定义属性:方便前台调用.首页更新带动 3. Tag标签:尽量控制在4-6个字,数量不超过3个 4. 关键词:1-3个,提取标题中的长尾词 5. 内容摘要(描述/尽量不要自动获取): 1) 不超过3行(少5-6字) 2) 包含1-2次标题中的长尾词 3)突出三点:标题(长尾词).医院名称(医师).诊断手法 小结:关键词.描述内容均以标题为中心展开. 正文部分
织梦dedecms如何批量替换文章内容和缩略图
文章来自:http://blog.sina.com.cn/s/blog_475ea1130101co6w.html 第一种方法: 进入后台,点左侧的采集,点选批量维护的数据库内容替换. 1.替换标题内某关键词,选择dede_archives数据表,选择title字段,被替换内容:收入,替换为:赚钱,填入安全确认码,最后点开始替换数据,提示替换成功,这样文章的标题内容批量的替换很方便! 2.替换文章正文内某关键词,选择dede_addonarticle数据表,选择body字段,被替换内容:收入,替
dedecms在后台替换文章标题、内容、摘要、关键字
dedecms在后台替换文章标题.内容.摘要.关键字所在的字段为: 后台替换文章内容 数据表:dede_addonarticle 字段:body 后台替换文章摘要内容 数据表:dede_archives 字段:description 后台替换文章标题内容 数据表:dede_archives 字段:title 后台替换文章关键词: 数据表:dede_archives 字段: keywords
DeDeCMS后台批量修改替换sql语句大全
有时候后台文章内容.标题或者锚文本出错,需要修改批量修改,那么就需要用dedecms的sql语句进行批量修改了. 利用dedecms后台SQL命令行工具批量修改内容,路径和超链接等信息.语句 DEDECMS SQL命令批量替换1.更改文章中的内容update dede_addonarticle set body=replace(body,'原来的字符','替换后的字符')例子解释:update dede_addonarticle set body=replace(body,'软件下载','插件下
织梦DedeCms网站更换域名后文章图片路径批量修改
因为织梦上传图片用的是绝对地址,如果域名更换后,之前发布的文章的图片URL是不会跟着改变的,所以我们需要把旧域名替换成新的域名,方法很简单,有一段SQL语句更新一下文章正文内容就行. 复制下面SQL语句进织梦DedeCms的后台,点 系统 -> SQL命令行工具,然后看到一个文本框,在文本框内输入SQL语句,按确定之行.如果操作成功,上面会提示“成功执行x个SQL语句!” update dede_addonarticle set body=replace(body,’旧域名’,'新域名’) 然后
[转载]非常的好的协同过滤入门文章
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用.同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法.本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助用户清楚的了解和快速构建适合自己的推荐引擎. 信息发现 如今已经进入了一个数据爆炸的时代,随着 We
理解DDoS防护本质:基于资源较量和规则过滤的智能化系统
欢迎访问网易云社区,了解更多网易技术产品运营经验. 随着互联网生态逐渐形成,DDoS防护已经成为互联网企业的刚需要求,网易云安全(易盾)工程师根据DDoS的方方面面,全面总结DDoS的攻防对抗. 1.什么是DDoS DDoS全称Distributed Denial of Service,中文意思为"分布式拒绝服务",就是利用大量合法的分布式服务器对目标发送请求,从而导致正常合法用户无法获得服务.通俗点讲就是利用网络节点资源如:IDC服务器.个人PC.手机.智能设备.打印机.摄像头等对目
sql 查询条件过滤替换特许符号(‘,",+,!等)
查询条件过滤替换特许符号 public static string SpecialSymbols(string strText) { strText = strText.Trim(); strText = strText.Replace("!", "' + char(33) + '"); strText = strText.Replace("\"", "' + char(34) + '"); strText = st
【03】基础:同种网页结构套用采集规则
请先安装爬虫软件.爬虫软件安装 经过上个教程小试牛刀之后就可以尝到获得数据的喜悦了. 回顾一下,上个教程主要了解了MS谋数台的工作职责-定义采集规则,测试规则无误之后点击MS谋数台右上角的“爬数据”后弹出DS打数机,然后看到打数机窗口正在马不停蹄地抓取数据.这两个部件的工作配合地很紧密. 在学会将xml文件转成Excel之前,先解决当下的一个疑问?如果要采集其他博主主页的微博,是要重新做过规则吗?非也~ 用MS谋数台制定采集规则用了一个样本网址,既然是样本,可想而知,与样本相同结构的网页,都可以