新闻内容正则:
<td>内容:<font color="#FF0000">[!–newstext–]</font></td>上面中的“[!–title–]”与“[!–newstext–]”分别为“标题”字段与“内容”字段的正则变量。用于指定我们要采集的内容位置。(3)、由上面我们得出了,帝国CMS采集正则是把正则变量替换要采集内容后的代码内容。格式:
识别代码头部[!–变量名–]识别代码尾部注意事项:上面的“识别代码头部”一定是要唯一的标记。
3、帝国CMS正则还有表示任意内容的字符:“*”如果“识别代码头部”中有内容是变化的,那么我们可以用*代替它。如页面源代码为如下,我们要采集下面的链接地址:
<a border=”0″ cellpadding=”10″ cellspacing=”1″> <a title="*" href="[!–newsurl–]">附加说明:[!–newsurl–]为页面链接地址的正则变量。4、其他说明:
(1)、正则要找出唯一性的开头字符。有时候空格都会成为识别的依据。
(2)、对于特殊字符请在前面加上“\\”,当然直接将特殊字符改为“*”最合适了。特殊字符如下:“ )”、“(”、“{”、“}”、“[”、“]”、“\&;、“?”等等。
昨晚多几分钟的准备,今天少几小时的麻烦。