专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅

首页 »编程综合 » php正则表达式提取:php 正则表达式提取网页超级链接url的函数 »正文

php正则表达式提取:php 正则表达式提取网页超级链接url的函数

来源: 发布时间:星期二, 2010年1月5日 浏览:0次 评论:0
复制代码 代码如下:

function match_links($document) {
preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$document,$links);
while(list($key,$val) = each($links[2])) {
(!empty($val))
$match['link'] = $val;
}
while(list($key,$val) = each($links[3])) {
(!empty($val))
$match['link'] = $val;
}
while(list($key,$val) = each($links[4])) {
(!empty($val))
$match['content'] = $val;
}
while(list($key,$val) = each($links[0])) {
(!empty($val))
$match['all'] = $val;
}
$match;
}


主要是正则问题下面给出个asp.net下多测试正则
获取页面链接正则
复制代码 代码如下:

public GetHref( HtmlCode)
{
MatchVale = "";
Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((\w|\\|\/|\.|:|-|_)+)('|""| *|>)?";
foreach (Match m in Regex.Matches(HtmlCode, Reg))
{
MatchVale (m.Value).ToLower.Replace("href=", "").Trim + "||";
}
MatchVale;
}

0

相关文章

读者评论

发表评论

  • 昵称:
  • 内容: