php正则表达式提取:php 正则表达式提取网页超级链接url的函数来源: 发布时间:星期二, 2010年1月5日 浏览:0次 评论:0
复制代码 代码如下:
function match_links($document) { preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$document,$links); while(list($key,$val) = each($links[2])) { (!empty($val)) $match['link'] = $val; } while(list($key,$val) = each($links[3])) { (!empty($val)) $match['link'] = $val; } while(list($key,$val) = each($links[4])) { (!empty($val)) $match['content'] = $val; } while(list($key,$val) = each($links[0])) { (!empty($val)) $match['all'] = $val; } $match; } 主要是正则问题下面给出个asp.net下多测试正则 获取页面链接正则 复制代码 代码如下: public GetHref( HtmlCode) { MatchVale = ""; Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((\w|\\|\/|\.|:|-|_)+)('|""| *|>)?"; foreach (Match m in Regex.Matches(HtmlCode, Reg)) { MatchVale (m.Value).ToLower.Replace("href=", "").Trim + "||"; } MatchVale; } 0
相关文章读者评论发表评论 |