php使用xpath来进行采集页面的内容 - 在线代码运行


            
执行结果

名称:php使用xpath来进行采集页面的内容

当前代码

<?php
$html=file_get_contents('https://www.sogou.com/sogou?query=gif压缩');
$dom = new DOMDocument();
//从一个字符串加载HTML
@$dom->loadHTML($html);
//使该HTML规范化
$dom->normalize();

//用DOMXpath加载DOM,用于查询
$xpath = new DOMXPath($dom);
#获取所有的a标签的地址
$hrefs = $xpath->query("/html/body//a//@href");
for ($i = 0; $i < $hrefs->length; $i++) {
    $href = $hrefs->item($i);
    $linktext = $href->nodeValue;
    echo $linktext;
    echo "\r\n";

}