En este post les voy a enseñar como hacer un script para extraer todos los links de una url utilizando la función file_get_contens() de php.
A continuación vemos como realizar correctamente utilizando el DOM, sin utilizar expresiones regulares se puede acceder a todos los tags a del html.
<?php #webdebe $url = file_get_contents('https://webdebe.xyz'); $dom = new DOMDocument(); @$dom->loadHTML($url); $xpath = new DOMXPath($dom); $hrefs = $xpath->evaluate("/html/body//a"); for ($i = 0; $i < $hrefs->length; $i++) { $href = $hrefs->item($i); echo $href->getAttribute('href').'<br />'; }
Un error que es de esperar mismo de la función file_get_contents() si no utilizamos el http o https no puede dar un error tipo PHP Warning: file_get_contens(): filed to open stream: No such file or directory
Para poder ver el código en funcionamiento les dejo este enlace donde puedes ver todas mis herramientas gratuitas.
https://webdebe.xyz/herramientas/extraer-todas-las-url