En este post les voy a enseñar como hacer un script para extraer todos los links de una url utilizando la función file_get_contens() de php.
A continuación vemos como realizar correctamente utilizando el DOM, sin utilizar expresiones regulares se puede acceder a todos los tags a del html.

<?php
#webdebe
$url = file_get_contents('https://webdebe.com');
$dom = new DOMDocument();
@$dom->loadHTML($url);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
  $href = $hrefs->item($i);
  echo $href->getAttribute('href').'<br />';
}


Un error que es de esperar mismo de la función file_get_contents() si no utilizamos el http o https no puede dar un error tipo PHP Warning: file_get_contens(): filed to open stream: No such file or directory
Para poder ver el código en funcionamiento les dejo este enlace donde puedes ver todas mis herramientas gratuitas.
https://webdebe.com/herramientas/extraer-todas-las-url
 




Deja un Comentario

Tu dirección de correo no sera publicado. Los campos obligatorios están marcados con *

Nombre *
Correo *
Web