Web spider in Drupal

4 contenuti / 0 new
Ultimo contenuto
Web spider in Drupal

Credo non esista ... Ma vite le piacevolissime sorprese che offre Drupal ci provo Cmq.

Esiste un modulo Drupal che naviga su un sito esterno estraendone i testi e salvandoli in un db con relativo riferimento di pagina?

Insomma una specie di web spider come quello impiegato da google per scandagliare i meandri del web???

Vi prego datemi una bella notizia :D

Drupal Version:

Forse con SOLR ci potrebbe essere un modo .... Mmmm, il problema è che non riesco a trovare documentazione in italiano :(

Ma questi dati li vorresti raccogliere per poi creare delle pagine nel tuo sito, in pratica fare come gli aggregatori? In tal caso più che "spider" il termine giusto è "scraper" e quindi ti consiglio di guardare il modulo "feed", tempo fa con quel modulo (e giusto qualche lieve personalizzazione) ho creato un semplice aggregatore senza dover faticare più di tanto.

Ciao!

il feed è il flusso di "nuovi" contenuti rilasciati da un sito web
lo spider o crawler è un bot che setaccia un intero sito web
puoi provare con dei sottomoduli di feeds
http://drupal.org/project/feeds_spider
http://drupal.org/project/feeds_crawler