Wget
Per scaricare siti in locale sul proprio computer o per scaricare file molto lunghi, esiste una utility in Linux molto potente "wget". Il suo utilizzo e' il seguente
$ wget [opzioni] URL
le opzioni piu' utili sono:
- -r : scarica anche tutti i collegamenti del sito, da solo puo' essere pericoloso, perche' potrebbe scaricare tutto internet se ogni pagina e' collegata ad un'altra senza fine...
- -np : da usare insieme a -r per evitare che scarichi collegamenti che si riferiscono a pagine superiori nell'albero delle directory del sito.
- -c : continua scaricare un download interrotto.
- -k : converte i link tra le pagine scaricate in modo che possano essere utilizzate in locale (puo' succedere che alcuni siti siano progettati in maniera tale che scaricati in locale i link non funzionino piu').
Esempi:
$ wget -r -np www.linux.it/guide/ $ wget -r -np -k www.linux.it/guidaincasinata/index.html $ wget www.musica.it/celentano.mp3 $ wget -c www.musica.it/celentano.mp3 $ wget -r --follow-tags=a --reject '*.js,*.css,*.ico,*.txt,*.gif,*.jpg,*.jpeg,*.png,*.mp3,*.pdf,*.tgz,*.flv,*.avi,*.mpeg,*.iso' --ignore-tags=img,link,script www.musica.it