Kako klonirati bilo koju web stranicu pomoću HTTracka

Sadržaj

HTTrack je besplatan i besplatan i višeplatformski softver čija je svrha hvatanje weba, odnosno preuzima se cijela ili dio web stranice kako bi se kasnije njome mogli kretati izvan mreže. Postoji verzija za Linux koja se zove WebHTTrack, a naziva se njegova verzija za Windows WinHTTrack. Softver HTTrack možemo preuzeti s njegove službene web stranice:

U slučaju Linuxa, možemo ga instalirati i iz spremišta, pomoću sljedeće naredbe.

 sudo apt-get install httrack

Ovaj softver mnogo se koristi za kopiranje web stranica a zatim ih prenesite na drugi poslužitelj i upotrijebite ih za preusmjeravanje prometa na stranicu za kopiranje, šaljući posjetitelje na lažnu stranicu. Koriste ga i oni koji žele vidjeti kôd ili rad određene web stranice. Pogledajmo primjer sa web lokacijom httrack.com, na kojoj se aplikacija nalazi.

 httrack "httrack.com"
Ova naredba će preuzeti datoteke s weba u mapu www.httrack.com, što možemo vidjeti lokalno.

HTTrack preuzima bilo koju web stranicu i kopira je u mapu ili pogon na kojem se nalazimo. To može biti korisno pri pretraživanju podataka na web stranici izvan mreže, poput adresa e -pošte, korisnih informacija za SEO ili strukturu web stranice. HTTrack dolazi i u sustavu Windows i u verziji za Linux, a upotreba je ista samo u tome što u sustavu Windows ima vizualni međurez.

Možemo koristite Httrack za testiranje penetracije i sigurnosno testiranje, budući da prilikom izrade replike web stranice omogućuje analizu cjelokupnog sadržaja i datoteka koje se preuzimaju, kako bi se utvrdilo da napadač ne vidi kritičnu datoteku. Kada prikupljamo podatke i informacije, možemo obavljati testove, pretraživati ​​i analizirati kôd ili ključne riječi, također možemo prikupljati podatke koji se kasnije mogu koristiti.

Također na ovaj način lhakeri koriste kopije napravljene za postavljanje na poslužitelj s kopiranom domenom sličnom webu za oponašanje web stranica, a zatim ih koristi putem krađe identiteta za krađu podataka od neslućenih korisnika ili za izvođenje napada društvenog inženjeringa. Httrack ima mnogo opcija i parametara koje možete koristiti za poboljšanje preuzimanja. Za to se koristi naredba:

 httrack --pomoć

Neki važni parametri koje možemo koristiti s alatom Httrack su:

  • -m: označava najveću veličinu datoteke u bajtima za preuzimanje, na primjer -2000000 m ekvivalentno 20 mb.
  • -mimika: koristi se za preuzimanje samo određene vrste datoteke koju ćemo označiti njezinim nastavkom, na primjer naredbom
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Korištenje httracka je jednostavno, moramo dodati domenu web stranice koju želimo kopirati, a zatim započeti skeniranje pozicioniran u imenik na našem tvrdom disku gdje ćemo pohraniti web stranicu. Moramo uzeti u obzir koliko veza ili sadržaja web stranica može imati zbog količine podataka za preuzimanje. Istraživanje kopije weba može se koristiti za traženje nedostataka i ranjivosti koji mogu ugroziti pregledavanje, kao i za utvrđivanje koji su dijelovi prikladni za šifriranje ili povećanje sigurnosti.

Ako je cilj preuzimanja pronaći informacije o tvrtki ili popise korisnika, telefone ili druge podatke, posebno za društveno inženjerstvo, ili pokušaj lažiranja web stranice ili prijavu za dobivanje korisničkih podataka, HTTrack je izvrstan alat za oba zadatka.

Grafičko sučelje s WebHTTrackom
WebHTTrack je grafičko sučelje za httrack koje se koristi iz web preglednika te dopušta kopije cijelih web stranica za offline pristup i automatski mijenja veze. Alati poput WebHTTrack -a mogu vam pomoći i dopustiti ažuriranje kopije bez da se morate sjetiti parametara za preuzimanje ili kopiranje web stranice i njezinog sadržaja. Možemo ga instalirati naredbom:

 sudo apt-get install webhttrack
Zatim do pokreni ga napisat ćemo istu naredbu:
 webhttrack
Do pokrenite grafičko sučelje, možemo izravno proći kroz izbornik aplikacija i tražimo aplikaciju Browse Mirrored Websites.

Druga je mogućnost jednostavno, kao što smo već rekli iz prozora terminala, napišite naredbu webhttrack za pokretanje lokalnog web poslužitelja na portu 8080, zatim otvorimo preglednik uzimajući u obzir da nije u anonimnom ili privatnom načinu rada i u pregledniku upisujemo adresu localhost: 8080.

Ovo će nam pokazati grafičkog čarobnjaka koji će nam pomoći u radu s httrackom. Za početak ćemo morati konfigurirati jezik i kliknuti Dalje. Zatim ćemo konfigurirati Novi projekt. Prednost grafičkog sučelja je ta što možemo spremiti podatke preuzetih web stranica i parametre korištene u tekstualnoj datoteci.

Zatim ćemo dodijeliti web stranicu koju ćemo kopirati:

Zatim ćemo u Define options konfigurirati parametre i filtre putem čarobnjaka:

Zatim, nakon konfiguriranja filtera, na sljedećem zaslonu počet ćemo sa skeniranjem.

Nedostaci korištenja HttrackaKorištenje alata Httrack za izvođenje ove vrste skeniranja i preuzimanja s web stranice ima neke nedostatke, poput sljedećih:

  • Ne snima dinamički sadržaj ili skriptirane stranice.
  • Preuzimanje web stranica koje su prevelike ili s velikim datotekama mogu uzrokovati rušenje poslužitelja.
  • Ako koristimo httrack u previše istovremenih veza na istu web stranicu, mogli bismo usporiti poslužitelj ili ga isključiti iz usluge.

Vodič u kojem je napravljen kôd za praćenje veza mogao bi vas zanimati:

Pratite web veze s Pythonom

Je li vam se svidio i pomogao ovaj vodič?Autor možete nagraditi pritiskom na ovaj gumb kako biste mu dali pozitivan bod

Vi ćete pomoći u razvoju web stranice, dijeljenje stranicu sa svojim prijateljima

wave wave wave wave wave