Kaip klonuoti bet kurią svetainę naudojant „HTTrack“

Turinys

„HTTrack“ yra nemokama ir nemokama daugiaplatformė programinė įranga, kurios tikslas yra fiksuoti žiniatinklį, tai yra, visa svetainė arba jos dalis yra atsisiunčiama, kad vėliau būtų galima naršyti neprisijungus. Yra „Linux“ versija, vadinama WebHTTrack, ir vadinama jos versija, skirta „Windows“ „WinHTTrack“. „HTTrack“ programinę įrangą galime atsisiųsti iš oficialios svetainės:

„Linux“ atveju taip pat galime ją įdiegti iš saugyklų naudodami šią komandą.

 sudo apt-get įdiegti httrack

Ši programinė įranga jis dažnai naudojamas svetainėms kopijuoti tada įkelkite juos į kitą serverį ir naudokite juos, kad nukreiptumėte srautą į kopijavimo puslapį, nukreipdami lankytojus į suklastotą puslapį. Ja taip pat naudojasi tie, kurie nori matyti kodą ar tam tikros svetainės veikimą. Pažvelkime į pavyzdį su svetaine httrack.com, kurioje yra programa.

 httrack "httrack.com"
Ši komanda atsisiųs failus iš žiniatinklio į aplanką www.httrack.com, kurią galime pamatyti vietoje.

„HTTrack“ užima bet kurią svetainę ir daro kopiją aplanke ar diske, kuriame esame. Tai gali būti naudinga ieškant duomenų svetainėje neprisijungus, pvz., El. Pašto adresų, naudingos informacijos SEO ar svetainės struktūros. „HTTrack“ yra tiek „Windows“, tiek „Linux“ versijoje, o naudojimas yra toks pat, kaip „Windows“, kuriame yra vizualinis ryšys.

Mes galime naudokite „Httrack“ skverbties ir saugumo bandymams, nes kurdama svetainės kopiją ji leidžia išanalizuoti visą turinį ir atsisiųstus failus ir nustatyti, kad užpuolikas nemato jokio kritinio failo. Kai renkame duomenis ir informaciją, galime atlikti bandymus, ieškoti ir analizuoti kodą ar raktinius žodžius, taip pat galime rinkti duomenis, kuriuos vėliau galima panaudoti.

Taip pat tokiu būdu lįsilaužėliai naudoja padarytas kopijas, kad įkeltų jį į serverį su žiniatinkliui panašiu domenu, nukopijuotu, kad imituotų svetaines ir panaudotų jas sukčiaudamas, kad pavogtų duomenis iš nieko neįtariančių vartotojų arba vykdytų socialinės inžinerijos atakas. „Httrack“ turi daug parinkčių ir parametrų, kuriuos reikia naudoti norint pagerinti atsisiuntimą, todėl naudojama ši komanda:

 httrack -pagalba

Kai kurie svarbūs parametrai, kuriuos galime naudoti su „Httrack“ įrankiu, yra šie:

  • -m: nurodo, pavyzdžiui, maksimalų failo dydį baitais, kuriuos reikia atsisiųsti -200 000 000 atitinka 20 mb.
  • -mimikas: naudojamas atsisiųsti tik tam tikro tipo failus, kuriuos nurodysime su plėtiniu, pavyzdžiui, naudodami komandą
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Naudoti „httrack“ paprasta, turime pridėti svetainės, kurią norime nukopijuoti, domeną ir tada pradėti nuskaitymą yra mūsų kietojo disko kataloge, kuriame ketiname saugoti svetainę. Turime atsižvelgti į tai, kiek nuorodų ar turinio gali turėti svetainė dėl atsisiunčiamos informacijos kiekio. Naršant žiniatinklio kopiją galima ieškoti trūkumų ir pažeidžiamumų, dėl kurių gali kilti pavojus naršymui, taip pat nustatyti, kurias dalis patogu užšifruoti ar padidinti saugumą.

Jei atsisiuntimo tikslas yra rasti informacijos apie įmonę arba naudotojų sąrašus, telefonus ar kitus duomenis, ypač socialinės inžinerijos tikslais arba bandant suklastoti svetainę ar prisijungimo duomenis, norint gauti vartotojo duomenis, „HTTrack“ yra puiki priemonė abiem užduotims atlikti.

Grafinė sąsaja su „WebHTTrack“
„WebHTTrack“ yra grafinė „httrack“ sąsaja, naudojama iš žiniatinklio naršyklės ir leidžia ištisų svetainių kopijas pasiekti neprisijungus ir automatiškai keičia nuorodas. Įrankiai, tokie kaip „WebHTTrack“, gali padėti ir leisti atnaujinti kopiją, neprisimenant svetainės ir jos turinio atsisiuntimo ar kopijavimo parametrų. Mes galime jį įdiegti naudodami komandą:

 sudo apt-get install webhttrack
Tada į paleisti parašysime tą pačią komandą:
 žiniatinklio takelis
Į paleiskite grafinę sąsają, galime eiti tiesiai per programų meniu ir mes ieškome programos „Naršyti veidrodines svetaines“.

Kitas variantas - kaip jau minėjome anksčiau iš terminalo lango, parašykite komandą „webhttrack“, kad paleistumėte vietinį žiniatinklio serverį 8080 prievade, tada atidarome naršyklę, atsižvelgdami į tai, kad ji nėra inkognito ar privataus režimo ir naršyklėje įrašome adresą localhost: 8080.

Tai parodys mums grafinį vedlį, kuris padės mums dirbti su „httrack“, norėdami pradėti, turėsime sukonfigūruoti kalbą ir spustelėti „Kitas“. Toliau sukonfigūruosime naują projektą. Grafinės sąsajos pranašumas yra tas, kad galime išsaugoti atsisiųstų svetainių duomenis ir parametrus, naudojamus teksto faile.

Toliau priskiriame svetainę, kurią ketiname kopijuoti:

Tada skiltyje „Apibrėžti parinktis“ sukonfigūruosime parametrus ir filtrus per vedlį:

Tada sukonfigūravę filtrus, kitame ekrane pradėsime nuo nuskaitymo.

„Httrack“ naudojimo trūkumai„Httrack“ įrankio naudojimas tokio tipo nuskaitymui ir atsisiuntimui iš svetainės turi tam tikrų trūkumų, pavyzdžiui:

  • Jis nefiksuoja dinamiško turinio ar scenarijaus puslapių.
  • Atsisiuntus per dideles svetaines ar didelius failus, serveris gali sugesti.
  • Jei mes naudojame „httrack“ per daug vienu metu prisijungiančių prie tos pačios svetainės, galime sulėtinti serverio veikimą arba jį sustabdyti.

Pamoka, kurioje yra sukurtas kodas nuorodoms stebėti, gali jus sudominti:

Stebėkite žiniatinklio nuorodas naudodami „Python“

Ar jums patiko ir padėjo ši pamoka?Galite apdovanoti autorių paspausdami šį mygtuką, kad suteiktumėte jam teigiamą tašką

Padėsite svetainės plėtrą, dalintis puslapį su draugais

wave wave wave wave wave