Uredno u Pythonu

Sadržaj
The Struganje zaslona ili struganje zaslona, ​​omogućuje nam izdvajanje informacija s web stranice preuzimanjem navedene stranice i njihovom naknadnom obradom s programom; To je vrlo korisno, osobito kada su nam potrebne ažurirane informacije s web stranice koja ih nema API dostupni ili neki Web usluga.
Za provođenje a Struganje zaslona, jednostavno moramo preuzeti sadržaj i moći njime manipulirati kako bismo mogli izdvojiti ono što nas zanima, za to možemo upotrijebiti različite tehnike poput korištenja regularnih izraza ili si možda pomoći s drugim knjižnicama, kao što su Uredan, cist.
Što je Tidy?
Da biste mogli čitati a HTML Moramo vjerovati njegovoj strukturi, jer jer ne znamo točno koji sadržaj ima, barem znamo da ako tražimo strukture HTML nešto što možemo dobiti, međutim, nije uvijek to HTML dobro je oblikovan, bilo zbog greške u izostavljanju, bilo zato što programer zna da neki preglednici nastoje interpretirati HTML čak i ako postoje nedostaci.
U ovom trenutku dolazi do izražaja Uredan, cist, koji nije ništa više od alata koji nam omogućuje popravak pogrešno oblikovanog HTML -a, vrlo se može konfigurirati i omogućuje nam da prilagodimo način na koji bi trebao tumačiti ispravke koje može napraviti, na ovaj ćemo način sa sigurnošću znati koju vrstu dokumenta rezultirat će na kraju.
Pogledajmo prvo sliku koda HTML Uz mnogo pogrešaka, ovaj preglednik mogu interpretirati neki preglednici, međutim to nije ispravan kôd u njegovom oblikovanju:

Kao što vidimo, svaki redak praktički ima pogrešku, najčešći je zatvaranje oznaka, zatim vidimo oznake koje se zatvaraju na pogrešnom mjestu itd.
Zatim koristimo Uredan, cist i da vidimo kod već ispravljen, tamo ćemo shvatiti koliko je ova knjižnica važna i svu pomoć koju nam može pružiti:

Na slici vidimo kako je to ispravljeno Uredan, cist, moramo napomenuti da, iako je Tidy velika knjižnica, vjerojatno ne može riješiti sve pogreške HTMLMeđutim, puno nam pomaže kada je u pitanju izgradnja dobro oblikovanog HTML-a.
Uredite se
Postoji nekoliko načina za dobivanje usluge Tidy putem službene stranice http: / /tidy.sf.net. možemo nabaviti knjižnicu, međutim u tom izvoru nema načina da je integriramo Piton pa moramo pribjeći alternativnom izvoru, za to imamo dvije mogućnosti: uTidy dostupno na http: / /utidylib.berlios.de i mxTidy dostupno na http://egenix.com/files/python/mxTidy.html, čini se da je uTidy najnoviji od ova dva, ali mxTidy je malo lakše instalirati, na svima je da vide koji koristiti.
Pogledajmo primjer kako se koristi Uredan, cist Nakon što ga instaliramo, u sljedećem kodu ćemo otvoriti HTML s pogreškama i pročitati ga koristeći Tidy, a zatim ćemo prikazati informacije na ekranu.
 iz uvoza potprocesa Popen, PIPE text = open ('messy.html'). read () tidy = Popen ('tidy', stdin = PIPE, stdout = PIPE, stderr = PIPE) tidy.stdin.write (text) uredno. stdin.close () ispisati uredno.stdout.read () 

Kao što vidimo, vrlo je jednostavan za korištenje Uredan, cistKad imamo dovoljno povjerenja u nju ako dobro poznajemo ponašanje knjižnice, možemo postići vrlo zanimljive stvari.Je li vam se svidio i pomogao ovaj vodič?Autor možete nagraditi pritiskom na ovaj gumb kako biste mu dali pozitivan bod

Vi ćete pomoći u razvoju web stranice, dijeljenje stranicu sa svojim prijateljima

wave wave wave wave wave