✅ „Python“ - nuotoliniai failai

Turinys

Python leidžia mums dirbti su nuotoliniais failais, galbūt tai neatrodo logiška, tačiau šiuo atveju nuotoliniai failai yra ne kas kita, kaip užklausos tinklalapiams iš mūsų „Python“ programos, to priežastis gali būti nuo užklausos iki REST žiniatinklio paslaugos kurie leidžia mums gauti vertybes pagal GET arba tiesiogiai užklausti puslapius ir manipuliuoti jų turiniu.

Norėdami tai pasiekti, naudosime kai kurias iš daugelio jos siūlomų bibliotekų Python darbui su tinklais, taip pašalinant technines kliūtis ir tik sutelkiant dėmesį į tai, kaip tai svarbu mūsų programavimo logikoje.

urllib ir urllib2
Šie du knygynai urllib Y urllib2 Jie leidžia mums pasiekti prieigą prie failų per tinklą taip, lyg jie būtų mūsų vietinėje aplinkoje, paprastu skambučiu į funkciją, tai gali mums padėti daugeliui dalykų, pavyzdžiui, kad galime naudotis žiniatinkliu ir jo turiniu mūsų programoje pateikti ataskaitas apie tai, ką galime rasti.

Šios dvi bibliotekos yra panašios, jų skirtumas yra tas urllib2 jis gali būti šiek tiek sudėtingesnis, kai mes galime naudoti užklausą be jokių papildomų pasekmių urllib, bet jei norime atlikti tam tikrą autentifikavimo procesą arba naudoti slapukus, tada urllib2 tai gali būti tinkamas pasirinkimas mūsų programai.

Kadangi teoriškai žinome, ko mums reikia ir kodėl mums to reikia, pažiūrėkime nedidelį kodo pavyzdį, kad mums būtų aišku, ką galime padaryti, šiame pavyzdyje ketiname atidaryti žiniatinklį iš savo programos, o paskui per įprastas išraiškas ketiname išgauti jo turinio nuorodą, kurią naudosime urllib:

 >>> iš urllib import urlopen >>> webpage = urlopen ('http://www.python.org') >>> importuoti iš naujo >>> text = webpage.read () >>> m = re.search ( „Mokomoji medžiaga“, tekstas, pakartotinis IGNORECASE) >>> m.group (1)

Mes einame žingsnis po žingsnio, pirmiausia iš importuojamos „urllib“ bibliotekos urlopenas, tada sukuriame kintamąjį, vadinamą tinklo puslapis kuris yra tas, kuriame bus rezultatas urlopenas Ką darysime oficialioje svetainėje Python, su šiuo jau importuojame re Norėdami dirbti su įprastomis išraiškomis, sakome, kad tekstas yra kintamasis, kuris turės puslapio turinį, mes ieškome naudodami įprastą išraišką ir galiausiai sugrupuojame rezultatą, kuris turėtų atspausdinti:

http://docs.python.org/

Tai dėka metodo urlopenasKą jūs darote, tai leidžia mums dirbti su tinklalapiu taip, tarsi tai būtų failo objektas, tokiu būdu mes galime pritaikyti daugelį funkcijų, kurias galime naudoti su tokio tipo objektais, net jei norime, kad galėtume atsisiųsti puslapį ir atlikite tai iš mūsų vietos labai lengvai, naudodami šį metodą urlretrieve taip:

 urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')

Vienintelis dalykas, kurį mes darome, yra kaip antrasis parametras perduoti kelią vietinėje aplinkoje, kur failas su puslapio kopija turėtų būti išsaugotas be didelių sunkumų.

Baigę šį vadovėlį, matome, kad atlikti sudėtingesnius darbus, pvz., Naudoti puslapius savo programose, yra gana paprasta, nes bibliotekos Python.

Ar jums patiko ir padėjo ši pamoka?Galite apdovanoti autorių paspausdami šį mygtuką, kad suteiktumėte jam teigiamą tašką