„Pdfgrep“ PDF failų paieškos komandos „Linux“ terminalas

Operacinės sistemos yra pagrįstos komandinėmis eilutėmis, kurios mums siūlo daugybę galimybių išplėsti platinimo galimybes, galėdamos atlikti paieškas, administravimo veiksmus, palaikymą ir daug daugiau.

Būtent viena iš šių parinkčių yra susijusi su galimybe ieškoti tam tikrų tipų failų „Linux“ ir taip lengvai pasiekti jų turinį, todėl šiandien kalbėsime apie pdfgrep, kuris yra skirtas PDF failų paieškai.

Kas yra pdfgrep„Pdfgrep“ yra komandų eilutės įrankis, skirtas paprastam ir funkcionaliam teksto paieškai PDF rinkmenose, taupant laiką nuo prieigos prie kiekvieno failo ir teksto paieškos naudojant PDF įrankius.
Kai kurios jo savybės yra šios:

  • Suderinamas su „Grep“, mes galime vykdyti daug grep parametrų, tokių kaip -r, -i, -n arba -c.
  • Galimybė ieškoti teksto keliuose PDF failuose
  • Teminės spalvos, ši GNU Grep spalvų parinktis palaikoma ir įjungta pagal numatytuosius nustatymus.
  • Palaiko įprastų išraiškų naudojimą.
  • Nemokama programinė įranga

1. Įdiekite „Pdfgrep“ „Linux“

1 žingsnis
Šiuo atveju naudosime „Ubuntu“, kuriam pakanka vykdyti šią eilutę. Ten mes įvedame raidę S, kad sutiktume su paketų atsisiuntimu ir įdiegimu.

 sudo apt įdiegti pdfgrep

2 žingsnis
Kitos diegimo parinktys yra šios:

  • Atsisiųskite .TAR.GZ failą naudodami šią nuorodą.

3 žingsnis

  • Arba paleiskite šią komandą:
 git klonas https://gitlab.com/pdfgrep/pdfgrep.git
4 žingsnis
Tada eilės tvarka įveskite kiekvieną iš šių eilučių:
 ./configure padaryti sudo make install

2. „Linux“ naudokite „Pdfgrep“

1 žingsnis
Įdiegus pdfgrep, bus naudojama sintaksė:

 pdfgrep [PASIRINKIMAS …] PATTERN [FILE]
2 žingsnis
Kiekvienas iš elementų yra:
  • Parinktis: nurodo atributus, kuriuos galime pridėti, pavyzdžiui, paieškoje -i arba -atvejis, kurie ignoruoja didžiųjų ir mažųjų raidžių skirtumą tarp mūsų nurodyto šablono ir modelio, kuris turi atitikti failą.
  • Modelis: nurodo išplėstinę reguliariąją išraišką.
  • Failas: tai PDF failas, kuriame reikia atlikti paiešką.

3 žingsnis
Pradėsime nuo paprastos paieškos, pavyzdžiui, ieškosime žodžio „Solvetic“ faile „Solvetic.pdf“, tam vykdome šiuos veiksmus:

 pdfgrep Solvetic Solvetic.pdf

DIDELIS

4 žingsnis
Šiuo atveju šis terminas minėtame faile egzistuoja tik vieną kartą, tačiau dabar mes ieškosime termino „Windows“ oficialiame „Microsoft PDF“ faile ir tai bus rezultatas, kurį matysime:

DIDELIS

5 žingsnis
Matome, kad ieškomas žodis yra paryškintas, o tai palengvina jo vietą. Dabar, jei pridėsime parametrą -į, Bus galima pamatyti rezultatus su puslapio numeriu, kuriame buvo aptiktas šis terminas:

DIDELIS

6 žingsnis
Kitas variantas, kurį galime naudoti su pdfgrep, yra išvardyti PDF failą (-us), kuriame yra tam tikras terminas, todėl vykdome šiuos veiksmus:

 pdfgrep Solvetic * pdf
7 žingsnis
Tokiu būdu bus pateiktas PDF failas, kuriame yra terminas „Solvetic“:

DIDELIS

8 žingsnis
Jei norime atidaryti PDF failą, galime vykdyti šią komandą:

 xdg-open (failas.PDF)

DIDELIS

9 veiksmas
Bendros pdfgrep siūlomos parinktys yra šios:

-i, --ignore-caseNepaisykite didžiųjų ir mažųjų raidžių skirtumų tiek šaltinio, tiek įvesties rinkmenose.

-F,-fiksuotos stygosPATTERN interpretuoja kaip fiksuotų eilučių sąrašą, atskirtą naujomis eilutėmis.

-talpyklaNaudokite atvaizduoto teksto talpyklą, kad pagreitintumėte didelių failų veikimą.

-P, --perl-regexpPATTERN interpretuoja kaip su Perl suderinamą reguliariąją išraišką (PCRE).

-H,-su failo pavadinimuAtspausdinkite kiekvienos rungtynės failo pavadinimą.

-h, --no-filenameIšeina failo vardo priešdėlis.

-n, --puslapio numerisPrieš kiekvieną atitiktį nurodykite puslapio, kuriame buvo rastas paieškos terminas, numerį.

-c, -skaičiusSlopina įprastą išvestį ir vietoj to spausdina kiekvieno įvesties failo atitikčių skaičių.

-p, -puslapių skaičiusSpausdinkite atitikmenų skaičių puslapyje. Tai reiškia -n.

-SpalvaTai leidžia paryškinti failų pavadinimus, puslapių numerius ir atitinkamą tekstą su skirtingomis sekomis, kad jie būtų rodomi spalvotai terminale, kai kurios jo parinktys yra Visada, pakaušis arba automatinis.

-o,-tik atitikimasSpausdinkite tik atitinkančią eilutės dalį be jokio aplinkinio konteksto.

-r, -rekursyvusTai leidžia mums rekursyviai ieškoti visų failų (apribotų --include ir --exclude) kiekviename kataloge, vadovaudamiesi simbolinėmis nuorodomis, tik jei jie yra komandinėje eilutėje.

-R,-rekursinė nuorodaTas pats kaip -r, bet seka visas simbolines nuorodas.

-tyliai arba -qTai leidžia mums išeiti iš programos.

Šis pdfgrep tampa idealiu sprendimu dirbant su PDF failais „Linux“ aplinkoje.

wave wave wave wave wave