Pdfgrep naredbe za pretraživanje PDF datoteka Linux terminal

Operacijski sustavi temelje se na naredbenim linijama koje nam nude više mogućnosti za povećanje distribucijskih mogućnosti tako što mogu izvršavati pretraživanja, administrativne radnje, podršku i još mnogo toga.

Upravo jedna od ovih opcija povezana je s mogućnošću pretraživanja određenih vrsta datoteka u Linuxu i na taj način lakim pristupom njihovom sadržaju, pa ćemo zato danas govoriti o pdfgrepu koji je usmjeren na traženje PDF datoteka.

Što je pdfgrepPdfgrep je pomoćni program za naredbeni redak za pretraživanje teksta u PDF datotekama na jednostavan i funkcionalan način, štedeći nam vrijeme od pristupa svakoj datoteci i traženja teksta pomoću PDF alata.
Neke od njegovih karakteristika su:

  • Kompatibilno s Grepom, možemo izvršiti mnoge parametre grep -a, poput -r, -i, -n ili -c.
  • Mogućnost pretraživanja teksta u više PDF datoteka
  • Istaknute boje, ova opcija boje GNU Grep podržana je i omogućena prema zadanim postavkama.
  • Podržava upotrebu regularnih izraza.
  • Besplatni softver

1. Instalirajte Pdfgrep na Linux

Korak 1
U ovom slučaju koristit ćemo Ubuntu za koji je dovoljno izvršiti sljedeći redak. Tamo unosimo slovo S kako bismo prihvatili preuzimanje i instaliranje paketa.

 sudo apt instalirajte pdfgrep

Korak 2
Ostale mogućnosti ugradnje su:

  • Preuzmite .TAR.GZ datoteku na sljedećoj poveznici.

Korak 3

  • Ili pokrenite sljedeću naredbu:
 git clone https://gitlab.com/pdfgrep/pdfgrep.git
Korak 4
Zatim unesite svaki od sljedećih redaka po njihovom redoslijedu:
 ./configure make sudo make install

2. Koristite Pdfgrep na Linuxu

Korak 1
Nakon što je pdfgrep instaliran, ovo će biti sintaksa za korištenje:

 pdfgrep [OPCIJA …] UZORAK [DATOTEKA]
Korak 2
Svaki od elemenata je:
  • Opcija: Označava atribute koje možemo dodati u pretraživanje, na primjer -i ili --ignore-case, koji zanemaruju razliku velikih i malih slova između uzorka koji smo naveli i onog koji mora odgovarati datoteci.
  • Uzorak: Označava prošireni regularni izraz.
  • Datoteka: To je PDF datoteka u kojoj se mora izvršiti pretraživanje.

Korak 3
Počet ćemo s jednostavnim pretraživanjem, na primjer, potražićemo riječ Solvetic u datoteci Solvetic.pdf, za to izvršavamo sljedeće:

 pdfgrep Solvetic Solvetic.pdf

POVEĆAJTE

Korak 4
U ovom slučaju ovaj izraz postoji samo jednom u spomenutoj datoteci, ali sada ćemo izraz Windows potražiti u službenoj Microsoft PDF datoteci i to će biti rezultat koji ćemo vidjeti:

POVEĆAJTE

Korak 5
Možemo vidjeti da je tražena riječ istaknuta što olakšava njezino mjesto. Sada, ako dodamo parametar -u, Moći će se vidjeti rezultati s brojem stranice na kojoj je otkriven ovaj pojam:

POVEĆAJTE

Korak 6
Druga mogućnost koju možemo koristiti s pdfgrep -om je popis PDF datoteka (datoteka) koje sadrže određeni izraz, za to izvršavamo sljedeće:

 pdfgrep Solvetic * pdf
Korak 7
Na ovaj će način biti navedena PDF datoteka koja sadrži izraz Solvetic:

POVEĆAJTE

Korak 8
Ako želimo otvoriti PDF datoteku, možemo izvršiti sljedeću naredbu:

 xdg-open (File.PDF)

POVEĆAJTE

Korak 9
Opće mogućnosti koje nam nudi pdfgrep su:

-i, --ignore-caseZanemarite razliku velikih i malih slova u izvornim i ulaznim datotekama.

-F, --fiksirani nizoviTumači PATTERN kao popis fiksnih nizova odvojenih novim retcima.

--cacheKoristite predmemoriju za iscrtani tekst kako biste ubrzali rad na velikim datotekama.

-P, --perl-regexpTumači PATTERN kao Perl-kompatibilan regularni izraz (PCRE).

-H, --with-filenameIspišite naziv datoteke za svako podudaranje.

-h, --no-filenamePotiskuje prefiks naziva datoteke u ispisu.

-n, --page-numberSvakom podudaranju pridodajte broj stranice na kojoj je pronađen pojam za pretraživanje.

-c, --countPotiskuje normalni ispis i umjesto toga ispisuje broj podudaranja za svaku ulaznu datoteku.

-p, --broj stranicaIspišite broj podudaranja po stranici. Podrazumijeva -n.

--BojaOmogućuje isticanje naziva datoteka, brojeva stranica i odgovarajućeg teksta s različitim redoslijedom za njihovo prikazivanje u boji u terminalu, neke od njegovih opcija su Uvijek, s potilom ili automatsko.

-o, --samo-podudaranjeIspišite samo odgovarajući dio retka bez ikakvog okolnog konteksta.

-r, --rekurzivnoOmogućuje nam rekurzivno pretraživanje svih datoteka (ograničenih --include i --exclude) u svakom direktoriju, slijedeći simbolične veze samo ako su u naredbenom retku.

-R, --rekurzivno-referentnoIsto kao -r, ali slijedi sve simbolične veze.

-tiho ili -qOmogućuje nam izlazak iz aplikacije.

S ovim pdfgrep postaje idealno rješenje za rad s PDF datotekama u Linux okruženjima.

wave wave wave wave wave