Operacijski sustavi temelje se na naredbenim linijama koje nam nude više mogućnosti za povećanje distribucijskih mogućnosti tako što mogu izvršavati pretraživanja, administrativne radnje, podršku i još mnogo toga.
Upravo jedna od ovih opcija povezana je s mogućnošću pretraživanja određenih vrsta datoteka u Linuxu i na taj način lakim pristupom njihovom sadržaju, pa ćemo zato danas govoriti o pdfgrepu koji je usmjeren na traženje PDF datoteka.
Što je pdfgrepPdfgrep je pomoćni program za naredbeni redak za pretraživanje teksta u PDF datotekama na jednostavan i funkcionalan način, štedeći nam vrijeme od pristupa svakoj datoteci i traženja teksta pomoću PDF alata.
Neke od njegovih karakteristika su:
- Kompatibilno s Grepom, možemo izvršiti mnoge parametre grep -a, poput -r, -i, -n ili -c.
- Mogućnost pretraživanja teksta u više PDF datoteka
- Istaknute boje, ova opcija boje GNU Grep podržana je i omogućena prema zadanim postavkama.
- Podržava upotrebu regularnih izraza.
- Besplatni softver
1. Instalirajte Pdfgrep na Linux
Korak 1
U ovom slučaju koristit ćemo Ubuntu za koji je dovoljno izvršiti sljedeći redak. Tamo unosimo slovo S kako bismo prihvatili preuzimanje i instaliranje paketa.
sudo apt instalirajte pdfgrep
Korak 2
Ostale mogućnosti ugradnje su:
- Preuzmite .TAR.GZ datoteku na sljedećoj poveznici.
Korak 3
- Ili pokrenite sljedeću naredbu:
git clone https://gitlab.com/pdfgrep/pdfgrep.gitKorak 4
Zatim unesite svaki od sljedećih redaka po njihovom redoslijedu:
./configure make sudo make install
2. Koristite Pdfgrep na Linuxu
Korak 1
Nakon što je pdfgrep instaliran, ovo će biti sintaksa za korištenje:
pdfgrep [OPCIJA …] UZORAK [DATOTEKA]Korak 2
Svaki od elemenata je:
- Opcija: Označava atribute koje možemo dodati u pretraživanje, na primjer -i ili --ignore-case, koji zanemaruju razliku velikih i malih slova između uzorka koji smo naveli i onog koji mora odgovarati datoteci.
- Uzorak: Označava prošireni regularni izraz.
- Datoteka: To je PDF datoteka u kojoj se mora izvršiti pretraživanje.
Korak 3
Počet ćemo s jednostavnim pretraživanjem, na primjer, potražićemo riječ Solvetic u datoteci Solvetic.pdf, za to izvršavamo sljedeće:
pdfgrep Solvetic Solvetic.pdf
POVEĆAJTE
Korak 4
U ovom slučaju ovaj izraz postoji samo jednom u spomenutoj datoteci, ali sada ćemo izraz Windows potražiti u službenoj Microsoft PDF datoteci i to će biti rezultat koji ćemo vidjeti:
POVEĆAJTE
Korak 5
Možemo vidjeti da je tražena riječ istaknuta što olakšava njezino mjesto. Sada, ako dodamo parametar -u, Moći će se vidjeti rezultati s brojem stranice na kojoj je otkriven ovaj pojam:
POVEĆAJTE
Korak 6
Druga mogućnost koju možemo koristiti s pdfgrep -om je popis PDF datoteka (datoteka) koje sadrže određeni izraz, za to izvršavamo sljedeće:
pdfgrep Solvetic * pdfKorak 7
Na ovaj će način biti navedena PDF datoteka koja sadrži izraz Solvetic:
POVEĆAJTE
Korak 8
Ako želimo otvoriti PDF datoteku, možemo izvršiti sljedeću naredbu:
xdg-open (File.PDF)
POVEĆAJTE
Korak 9
Opće mogućnosti koje nam nudi pdfgrep su:
-i, --ignore-caseZanemarite razliku velikih i malih slova u izvornim i ulaznim datotekama.
-F, --fiksirani nizoviTumači PATTERN kao popis fiksnih nizova odvojenih novim retcima.
--cacheKoristite predmemoriju za iscrtani tekst kako biste ubrzali rad na velikim datotekama.
-P, --perl-regexpTumači PATTERN kao Perl-kompatibilan regularni izraz (PCRE).
-H, --with-filenameIspišite naziv datoteke za svako podudaranje.
-h, --no-filenamePotiskuje prefiks naziva datoteke u ispisu.
-n, --page-numberSvakom podudaranju pridodajte broj stranice na kojoj je pronađen pojam za pretraživanje.
-c, --countPotiskuje normalni ispis i umjesto toga ispisuje broj podudaranja za svaku ulaznu datoteku.
-p, --broj stranicaIspišite broj podudaranja po stranici. Podrazumijeva -n.
--BojaOmogućuje isticanje naziva datoteka, brojeva stranica i odgovarajućeg teksta s različitim redoslijedom za njihovo prikazivanje u boji u terminalu, neke od njegovih opcija su Uvijek, s potilom ili automatsko.
-o, --samo-podudaranjeIspišite samo odgovarajući dio retka bez ikakvog okolnog konteksta.
-r, --rekurzivnoOmogućuje nam rekurzivno pretraživanje svih datoteka (ograničenih --include i --exclude) u svakom direktoriju, slijedeći simbolične veze samo ako su u naredbenom retku.
-R, --rekurzivno-referentnoIsto kao -r, ali slijedi sve simbolične veze.
-tiho ili -qOmogućuje nam izlazak iz aplikacije.
S ovim pdfgrep postaje idealno rješenje za rad s PDF datotekama u Linux okruženjima.