Procesarea de fișiere PDF cu Python
PDF-Handling-With-Python este un proiect care își propune să ofere utilizatorilor o modalitate ușoară de a manipula fișiere PDF folosind Python. Proiectul prezintă o colecție de script-uri Python care pot fi utilizate pentru a efectua o varietate de operațiuni pe fișiere PDF.
Proiectul descrie diferite librării și exemple ce folosesc aceste librării pentru a lucra cu fișiere de tip PDF.
Workflowuri
- Extragerea de texte din PDF-uri
- Extragerea de tabele din PDF-uri
- Extragerea de URL-uri din PDF-uri
- Extragerea de pagini sub formă de imagini din PDF-uri
- Crearea de fișiere PDF
- Adăugarea de text într-un PDF
- Adăugarea de tabele într-un PDF
- Adăugarea de imagini într-un PDF
- Evidențierea unor porțiuni de text
- Crearea și completarea de formulare
- Adăugarea de watermark-uri
- Schimbarea dimensiunii unui PDF
- Lucru cu metadatele unui PDF
Exemplu de adăugare a unui text într-un PDF
from reportlab.lib.pagesizes import LETTER
from reportlab.lib.units import inch
from reportlab.pdfgen.canvas import Canvas
from reportlab.lib.colors import red
# creating the pdf file
canvas = Canvas("text_file.pdf", pagesize=LETTER)
# setting up the font and the font size
canvas.setFont("Courier", 16)
# setting up the color of the font as red
canvas.setFillColor(red)
# writing this text on the PDF file
canvas.drawString(2 * inch, 8 * inch, "This is a newly created Python PDF.")
canvas.save()
Mai multe informații cât și bucăți de cod găsiți în repo-ul de pe Github
Succes!