PDFファイルを画像ファイルに変換する

Python

環境

  • Windows 11
  • Python 3.10.0

手順

仮想環境作成

pipenv --python 3

pdf2imageインストール

A python (3.6+) module that wraps pdftoppm and pdftocairo to convert PDF to a PIL Image object

GitHub - Belval/pdf2image: A python module that wraps the pdftoppm utility to convert PDF to PIL Image object

PDFを画像にするモジュールであるpdf2imageを使います。

pipenv install pdf2image

公式のGitHubを確認するとWindowsユーザはpopplerを使う必要があるとのことです。
Popplerは、xpdf-3.0コードベースに基づくPDFレンダリングライブラリです。

いつもどおりscoopでインストールします。

scoop install poppler

PDFから画像へ変換

from pdf2image import convert_from_path

images = convert_from_path('./pdf/example.pdf') 
# <class 'list'>

for image in images:
    # <class 'PIL.PpmImagePlugin.PpmImageFile'>
    image.save('./img/example.jpeg', 'jpeg')

参考

PythonでPDFを画像ファイル(JPEG、PNG)に変換する方法 - ガンマソフト株式会社
https://gammasoft.jp/blog/convert-pdf-to-image-by-python/