von Marion Tramer

Tabellen aus PDF-Dokumenten in anderen Programmen verwenden

Es kommt in der Praxis oft vor, dass Originaldateien nicht mehr vorhanden sind und nur noch Inhalte aus PDF-Dokumenten zur Weiterverarbeitung genutzt werden können. Dazu gehören auch Datentabellen. Wie kann man diese ohne Datenverlust aus einem PDF in die Excel importieren?

Gibt es ein Programm, mit dem ich PDF-Dateien in eine Excel-Datei umwandeln kann?

Inhalte aus PDF-Dokument in anderen Programmen verarbeiten

Sehr häufig wird die Frage gestellt: Gibt es ein Programm, mit dem ich ein PDF-Dokument in eine Excel-Tabelle konvertieren kann oder Tabellen aus einem PDF in eine andere Anwendung kopieren kann? Diese Frage wird oft von Anwendern gestellt, die Texte aus vorhandenen PDF-Dokumenten in anderen Programmen weiterverarbeiten sollen, wenn z. B. die Originaldatei, aus der das PDF-Dokument erzeugt wurde, nicht mehr vorhanden ist, oder aber der Fragesteller will die Daten einfach in Excel bearbeiten und korrigieren können, ohne dass er den Text erneut abtippen muss.

Acrobat XI Pro kann PDF-Dokument als Excel- Arbeitsmappe speichern

Die Antwort auf die Frage lautet: Ja. Und das Beste dabei ist, dass die Anwender, die bereits mit Acrobat XI Pro arbeiten, gar kein neues Programm kaufen müssen, denn sie haben ja schon das entsprechende Programm auf der Arbeitsstation installiert. Nämlich Acrobat XI Pro. Schon seit vielen Versionen ist Acrobat in der Lage, ein PDF-Dokument in ein Excel-Dokument zu konvertieren. War das Ergebnis in früheren Versionen nicht gerade zufriedenstellend, so wurde es von Version zu Version immer wieder verbessert, bis es heute – mit der aktuellen Version XI – sehr gute und brauchbare Ergebnisse liefert.

Wie kann ich eine Tabelle aus einem PDF- Dokument in eine Excel-Arbeitsmappe oder in ein InDesign-Dokument kopieren?

Alle Seiten einer PDF-Datei werden ins Zielformat gespeichert

Wenn Sie in Acrobat den Befehl zum Speichern einer PDF-Datei als Microsoft Excel-Arbeitsmappe aufrufen, werden immer alle Seiten des aktuell geöffneten PDF in die Zieldatei gespeichert. Aber nicht immer muss der gesamte Inhalt eines PDF-Dokuments in eine Excel-Datei gespeichert werden. In den meisten Fällen handelt es sich nur um eine Tabelle, die zur weiteren Bearbeitung benötigt wird. Acrobat bietet dem Anwender die Möglichkeit, einzelne Bereiche in einem PDF zu markieren und zu konvertieren.

Datenaustausch über Kopieren und Einfügen

Beim Kopieren von Texten oder Tabellen in einem PDF-Dokument kommt es darauf an, wie die Daten in Acrobat in den Arbeitsspeicher kopiert werden. Die meisten Acrobat-Anwender kennen und nutzen die Möglichkeit, Text in einem PDF-Dokument mit dem Auswahlwerkzeug für Text und Bilder in Acrobat XI Pro zu markieren, ihn zu kopieren und über die Zwischenablage in ein anderes weiterverarbeitendes Programm einzufügen.

Texte/Tabellen richtig markieren

Allerdings kann das Aktivieren bestimmter Bereiche in Acrobat, wie in unserem Beispieldokument, schon zur Herausforderung werden. Wenn Sie beispielsweise versuchen, die Tabelle einfach zu markieren, indem Sie bei ausgewähltem Auswahlwerkzeug für Text und Bilder über den Text fahren, um ihn zu markieren, werden Sie schnell merken, dass gleichzeitig auch der umgebende Text mitmarkiert wird.

Wird Text mit dem »Auswahlwerkzeug für Text und Bilder« markiert, indem mit gedrückter Maustaste über den zu aktivierenden Text gefahren wird, werden häu?g auch Bereiche markiert, die nicht benötigt werden.

pdf-acrobat-02-tabellen_01

Text mit gedrückter Alt-Taste markieren

Um nur einen bestimmten Bereich zu markieren, drücken Sie bei ausgewähltem Auswahlwerkzeug für Text und Bilder die Alt-Taste und ziehen ein Auswahlrechteck um den zu markierenden Bereich.

Wenn die »Alt-Taste« gedrückt wird, ändert sich das Symbol der Einfügemarke. Nun kann der zu aktivierende Bereich einfach mit einem Auswahlrechteck markiert werden. Es werden dann nur Objekte aktiviert, die sich im Auswahlrechteck befinden.

pdf-acrobat-02-tabellen_02

Um den markierten Bereich in die Zwischenablage zu kopieren und dann in ein anderes Programm einzufügen, wählen Sie den Menübefehl Bearbeiten → Kopieren .

Texte können in einem PDF-Dokument kopiert und in ein anderes Programm eingefügt werden.

pdf-acrobat-02-tabellen_03

Beim Einfügen gehen alle Formatierungen und die Tabellenanordnung verloren

Werden die kopierten Texte beispielsweise in Adobe InDesign in einen Textrahmen eingefügt, gehen dabei jegliche Formatierungsinformationen und die ursprüngliche Tabellenstruktur verloren. Jede Zeile wird mit einem Zeilenende abgeschlossen, sodass diese vor der eigentlichen Weiterverarbeitung erst einmal wieder gelöscht werden müssen. Wird der Inhalt in eine Excel-Arbeitsmappe eingefügt, wird dort ebenfalls die Tabellenstruktur ignoriert und jede Tabellenzelle wird in der ersten Spalte in eine separate Zelle eingefügt.

pdf-acrobat-02-tabellen_04

Wird Text aus einem PDF-Dokument in ein anderes Programm eingefügt, werden die einzelnen Zeilen mit einer Zeilenschaltung abgeschlossen und die Originalformatierungen gehen beim Einfügen verloren.

Text mit Formatierungen kopieren

Hinweis
Das Kontextmenü erhalten Sie, indem Sie die rechte Maustaste drücken. Macintosh-Anwender, die mit einer Eintastenmaus arbeiten, drücken die CTRL-TASTE, um das Kontextmenü einzublenden.

Doch was viele Acrobat-Anwender nicht wissen, ist, dass Acrobat XI Pro über einen Befehl verfügt, mit dem sie Texte mitsamt den Tabellenformatierungen kopieren und in ein Excel-Arbeitsblatt oder InDesign-Dokument einfügen können.

1. Dazu markieren Sie den zu kopierenden Text in Acrobat wie gewohnt mit dem Auswahlwerkzeug für Text und Bilder. Anstatt des Menübefehls Bearbeiten → Kopieren oder des entsprechenden Tastaturbefehls wählen Sie den Befehl »Mit Formatierung kopieren« aus dem Kontextmenü.

Der Befehl zum Kopieren von markierten Texten/Tabellen kann über das Kontextmenü gewählt werden.

pdf-acrobat-02-tabellen_05

Aus der Zwischenablage einfügen

2. Wenn Sie den Text aus der Zwischenablage danach in eine Excel-Arbeitsmappe einfügen, wird der Text mit der ursprünglichen Tabellenstruktur übernommen. Wird der auf diese Weise kopierte Text in ein InDesign-Dokument eingefügt, wird daraus zwar noch keine InDesign-Tabelle, doch werden die einzelnen Spalten nun durch einen Tabellensprung voneinander getrennt, sodass daraus über den entsprechenden Befehl sehr leicht eine Tabelle generiert werden kann. Mit diesem Befehl werden – anders als beim Einfügen in ein Microsoft-Word-Dokument –, werden die Schrifteninformationen nicht kopiert und deshalb beim Einfügen in ein anderes Programm die jeweilige Standardschrift verwendet.

pdf-acrobat-02-tabellen_06

Wird Text über den Befehl »Mit Formatierung kopieren« aus einem PDF-Dokument in die Zwischenablage kopiert und anschließend in ein Microsoft-Word-Dokument eingefügt, werden die Formatierungen übernommen und der Text wird fortlaufend eingefügt.

QuarkXPress

Verwenden Sie den Befehl auch, wenn Sie eine Tabelle in einem PDF-Dokument kopieren und in QuarkXPress verwenden möchten, damit die Tabelle zeilenweise übernommen wird und die einzelnen Spalten durch einen Tabulator voneinander getrennt werden.

Ausgewählten Inhalt als Excel-Dokument speichern

Konvertierung in Excel-Dokument

Mit Acrobat XI Pro besteht nicht nur die Möglichkeit, einzelne Bereiche zu markieren, zu kopieren und in eine Excel-Arbeitsmappe einzufügen. Acrobat bietet dem Anwender auch die Möglichkeit, einzelne Bereiche in einem PDF zu markieren und in ein Excel-Dokument zu konvertieren.

Wenn Sie in Acrobat XI Pro Text auswählen und in ein Word-Dokument konvertieren möchten, kommt es darauf an, wie Sie die Inhalte im PDF-Dokument aktiviert haben.

Art der Textmarkierung

1. Um einen beliebigen Text auf der Seite auszuwählen, wählen Sie das Auswahlwerkzeug für Text und Bilder aus der Werkzeugleiste und markieren den zu exportierenden Bereich.

  • Ziehen Sie mit dem Auswahlwerkzeug für Text und Bilder über den Bereich, den Sie exportieren möchten, und halten Sie dabei die Alt-Taste gedrückt, damit Sie ein Auswahlrechteck erhalten.
  • Ziehen Sie mit dem Auswahlwerkzeug für Text und Bilder bei gleichzeitig gedrückter Befehlstaste (Macintosh) bzw. Strg-Taste (Windows) ein Rechteck um die zu exportierenden Zeilen und Spalten auf.

pdf-acrobat-02-tabellen_07

Erfolgt die Markierung durch das Markieren von Text, werden die einzelnen Texte nach dem Loslassen der Maustaste durch ein blau-transparentes Rechteck gekennzeichnet. Erfolgt die Markierung durch ein Auswahlrechteck, wird nach dem Loslassen der Maustaste der markierte Bereich durch ein blau-transparentes Rechteck gekennzeichnet.

2. Nachdem Sie die Auswahl festgelegt haben, klicken Sie mit der Maus auf die Auswahl und wählen den entsprechenden Befehl aus dem Kontextmenü.

Kontextmenü auf Markierung

Wenn Sie das Kontextmenü auf einer Markierung öffnen, wählen Sie den Befehl Auswahl exportieren als und im gleichnamigen Fenster den Speicherort sowie das Speicherformat aus und tragen den Dateinamen ein. Um die Auswahl in ein Excel-Dokument zu speichern, wählen Sie die Option Excel-Arbeitsmappe aus dem Einblendmenü Format. Weitere Einstellungen zum Export können nicht definiert werden.

pdf-acrobat-02-tabellen_08

Wird das Kontextmenü auf einer Markierung geöffnet, enthält es mehrere Befehle. Über den Befehl »Auswahl exportieren als« kann die Markierung z. B. als Excel-Tabelle gespeichert werden.

Wenn Sie dagegen das Kontextmenü auf einem Auswahlrechteck öffnen, enthält es lediglich drei Befehle zur Auswahl. Wählen Sie ebenfalls den Befehl »Auswahl exportieren als«. Im gleichnamigen Fenster legen Sie den Speicherort und das Speicherformat fest und tragen den Dateinamen ein. Wenn Sie die Auswahl auf diese Weise exportieren, können Sie für das ausgewählte Speicherformat weitere Einstellungen vornehmen, indem Sie auf den Schalter »Einstellungen« klicken. Die Einstellungen hier entsprechen den Einstellungen wie zum Speichern einer PDF-Datei als Word- Dokument.

pdf-acrobat-02-tabellen_09

Wird das Kontextmenü auf einem Auswahlrechteck geöffnet, enthält es nur drei Befehle. Über den Befehl »Auswahl exportieren als« kann die Markierung z. B. als Excel-Arbeitsmappe gespeichert werden.

3. Nach dem Export können Sie die Datei direkt in Microsoft Excel öffnen und das Ergebnis kontrollieren. Im Gegensatz zum Kopieren und Einfügen in ein Excel-Arbeitsblatt wurde beim Export die Textund Zellenformatierung mit übernommen.

pdf-acrobat-02-tabellen_10

Die Tabelle wurde mitsamt der Textund Zellenformatierung in die Excel-Arbeitsmappe exportiert.

Wie kann ich ein PDF-Dokument in ein Excel- Dokument konvertieren?

Austausch mit Microsoft Excel

Über den Menübefehl Datei  Speichern als finden Sie im Untermenü Arbeitsblatt den Befehl, mit dem Sie ein komplettes PDF als Microsoft Excel- Arbeitsmappe oder XML-Tabellenkalkulation 2003 speichern können. Hierbei werden die Textformatierungen, wie z. B. Schriftart, -größe und -stil, so gut es eben geht mit in das Zieldokument übernommen. Enthält die PDF-Datei Fließtext, wird dieser zeilenweise in einzelne Tabellenzeilen gespeichert. Verwenden Sie die Funktion, um ein ganzes PDF-Dokument in ein Excel-Dokument zu konvertieren, wenn das PDF mehrseitige Tabellen beinhaltet.

Als Arbeitsmappe speichern

1. Möchten Sie ein PDF-Dokument als Microsoft-Excel-Datei speichern, wählen Sie den Menübefehl Datei  Speichern als Arbeitsmappe und den entsprechenden Befehl aus dem Untermenü. Wenn Sie das Aufgabenfenster Werkzeuge einblenden, stehen Ihnen die Befehle zum Exportieren einer PDF-Datei als Excel-Arbeitsmappe oder XML-Tabellenkalkulation 2003 auch über die Werkzeuggruppe Inhaltsbearbeitung über das Einblendmenü Datei exportieren nach zur Verfügung.

pdf-acrobat-02-tabellen_12

Über das Menü »Datei« stehen die Befehle zur Verfügung, mit denen ein PDF-Dokument als Microsoft-Excel-Dokument gespeichert werden kann.
Hinweis
Haben Sie beim »Speichern als« versehentlich das falsche Dateiformat ausgewählt, können Sie über das Einblendmenü »Format« das Speicherformat nachträglich ändern.

Abhängig von der Excel-Version, mit der die Datei später weiterverarbeitet werden soll, wählen Sie im Untermenü die Option Microsoft Excel-Arbeitsmappe, wenn Sie ein xlsx-Dokument erstellen möchten, das nur mit ein Microsoft-Of?ce-Excel-Version 10 oder höher geöffnet werden kann. Soll das Dokument auch in einer früheren Version von Microsoft Excel zu öffnen sein, wählen Sie die Option XML-Tabellenkalkulation 2003.

2. Um die Einstellungen festzulegen, wie das Excel-Dokument gespeichert werden soll, klicken Sie im Fenster Speichern unter auf den Schalter Einstellungen .

Im Fenster »Speichern unter« kann das Dateiformat nachträglich geändert werden. Um die Speichereinstellungen festzulegen, klicken Sie auf den Schalter »Einstellungen«.

pdf-acrobat-02-tabellen_13

3. Die Einstellungen zum Speichern als Microsoft Excel-Arbeitsmappe und als XML-Tabellenkalkulation 2003 sind identisch. Die resultierende Excel- Datei unterscheidet sich lediglich im Dateiformat und in der Version, mit der das exportierte Dokument später geöffnet werden kann.

Die Einstellungen zum Speichern als XLSX-Dokument oder als XML-Kalkulationstabelle sind identisch. 

pdf-acrobat-02-tabellen_14

Einstellungen für Excel-Arbeitsmappen

Im Bereich »Einstellungen für Excel- Arbeitsmappen« aktivieren Sie die Option »Einzelne Arbeitsmappe für das Dokument erstellen«, wenn die einzelnen Seiten des PDF-Dokuments fortlaufend in einer Arbeitsmappe angehängt werden sollen. Wenn Sie die Option »Arbeitsmappe für jede Seite erstellen« aktivieren, wird für jede Seite im PDF eine neue Arbeitsmappe im Excel-Dokument erstellt.

Numerische Einstellungen

Im Bereich »Numerische Einstellungen« legen Sie das Format für Dezimal- und Tausendertrennzeichen für numerische Daten fest. Sie können die »Dezimal- und Tausendertrennzeichen aus Regionseinstellungen abrufen«, die auf Ihrer Arbeitsstation gespeichert sind, oder die Trennzeichen in den entsprechenden Feldern eintragen, wenn Sie die Option Folgende Dezimalund Trennzeichen verwenden aktivieren.

OCR ausführen

Enthält ein PDF-Dokument gescannte Texte, können diese als Bild oder als bearbeitbare Texte gespeichert werden. Wenn Sie die Texte beim Speichern als Excel-Dokument gleichzeitig in bearbeitbaren Text konvertieren möchten, aktivieren Sie die Option »Gegebenenfalls OCR ausführen« im Bereich »OCR-Einstellungen«. Um die OCR-Sprache auszuwählen, klicken Sie auf den Schalter »Sprache festlegen«.

Wird gescannter Text gleichzeitig in bearbeitbaren Text umgewandelt, muss die Sprache für die Umwandlung festgelegt werden.

pdf-acrobat-02-tabellen_16

4. Um das Dokument zu speichern, klicken Sie auf den Schalter Sichern. Im unteren rechten Bereich des Acrobat-Fensters wird daraufhin ein Verarbeitungsbalken angezeigt, anhand dessen Sie die Verarbeitung des Dokuments erkennen können.

Anhand des Verarbeitungsbalkens kann die Speicherung des PDF als Word-Dokument mitverfolgt werden.

pdf-acrobat-02-tabellen_17

5. Danach können Sie das Dokument direkt in Microsoft Excel öffnen oder auch in ein anderes Programm importieren.

6. Wenn Sie die Tabelle bespielsweise in Adobe InDesign 9 laden, können Sie festlegen, dass die gesamte Tabellenformatierung geladen wird. Mit ein wenig Aufwand kann die Tabelle dort dann entsprechend aufbereitet werden.

pdf-acrobat-02-tabellen_18

Nach dem erfolgreichen Export kann die Tabelle direkt in Excel geöffnet und bearbeitet werden. Die Daten können auch in andere Programme, wie z. B. Adobe InDesign, importiert werden.

Zurück