Info-Line 08194 / 717 999 6
von Marion Tramer
Sehr häufig wird die Frage gestellt: Gibt es ein Programm, mit dem ich ein PDF-Dokument in eine Excel-Tabelle konvertieren kann oder Tabellen aus einem PDF in eine andere Anwendung kopieren kann? Diese Frage wird oft von Anwendern gestellt, die Texte aus vorhandenen PDF-Dokumenten in anderen Programmen weiterverarbeiten sollen, wenn z. B. die Originaldatei, aus der das PDF-Dokument erzeugt wurde, nicht mehr vorhanden ist, oder aber der Fragesteller will die Daten einfach in Excel bearbeiten und korrigieren können, ohne dass er den Text erneut abtippen muss.
Die Antwort auf die Frage lautet: Ja. Und das Beste dabei ist, dass die Anwender, die bereits mit Acrobat XI Pro arbeiten, gar kein neues Programm kaufen müssen, denn sie haben ja schon das entsprechende Programm auf der Arbeitsstation installiert. Nämlich Acrobat XI Pro. Schon seit vielen Versionen ist Acrobat in der Lage, ein PDF-Dokument in ein Excel-Dokument zu konvertieren. War das Ergebnis in früheren Versionen nicht gerade zufriedenstellend, so wurde es von Version zu Version immer wieder verbessert, bis es heute – mit der aktuellen Version XI – sehr gute und brauchbare Ergebnisse liefert.
Wenn Sie in Acrobat den Befehl zum Speichern einer PDF-Datei als Microsoft Excel-Arbeitsmappe aufrufen, werden immer alle Seiten des aktuell geöffneten PDF in die Zieldatei gespeichert. Aber nicht immer muss der gesamte Inhalt eines PDF-Dokuments in eine Excel-Datei gespeichert werden. In den meisten Fällen handelt es sich nur um eine Tabelle, die zur weiteren Bearbeitung benötigt wird. Acrobat bietet dem Anwender die Möglichkeit, einzelne Bereiche in einem PDF zu markieren und zu konvertieren.
Beim Kopieren von Texten oder Tabellen in einem PDF-Dokument kommt es darauf an, wie die Daten in Acrobat in den Arbeitsspeicher kopiert werden. Die meisten Acrobat-Anwender kennen und nutzen die Möglichkeit, Text in einem PDF-Dokument mit dem Auswahlwerkzeug für Text und Bilder in Acrobat XI Pro zu markieren, ihn zu kopieren und über die Zwischenablage in ein anderes weiterverarbeitendes Programm einzufügen.
Allerdings kann das Aktivieren bestimmter Bereiche in Acrobat, wie in unserem Beispieldokument, schon zur Herausforderung werden. Wenn Sie beispielsweise versuchen, die Tabelle einfach zu markieren, indem Sie bei ausgewähltem Auswahlwerkzeug für Text und Bilder über den Text fahren, um ihn zu markieren, werden Sie schnell merken, dass gleichzeitig auch der umgebende Text mitmarkiert wird.
Um nur einen bestimmten Bereich zu markieren, drücken Sie bei ausgewähltem Auswahlwerkzeug für Text und Bilder die Alt-Taste und ziehen ein Auswahlrechteck um den zu markierenden Bereich.
Um den markierten Bereich in die Zwischenablage zu kopieren und dann in ein anderes Programm einzufügen, wählen Sie den Menübefehl Bearbeiten → Kopieren .
Werden die kopierten Texte beispielsweise in Adobe InDesign in einen Textrahmen eingefügt, gehen dabei jegliche Formatierungsinformationen und die ursprüngliche Tabellenstruktur verloren. Jede Zeile wird mit einem Zeilenende abgeschlossen, sodass diese vor der eigentlichen Weiterverarbeitung erst einmal wieder gelöscht werden müssen. Wird der Inhalt in eine Excel-Arbeitsmappe eingefügt, wird dort ebenfalls die Tabellenstruktur ignoriert und jede Tabellenzelle wird in der ersten Spalte in eine separate Zelle eingefügt.
Doch was viele Acrobat-Anwender nicht wissen, ist, dass Acrobat XI Pro über einen Befehl verfügt, mit dem sie Texte mitsamt den Tabellenformatierungen kopieren und in ein Excel-Arbeitsblatt oder InDesign-Dokument einfügen können.
1. Dazu markieren Sie den zu kopierenden Text in Acrobat wie gewohnt mit dem Auswahlwerkzeug für Text und Bilder. Anstatt des Menübefehls Bearbeiten → Kopieren oder des entsprechenden Tastaturbefehls wählen Sie den Befehl »Mit Formatierung kopieren« aus dem Kontextmenü.
2. Wenn Sie den Text aus der Zwischenablage danach in eine Excel-Arbeitsmappe einfügen, wird der Text mit der ursprünglichen Tabellenstruktur übernommen. Wird der auf diese Weise kopierte Text in ein InDesign-Dokument eingefügt, wird daraus zwar noch keine InDesign-Tabelle, doch werden die einzelnen Spalten nun durch einen Tabellensprung voneinander getrennt, sodass daraus über den entsprechenden Befehl sehr leicht eine Tabelle generiert werden kann. Mit diesem Befehl werden – anders als beim Einfügen in ein Microsoft-Word-Dokument –, werden die Schrifteninformationen nicht kopiert und deshalb beim Einfügen in ein anderes Programm die jeweilige Standardschrift verwendet.
Verwenden Sie den Befehl auch, wenn Sie eine Tabelle in einem PDF-Dokument kopieren und in QuarkXPress verwenden möchten, damit die Tabelle zeilenweise übernommen wird und die einzelnen Spalten durch einen Tabulator voneinander getrennt werden.
Mit Acrobat XI Pro besteht nicht nur die Möglichkeit, einzelne Bereiche zu markieren, zu kopieren und in eine Excel-Arbeitsmappe einzufügen. Acrobat bietet dem Anwender auch die Möglichkeit, einzelne Bereiche in einem PDF zu markieren und in ein Excel-Dokument zu konvertieren.
Wenn Sie in Acrobat XI Pro Text auswählen und in ein Word-Dokument konvertieren möchten, kommt es darauf an, wie Sie die Inhalte im PDF-Dokument aktiviert haben.
1. Um einen beliebigen Text auf der Seite auszuwählen, wählen Sie das Auswahlwerkzeug für Text und Bilder aus der Werkzeugleiste und markieren den zu exportierenden Bereich.
2. Nachdem Sie die Auswahl festgelegt haben, klicken Sie mit der Maus auf die Auswahl und wählen den entsprechenden Befehl aus dem Kontextmenü.
Wenn Sie das Kontextmenü auf einer Markierung öffnen, wählen Sie den Befehl Auswahl exportieren als und im gleichnamigen Fenster den Speicherort sowie das Speicherformat aus und tragen den Dateinamen ein. Um die Auswahl in ein Excel-Dokument zu speichern, wählen Sie die Option Excel-Arbeitsmappe aus dem Einblendmenü Format. Weitere Einstellungen zum Export können nicht definiert werden.
Wenn Sie dagegen das Kontextmenü auf einem Auswahlrechteck öffnen, enthält es lediglich drei Befehle zur Auswahl. Wählen Sie ebenfalls den Befehl »Auswahl exportieren als«. Im gleichnamigen Fenster legen Sie den Speicherort und das Speicherformat fest und tragen den Dateinamen ein. Wenn Sie die Auswahl auf diese Weise exportieren, können Sie für das ausgewählte Speicherformat weitere Einstellungen vornehmen, indem Sie auf den Schalter »Einstellungen« klicken. Die Einstellungen hier entsprechen den Einstellungen wie zum Speichern einer PDF-Datei als Word- Dokument.
3. Nach dem Export können Sie die Datei direkt in Microsoft Excel öffnen und das Ergebnis kontrollieren. Im Gegensatz zum Kopieren und Einfügen in ein Excel-Arbeitsblatt wurde beim Export die Textund Zellenformatierung mit übernommen.
Über den Menübefehl Datei → Speichern als finden Sie im Untermenü Arbeitsblatt den Befehl, mit dem Sie ein komplettes PDF als Microsoft Excel- Arbeitsmappe oder XML-Tabellenkalkulation 2003 speichern können. Hierbei werden die Textformatierungen, wie z. B. Schriftart, -größe und -stil, so gut es eben geht mit in das Zieldokument übernommen. Enthält die PDF-Datei Fließtext, wird dieser zeilenweise in einzelne Tabellenzeilen gespeichert. Verwenden Sie die Funktion, um ein ganzes PDF-Dokument in ein Excel-Dokument zu konvertieren, wenn das PDF mehrseitige Tabellen beinhaltet.
1. Möchten Sie ein PDF-Dokument als Microsoft-Excel-Datei speichern, wählen Sie den Menübefehl Datei → Speichern als → Arbeitsmappe und den entsprechenden Befehl aus dem Untermenü. Wenn Sie das Aufgabenfenster Werkzeuge einblenden, stehen Ihnen die Befehle zum Exportieren einer PDF-Datei als Excel-Arbeitsmappe oder XML-Tabellenkalkulation 2003 auch über die Werkzeuggruppe Inhaltsbearbeitung über das Einblendmenü Datei exportieren nach zur Verfügung.
Abhängig von der Excel-Version, mit der die Datei später weiterverarbeitet werden soll, wählen Sie im Untermenü die Option Microsoft Excel-Arbeitsmappe, wenn Sie ein xlsx-Dokument erstellen möchten, das nur mit ein Microsoft-Of?ce-Excel-Version 10 oder höher geöffnet werden kann. Soll das Dokument auch in einer früheren Version von Microsoft Excel zu öffnen sein, wählen Sie die Option XML-Tabellenkalkulation 2003.
2. Um die Einstellungen festzulegen, wie das Excel-Dokument gespeichert werden soll, klicken Sie im Fenster Speichern unter auf den Schalter Einstellungen .
3. Die Einstellungen zum Speichern als Microsoft Excel-Arbeitsmappe und als XML-Tabellenkalkulation 2003 sind identisch. Die resultierende Excel- Datei unterscheidet sich lediglich im Dateiformat und in der Version, mit der das exportierte Dokument später geöffnet werden kann.
Im Bereich »Einstellungen für Excel- Arbeitsmappen« aktivieren Sie die Option »Einzelne Arbeitsmappe für das Dokument erstellen«, wenn die einzelnen Seiten des PDF-Dokuments fortlaufend in einer Arbeitsmappe angehängt werden sollen. Wenn Sie die Option »Arbeitsmappe für jede Seite erstellen« aktivieren, wird für jede Seite im PDF eine neue Arbeitsmappe im Excel-Dokument erstellt.
Im Bereich »Numerische Einstellungen« legen Sie das Format für Dezimal- und Tausendertrennzeichen für numerische Daten fest. Sie können die »Dezimal- und Tausendertrennzeichen aus Regionseinstellungen abrufen«, die auf Ihrer Arbeitsstation gespeichert sind, oder die Trennzeichen in den entsprechenden Feldern eintragen, wenn Sie die Option Folgende Dezimalund Trennzeichen verwenden aktivieren.
Enthält ein PDF-Dokument gescannte Texte, können diese als Bild oder als bearbeitbare Texte gespeichert werden. Wenn Sie die Texte beim Speichern als Excel-Dokument gleichzeitig in bearbeitbaren Text konvertieren möchten, aktivieren Sie die Option »Gegebenenfalls OCR ausführen« im Bereich »OCR-Einstellungen«. Um die OCR-Sprache auszuwählen, klicken Sie auf den Schalter »Sprache festlegen«.
4. Um das Dokument zu speichern, klicken Sie auf den Schalter Sichern. Im unteren rechten Bereich des Acrobat-Fensters wird daraufhin ein Verarbeitungsbalken angezeigt, anhand dessen Sie die Verarbeitung des Dokuments erkennen können.
5. Danach können Sie das Dokument direkt in Microsoft Excel öffnen oder auch in ein anderes Programm importieren.
6. Wenn Sie die Tabelle bespielsweise in Adobe InDesign 9 laden, können Sie festlegen, dass die gesamte Tabellenformatierung geladen wird. Mit ein wenig Aufwand kann die Tabelle dort dann entsprechend aufbereitet werden.