viernes, 23 de enero de 2009

Clase ClaseBuscaPdf


En esta clase hago uso de la librería PDFBox.... ya hablaré de ella en la sección Librerías... en esta clase es donde abro el .pdf y ver su contenido (en realidad no se ve nada texto).... aqui el codigo:

Download ClaseBuscaPdf.java

import java.io.*;
import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.util.PDFTextStripper;

class ClaseBuscaPdf implements InterfaceBuscador{

private FileInputStream ficheroEntrada;
public PDDocument pdf;
public PDFTextStripper stripper;
//public String salida;

public ClaseBuscaPdf(){

ficheroEntrada =null;// new FileInputStream(ficheroNombre);
pdf= null;//PDDocument.load(ficheroEntrada);

}

public void loadFile(String nombre) throws IOException{

ficheroEntrada = new FileInputStream(nombre);
pdf = PDDocument.load(ficheroEntrada);

stripper = new PDFTextStripper();
stripper.setSortByPosition(false);
stripper.setStartPage(1);
stripper.setEndPage(Integer.MAX_VALUE);

}

public String getText() throws IOException{

return stripper.getText(pdf);

}

public void close() throws IOException{

pdf.close();
ficheroEntrada.close();
ficheroEntrada = null;
//System.out.println("Cerrando Ficheros!");

}

}

0 comentarios:

Publicar un comentario

 

Pyr0S-9889 © 2008 Business Ads Ready is Designed by Ipiet Supported by Tadpole's Notez