analysere pdf og identifisere siden en setning er på

stemmer
0

Jeg ønsker å programma analysere en pdf-fil, se etter visse fraser og finne ut sidetallet at hver setning er på. Er dette mulig (jeg forstår at pdf er ikke som en tekstfil)? Er slik, er det bibliotekene der ute som kan hjelpe?

Publisert på 30/12/2009 klokken 01:16
kilden bruker
På andre språk...                            


1 svar

stemmer
0

Apache Tika, som du finner på Apache Lucene prosjektet , omfatter PDFBox, som vil trekke ut teksten der du kan jobbe med det.

Svarte 30/12/2009 kl. 01:30
kilden bruker

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more