The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"pdf - вытащить текст"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы Программирование под UNIX (Public)
Изначальное сообщение [Проследить за развитием треда]

"pdf - вытащить текст"  
Сообщение от darkmen on 30-Сен-06, 17:30 
Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext и все вроде как хорошо, пока не нашел смещение. Вот мой вопрос как своими средствами вытащить данные желательно на с или перл, если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может повезет и найду почему он смещает нужные мне строки.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

 Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "pdf - вытащить текст"  
Сообщение от darkmen on 02-Окт-06, 20:18 
>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>и все вроде как хорошо, пока не нашел смещение. Вот мой
>вопрос как своими средствами вытащить данные желательно на с или перл,
>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>повезет и найду почему он смещает нужные мне строки.


САМ РАЗОБРАЛСЯ>>>как обычно

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

2. "pdf - вытащить текст"  
Сообщение от horsh (??) on 02-Окт-06, 21:58 
>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>повезет и найду почему он смещает нужные мне строки.
>
>
>САМ РАЗОБРАЛСЯ>>>как обычно

И каков правильный ответ?


Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

3. "pdf - вытащить текст"  
Сообщение от darkstar on 03-Окт-06, 09:42 
>>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>>повезет и найду почему он смещает нужные мне строки.
>>
>>
>>САМ РАЗОБРАЛСЯ>>>как обычно
>
>И каков правильный ответ?


Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но еще не совсем но лучше чем было

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

4. "pdf - вытащить текст"  
Сообщение от vampersha on 20-Окт-06, 13:31 
>>>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>>>повезет и найду почему он смещает нужные мне строки.
>>>
>>>
>>>САМ РАЗОБРАЛСЯ>>>как обычно
>>
>>И каков правильный ответ?
>
>
>Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но
>еще не совсем но лучше чем было

попробуй PDF transformer - вторая версия вроде много чего аккуратно делает. Триальник лежит на http://www.pdftransformer.com/

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

5. "pdf - вытащить текст"  
Сообщение от NoName on 28-Мрт-07, 00:01 
>>>>>Люди, очень нужно вытаскивать данные из pdf, пробывал вытаскивать с помощью pdftotext
>>>>>и все вроде как хорошо, пока не нашел смещение. Вот мой
>>>>>вопрос как своими средствами вытащить данные желательно на с или перл,
>>>>>если кто то делал это просьба помочь.Сейчас занимаюсь анализом pdftotext.c может
>>>>>повезет и найду почему он смещает нужные мне строки.
>>>>
>>>>
>>>>САМ РАЗОБРАЛСЯ>>>как обычно
>>>
>>>И каков правильный ответ?
>>
>>
>>Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но
>>еще не совсем но лучше чем было
>
>попробуй PDF transformer - вторая версия вроде много чего аккуратно делает. Триальник
>лежит на http://www.pdftransformer.com/


Другие варианты не встречались, нужно для Linux

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

6. "pdf - вытащить текст"  
Сообщение от Антон (??) on 15-Окт-07, 12:44 
>[оверквотинг удален]
>>>
>>>
>>>Более и менее удалось разобрать pdftohtml сделал вывод который мне подходит но
>>>еще не совсем но лучше чем было
>>
>>попробуй PDF transformer - вторая версия вроде много чего аккуратно делает. Триальник
>>лежит на http://www.pdftransformer.com/
>
>
>Другие варианты не встречались, нужно для Linux

Программа Text Mining Tool может помочь, мне кажется - http://ru.text-mining-tool.com

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ]




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру