Вот пару файлов по коньяка. Держите. Есть книга технология коньяка 72 года,pdf,но 182 метра попозже найду время, сожму и отправлю.
Добавлено через 1ч. 12мин.:
Не повезло. Сжатие не помогло. Поищите в гугле- Мартыненко Е.Я."Технология коньяка". Вот ещё одна.
Не совсем польский буфер. Взгляд из России))
sidorowich888
Студент
Анапа
30 8

mak
Научный сотрудник
Екатеринбург
6.3K 1.8K


игорь223, я имел в виду процесс распознавания, когда в pdf не картинка а внятный текст который можно копировать и т.п.
с распознаванием и версткой помогу, главное исходник в высоком разрешении
с распознаванием и версткой помогу, главное исходник в высоком разрешении
игорь223
Академик
таганрог
30.7K 21K

Отв.222 07 Нояб. 17, 11:33
Граждане, посмотрите вот сюда, пжалста
Я посадил толковую работницу, она вроде должна была аккуратно отсканировать книгу.
Вот ссылка
https://yadi.sk/d/OYAFdnmt3PUFEc
Этого достаточно, чтобы обработать сканы и собрать все в кучу?
Если да, то может кто нибудь сделает эту работу?
Я посадил толковую работницу, она вроде должна была аккуратно отсканировать книгу.
Вот ссылка
https://yadi.sk/d/OYAFdnmt3PUFEc
Этого достаточно, чтобы обработать сканы и собрать все в кучу?
Если да, то может кто нибудь сделает эту работу?
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K

Отв.223 08 Нояб. 17, 12:27
игорь223, распознать с таким разрешением хреново получается, очень много ошибок
сколько dpi было при сканировании? 150?
Добавлено через 11мин.:
p.s. прогнал пару раз - если позаниматься улучшением изображения то и так можно будет распознать
займет определенное время на правки и перерисовку таблиц
сколько dpi было при сканировании? 150?
Добавлено через 11мин.:
p.s. прогнал пару раз - если позаниматься улучшением изображения то и так можно будет распознать
займет определенное время на правки и перерисовку таблиц
игорь223
Академик
таганрог
30.7K 21K

Отв.224 08 Нояб. 17, 14:44
Там по ссылке две папки - сжатые сканы и несжатые.
Несжатые в 300дпи, на печати вообще все шикарно видно (для моего взгляда в очках)))
Несжатые в 300дпи, на печати вообще все шикарно видно (для моего взгляда в очках)))
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K


игорь223, я сжатые вообще не трогал
короче займусь
короче займусь
игорь223
Академик
таганрог
30.7K 21K

Отв.226 08 Нояб. 17, 15:29 (через 4 мин)
Счас узнал - сделали в 200дпи, хотя я вроде велел в 300, епть - комп у них "тормозил страшно"
Но взял первую попавшуюся программу онлайн - в вордовский текст вроде даже переводит!?)))
Ладно, тебе виднее, делай так как считаешь нужным
Но взял первую попавшуюся программу онлайн - в вордовский текст вроде даже переводит!?)))
Ладно, тебе виднее, делай так как считаешь нужным
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K


переводит. просто процент ошибок высокий, чем ниже разрешение тем он (процент) выше
игорь223
Академик
таганрог
30.7K 21K

Отв.228 08 Нояб. 17, 15:50 (через 11 мин)
так может тогда просто склеить пдф листы в кубу, и пожать оптимально
Читать же можно будет в любых современных читалках, верно?
А что до обьема, так кого он сейчас волнует особо то)))
Читать же можно будет в любых современных читалках, верно?
А что до обьема, так кого он сейчас волнует особо то)))
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K

Отв.229 08 Нояб. 17, 16:31 (через 41 мин)
игорь223, можно, но с информацией будет не так удобно работать
короче посмотрю как лучше
Добавлено через 3ч. 9мин.:
Получается что-то вроде этого (15 страниц обработал на самые большие косяки), таблицы пока не правил, как и итоговый формат
плюс - приходится вдумчиво читать текст, уже интеерсно
короче посмотрю как лучше
Добавлено через 3ч. 9мин.:
Получается что-то вроде этого (15 страниц обработал на самые большие косяки), таблицы пока не правил, как и итоговый формат
плюс - приходится вдумчиво читать текст, уже интеерсно
Начинающий Бутлегер
Кандидат наук
Ставрополь
312 63

Отв.230 08 Нояб. 17, 21:19
Спасибо вам обоим за интересное чтиво, жду продолжения, интересно!

Отв.231 08 Нояб. 17, 21:24 (через 6 мин)
Сделаю из "pdf-а" формат электронной книги *djvu. Имеет малый размер и легко читается.
Добавлено через 23мин.:
mak, Зачем выкладываешь в редактируемом варианте. Дебилов полно, исказят информацию(((
Добавлено через 23мин.:
mak, Зачем выкладываешь в редактируемом варианте. Дебилов полно, исказят информацию(((
игорь223
Академик
таганрог
30.7K 21K

Отв.232 08 Нояб. 17, 22:07 (через 44 мин)
mak, красота.
А ты говоришь, плохо транслирует)))
Kolew,тоже хороший формат, правда у меня на компе нет приложения для открытия...качнуть нужно
А ты говоришь, плохо транслирует)))
Kolew,тоже хороший формат, правда у меня на компе нет приложения для открытия...качнуть нужно

Отв.233 08 Нояб. 17, 22:16 (через 9 мин)
качнуть нужноигорь223, 08 Нояб. 17, 22:07В этом формате основная масса электронных книг. Качнуть просто обязан)))
Начинающий Бутлегер
Кандидат наук
Ставрополь
312 63

Отв.234 09 Нояб. 17, 00:03
WinDjView тебе в помощьигорь223,
игорь223
Академик
таганрог
30.7K 21K


Да я на айпаде в основном читаю, там читалка стоит
Правда привык к его родной, айбукс — а она не читает дежавюшные файлы, в отличии от пдфных
Да и бумажный первоисточник у меня в этом случае есть))) я вообще старомоден и те буквари, которые «уважаю» стараюсь приобрести в печатном виде...
Правда привык к его родной, айбукс — а она не читает дежавюшные файлы, в отличии от пдфных
Да и бумажный первоисточник у меня в этом случае есть))) я вообще старомоден и те буквари, которые «уважаю» стараюсь приобрести в печатном виде...
Аркадий Вайнер
Доцент
Тюмень
1.1K 520


mak, если ещё не поздно. Как ты понимаешь, pdf в данном случае контейнер с jpg. Можно загрузить в Photoshop и автоматом сделать автотон и автоконтраст. Серый фон убрать инструментом "кривые". Думаю, тогда распознавание полетит ...
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K


Аркадий Вайнер, не все так гладко
есть нечеткие участки
на них еще хуже становитсяпока подобрал более-менее параметры, при которых ошибок вроде поменьше, но все равно читать и править
есть нечеткие участки
на них еще хуже становитсяпока подобрал более-менее параметры, при которых ошибок вроде поменьше, но все равно читать и править

Отв.238 10 Нояб. 17, 22:55
Выложил в библиотеку книжку:
[сообщение #13154219]
[сообщение #13154219]