Вот пару файлов по коньяка. Держите. Есть книга технология коньяка 72 года,pdf,но 182 метра попозже найду время, сожму и отправлю.
Добавлено через 1ч. 12мин.:
Не повезло. Сжатие не помогло. Поищите в гугле- Мартыненко Е.Я."Технология коньяка". Вот ещё одна.
Не совсем польский буфер. Взгляд из России))
sidorowich888
Студент
Анапа
30 8
Отв.220 03 Нояб. 17, 10:30
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K
Отв.221 03 Нояб. 17, 19:11
игорь223, я имел в виду процесс распознавания, когда в pdf не картинка а внятный текст который можно копировать и т.п.
с распознаванием и версткой помогу, главное исходник в высоком разрешении
с распознаванием и версткой помогу, главное исходник в высоком разрешении
игорь223
Академик
таганрог
30.2K 20.6K
Отв.222 07 Нояб. 17, 11:33
Граждане, посмотрите вот сюда, пжалста
Я посадил толковую работницу, она вроде должна была аккуратно отсканировать книгу.
Вот ссылка
https://yadi.sk/d/OYAFdnmt3PUFEc
Этого достаточно, чтобы обработать сканы и собрать все в кучу?
Если да, то может кто нибудь сделает эту работу?
Я посадил толковую работницу, она вроде должна была аккуратно отсканировать книгу.
Вот ссылка
https://yadi.sk/d/OYAFdnmt3PUFEc
Этого достаточно, чтобы обработать сканы и собрать все в кучу?
Если да, то может кто нибудь сделает эту работу?
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K
Отв.223 08 Нояб. 17, 12:27
игорь223, распознать с таким разрешением хреново получается, очень много ошибок
сколько dpi было при сканировании? 150?
Добавлено через 11мин.:
p.s. прогнал пару раз - если позаниматься улучшением изображения то и так можно будет распознать
займет определенное время на правки и перерисовку таблиц
сколько dpi было при сканировании? 150?
Добавлено через 11мин.:
p.s. прогнал пару раз - если позаниматься улучшением изображения то и так можно будет распознать
займет определенное время на правки и перерисовку таблиц
игорь223
Академик
таганрог
30.2K 20.6K
Отв.224 08 Нояб. 17, 14:44
Там по ссылке две папки - сжатые сканы и несжатые.
Несжатые в 300дпи, на печати вообще все шикарно видно (для моего взгляда в очках)))
Несжатые в 300дпи, на печати вообще все шикарно видно (для моего взгляда в очках)))
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K
Отв.225 08 Нояб. 17, 15:25, через 41 мин
игорь223, я сжатые вообще не трогал
короче займусь
короче займусь
игорь223
Академик
таганрог
30.2K 20.6K
Отв.226 08 Нояб. 17, 15:29, через 4 мин
Счас узнал - сделали в 200дпи, хотя я вроде велел в 300, епть - комп у них "тормозил страшно"
Но взял первую попавшуюся программу онлайн - в вордовский текст вроде даже переводит!?)))
Ладно, тебе виднее, делай так как считаешь нужным
Но взял первую попавшуюся программу онлайн - в вордовский текст вроде даже переводит!?)))
Ладно, тебе виднее, делай так как считаешь нужным
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K
Отв.227 08 Нояб. 17, 15:40, через 12 мин
переводит. просто процент ошибок высокий, чем ниже разрешение тем он (процент) выше
игорь223
Академик
таганрог
30.2K 20.6K
Отв.228 08 Нояб. 17, 15:50, через 11 мин
так может тогда просто склеить пдф листы в кубу, и пожать оптимально
Читать же можно будет в любых современных читалках, верно?
А что до обьема, так кого он сейчас волнует особо то)))
Читать же можно будет в любых современных читалках, верно?
А что до обьема, так кого он сейчас волнует особо то)))
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K
Отв.229 08 Нояб. 17, 16:31, через 41 мин
игорь223, можно, но с информацией будет не так удобно работать
короче посмотрю как лучше
Добавлено через 3ч. 9мин.:
Получается что-то вроде этого (15 страниц обработал на самые большие косяки), таблицы пока не правил, как и итоговый формат
плюс - приходится вдумчиво читать текст, уже интеерсно
короче посмотрю как лучше
Добавлено через 3ч. 9мин.:
Получается что-то вроде этого (15 страниц обработал на самые большие косяки), таблицы пока не правил, как и итоговый формат
плюс - приходится вдумчиво читать текст, уже интеерсно
Начинающий Бутлегер
Кандидат наук
Ставрополь
312 63
Отв.230 08 Нояб. 17, 21:19
Спасибо вам обоим за интересное чтиво, жду продолжения, интересно!
Отв.231 08 Нояб. 17, 21:24, через 6 мин
Сделаю из "pdf-а" формат электронной книги *djvu. Имеет малый размер и легко читается.
Добавлено через 23мин.:
mak, Зачем выкладываешь в редактируемом варианте. Дебилов полно, исказят информацию(((
Добавлено через 23мин.:
mak, Зачем выкладываешь в редактируемом варианте. Дебилов полно, исказят информацию(((
игорь223
Академик
таганрог
30.2K 20.6K
Отв.232 08 Нояб. 17, 22:07, через 44 мин
mak, красота.
А ты говоришь, плохо транслирует)))
Kolew,тоже хороший формат, правда у меня на компе нет приложения для открытия...качнуть нужно
А ты говоришь, плохо транслирует)))
Kolew,тоже хороший формат, правда у меня на компе нет приложения для открытия...качнуть нужно
Отв.233 08 Нояб. 17, 22:16, через 9 мин
качнуть нужноигорь223, 08 Нояб. 17, 22:07В этом формате основная масса электронных книг. Качнуть просто обязан)))
Начинающий Бутлегер
Кандидат наук
Ставрополь
312 63
Отв.234 09 Нояб. 17, 00:03
WinDjView тебе в помощьигорь223,
игорь223
Академик
таганрог
30.2K 20.6K
Отв.235 09 Нояб. 17, 07:12
Да я на айпаде в основном читаю, там читалка стоит
Правда привык к его родной, айбукс — а она не читает дежавюшные файлы, в отличии от пдфных
Да и бумажный первоисточник у меня в этом случае есть))) я вообще старомоден и те буквари, которые «уважаю» стараюсь приобрести в печатном виде...
Правда привык к его родной, айбукс — а она не читает дежавюшные файлы, в отличии от пдфных
Да и бумажный первоисточник у меня в этом случае есть))) я вообще старомоден и те буквари, которые «уважаю» стараюсь приобрести в печатном виде...
Аркадий Вайнер
Доцент
Тюмень
1.1K 499
Отв.236 09 Нояб. 17, 07:58, через 46 мин
mak, если ещё не поздно. Как ты понимаешь, pdf в данном случае контейнер с jpg. Можно загрузить в Photoshop и автоматом сделать автотон и автоконтраст. Серый фон убрать инструментом "кривые". Думаю, тогда распознавание полетит ...
mak
Научный сотрудник
Екатеринбург
6.3K 1.8K
Отв.237 09 Нояб. 17, 08:56, через 59 мин
Аркадий Вайнер, не все так гладко
есть нечеткие участки
на них еще хуже становитсяпока подобрал более-менее параметры, при которых ошибок вроде поменьше, но все равно читать и править
есть нечеткие участки
на них еще хуже становитсяпока подобрал более-менее параметры, при которых ошибок вроде поменьше, но все равно читать и править
Отв.238 10 Нояб. 17, 22:55
Выложил в библиотеку книжку:
[сообщение #13154219]
[сообщение #13154219]