Здесь больше нет рекламы. Но могла бы быть, могла.

Автор Тема: О способах измерения печатного текста  (Прочитано 14882 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Мунин

  • Гость

Цитата из: Розенбом on 04-08-2004, 16:36:20

Цитата из: Мунин on 04-08-2004, 16:30:31

Цитата из: Розенбом on 04-08-2004, 12:58:11
Символы измерения для писателей времен совка и для переводчиков которые хотят заработать а вот страницы для всех нормальных людей :)


А вот это уже грязные демагогические приёмы...


Почему и тем и тем платят за количество символов. Вот они и зяпятые авторские выставляли туда сюда.


Я в курсе. Но сводить всё это только к упомянутым категориям, да ещё и с таким отрицательным оттенком - грязный демагогнический приём.

Цитата из: Розенбом on 04-08-2004, 16:36:20
А страница оно и ясно когда мне скажут 10 страниц я пойму это на 5 минут книга а 100 это уже на часок :)


Уже отвечено.

               

               

Мунин

  • Гость

Цитата из: Bindaree on 05-08-2004, 09:58:01

Цитата из: Мунин on 04-08-2004, 16:14:48

Цитата из: Розенбом on 03-08-2004, 22:14:02
Мунин знаешь в чем тут фишка? Это самая удобная пусть и не еденица но описывая книгу мне если ты скажешь что она 100000 знаков ты мне ничего не скажешь а если скадешь 100 страниц я пойму гораздо больше :) Да это дает большую погрешность НО измерять книгу с страницах более наглядно чем в символах.


Твоя необразованность - это твоя личная проблема, знаешь ли. Ты, небось, и время не умеешь измерять в микронеделях, и расстояние в аттопарсеках, да и кило яблок на электронвольты не пересчитаешь...


А вот тут Вы неправы, Мунин. В данном случае Ваша образованность - это Ваша личная проблема. Впрочем, если Вы не хотите донести до сбеседника смысл своих слов - зачем Вы вообще начинаете с ним разговор? Выпендриться?


Я хочу отметить, что аргумент типа "всем так понятней" - не принципиальный, и носящий временный характер. Поэтому хотел бы сосредоточиться на других аргументах.

               

               

Мунин

  • Гость

Цитата из: Bindaree on 05-08-2004, 10:05:57

Цитата из: Мунин on 04-08-2004, 16:28:25
Для этой задачи никакие из перечисленных средств не годятся. Ценность информации в этом не меряется. Классический вопрос: сколько информации содержится в строке "E=mc2"?


Согласна, что понятие "информационная ценность" плохо подходит для обозначения того, что я пытаюсь выразить. Тем не менее, каждый раз писать "объем осмысленного текста" я ленюсь :)


Пишите "объём текста". Осмысленным он быть не обязан.

Цитата из: Bindaree on 05-08-2004, 10:05:57

Цитата:
Да и не поймут Вас просто, если Вы в байтах назовете.


Это преходяще. Меня некоторые уже понимают. И в XXI веке понимать будут всё больше и больше.
Цитата:


Но пока это время еще не пришло. Еще раз обращаю Ваше внимание, что Мёнину пришлось проверить, сколько байтов занимает указанный текст.

Тем более, между "поймут" и "начнут называть" в данном случае - огромная пропасть. И англичане, смею Вас уверить, до сих пор километры мысленно в мили переводят, а сантиметры - в дюймы.


См. выше.

Цитата из: Bindaree on 05-08-2004, 10:05:57

Цитата:
Для количества байт формат и кегель как раз неважен. Для меня книга на 700k существенно больше, чем на 300k, или рассказик кило на 70...


в разных форматах одна и та же книга "весит" от одного до трех мегабайт. Я проверяла специально. А текст в ней - совершенно тот же. Даже пробелы там же стоят.


Ещё раз: смотрите не на размер файла, а на объём текста. Я это уже говорил, с самого начала.

               

               

Мунин

  • Гость

Цитата из: Bindaree on 05-08-2004, 10:13:20
Потому что при попытке заказать перевод, Вы получите оффер в формулировке "Х $ за страницу в расчете на ххх - ууу знаков (без пробелов) на страницу в среднем" и никак по другому. В крайнем случае "У$ за 1000 знаков, это будет примерно Z$ за страницу" - но это - редкость. Обычно в страницах считают, а знаками шрифт и абзацы регулируют.

Поскольку аналогичные приемы используются при книгоиздании повсеместно, то писателям, наборщикам и редакторам тоже приходится на это оринтироваться :)


Я не понимаю, какое отношение заказы переводов и книгоиздательское дело имеют к чтению и читателям? Давайте ещё поговорим о килограммах, потому что макулатуру на вес принимают...

               

               

Bindaree

  • Гость
Мунин,

Цитата:
Я хочу отметить, что аргумент типа "всем так понятней" - не принципиальный, и носящий временный характер. Поэтому хотел бы сосредоточиться на других аргументах.

Это аргумент - единственный принципиальный. Потому что мы имеем цель донести информацию до других людей, а не рассуждаем в принципе.

Цитата:
Ещё раз: смотрите не на размер файла, а на объём текста. Я это уже говорил, с самого начала.

а как Вы его будете в байтах измерять, не обращая внимание на размер файла?

Цитата:
Пишите "объём текста". Осмысленным он быть не обязан.

объем текста надо измерять в знаках. тут не может быть двух мнений. а мы измеряем не объем текста, а размер книги. это не одно и то же.

Цитата:
Я не понимаю, какое отношение заказы переводов и книгоиздательское дело имеют к чтению и читателям? Давайте ещё поговорим о килограммах, потому что макулатуру на вес принимают...

Про символы, как объективный измеритель, заговорила не я, и не Розенбом. У Вас же все доказательство на этом строится - 1 байт = 1 символ. далее по тексту.

               

               

Симагин Гендо

  • Гость

Цитата из: Розенбом on 03-08-2004, 22:14:02
 Ибо помню в одной книге было 20 листов точек

    Ну всякие оригиналы бывают... 20 листов точек вносят равную погрешность, измеряем мы текст байтами или страницами.
Цитата из: Розенбом on 04-08-2004, 16:36:20
Почему и тем и тем платят за количество символов.

    Именно потому, что символ - более объективная величина, чем страница.
Цитата из: Розенбом on 04-08-2004, 16:38:33
А я говорю об обьему книге тут и картинки важны и прочее прочее

    Картинки неважны. Вот тут до хрена тем, в которых книги обсуждают. :) Кто-то говорит: "мне не нравится такое-то произведение, там картинки дурацкие?" Картинки являются характеристикой не книги, а ее издания.
    И такая аналогия. Вот есть у нас, например, некоторое количество воды. Мы ее можем измерять литрами, а можем кувшинами или бочками. Но, если мы говорим о "20 кувшинах" или "5 бочках", нам придется уточнять, сколько литров в кувшине или бочке. А вот количество литров достаточно, чтобы понять, сколько у нас этой воды, и насколько нам ее хватит. Так же и с книгами - страницами ее можно измерять лишь при наличии сведений, сколько там знаков на странице. Так не проще ли сразу измерять в символах? Конечно, придется изменить ряд привычек - ну так они постоянно изменяются: кто сейчас в России измеряет длину в локтях? А когда-то локоть был основной единицей...

               

               

Мёнин

  • Гость

Цитата из: Bindaree on 05-08-2004, 10:05:57
Но пока это время еще не пришло. Еще раз обращаю Ваше внимание, что Мёнину пришлось проверить, сколько байтов занимает указанный текст.



Маленькая такая проблема: сколько это страниц, я до сих пор не знаю...

               

               

Роз'n'Бом

  • Гость
Картинка является именно характеристикой книги а не текста прочуствуй разницу ;) Книга ВК ото Юго Запада и Книга ВК Северо Запада являются разными книгами в то время как текст одинаковый :)
Кстати а вот скажите мне сколько это ВК? Ну назовешь ты мне ко во знаков а перевод разный и где точность?
Вы говорите о тексте мы о книгах.
Цитата из: Мунин on 05-08-2004, 14:36:28

Цитата из: Bindaree on 05-08-2004, 10:13:20
Потому что при попытке заказать перевод, Вы получите оффер в формулировке "Х $ за страницу в расчете на ххх - ууу знаков (без пробелов) на страницу в среднем" и никак по другому. В крайнем случае "У$ за 1000 знаков, это будет примерно Z$ за страницу" - но это - редкость. Обычно в страницах считают, а знаками шрифт и абзацы регулируют.

Поскольку аналогичные приемы используются при книгоиздании повсеместно, то писателям, наборщикам и редакторам тоже приходится на это оринтироваться :)


Я не понимаю, какое отношение заказы переводов и книгоиздательское дело имеют к чтению и читателям? Давайте ещё поговорим о килограммах, потому что макулатуру на вес принимают...


Вот Мунин это ваши слова :) Тебе уже 4 читателя сказали что удобнее мрить в страницах.
Только тебе пофиг хотя когда то мы разговаривали о книге по Японскомы у ты мне сам говорил что это примерно 600 страниц 3 тома по 200 а теперь ради токи зрения против ты видите ли начал мерить в байтах и знаках.

               

               

Bindaree

  • Гость

Цитата из: Мёнин on 06-08-2004, 09:47:03

Цитата из: Bindaree on 05-08-2004, 10:05:57
Но пока это время еще не пришло. Еще раз обращаю Ваше внимание, что Мёнину пришлось проверить, сколько байтов занимает указанный текст.



Маленькая такая проблема: сколько это страниц, я до сих пор не знаю...



Да нет... Вы дали оценку немедленно  ;)
Цитата из: Мёнин on 24-06-2004, 09:36:12
Неправда ваша, там на две печатных страницы наберётся, по меньшей мере... :P


погрешность в оценке была, да. Но!
1. Вы стали оценивать в страницах, а не в килобайтах.
2. Вы предположили, сколько. Так чо знаете, хоть и примерно.

               

               

Мунин

  • Гость

Цитата из: Bindaree on 05-08-2004, 16:14:59

Цитата:
Ещё раз: смотрите не на размер файла, а на объём текста. Я это уже говорил, с самого начала.

а как Вы его будете в байтах измерять, не обращая внимание на размер файла?


В символах, а не в байтах!!!

Цитата из: Bindaree on 05-08-2004, 16:14:59

Цитата:
Пишите "объём текста". Осмысленным он быть не обязан.

объем текста надо измерять в знаках. тут не может быть двух мнений. а мы измеряем не объем текста, а размер книги. это не одно и то же.


Когда книга - текст, это одно и то же. А про книжки с картинками я не говорю: картинки не читают.

Цитата из: Bindaree on 05-08-2004, 16:14:59

Цитата:
Я не понимаю, какое отношение заказы переводов и книгоиздательское дело имеют к чтению и читателям? Давайте ещё поговорим о килограммах, потому что макулатуру на вес принимают...

Про символы, как объективный измеритель, заговорила не я, и не Розенбом. У Вас же все доказательство на этом строится - 1 байт = 1 символ. далее по тексту.


Если вы обращаетесь ко мне (а в данном случае, кажется, всё-таки так), то обратите внимание на мои слова. Я как раз постоянно говорю, что 1 байт - примерно один символ, причём для текстового файла в однобайтовой кодировке.

               

               

Мёнин

  • Гость
Биндари, к вашему сведению, 1000 страниц (LoTR, допустим), это тоже не меньше двух.

Поэтому моя оценка была сделана, но была сделана неверно - там их 7-8 крупным (14) шрифтом, но я до сих пор этого не проверял - зачем?..


И ещё одна новость: (?)
В одном письме Б.Штерн, средней известности sci-фантаст (пишет на русском языке, кто не знает) пишет, что его новая повесть - это 17 листов. Рядом, в книге эта повесть занимает 380 страниц Б5, шрифтом эдак 12, как пересчитывать - шут его знает.
И тут же упоминает нечто вроде "слышал о молодом писателе Н.Перумове, говорят, он запланированно выдает 20 листов в месяц. Это что же - 12 романов в год?.."
Т.е. эти 20 листов - это роман Перумова. Как в ваши эти самые страницы эти листы загнать - понятия не имею... при чём, это явно по объёму текста (в символах) считается.

               

               

Арвинд

  • Гость
Печатный лист - стандартная типографская единица измерения объема издания. Имеется в виду бумажный лист, на котором печатается оттиск (потом он разрезается страницы - как правило, на 16 штук).
Количество листов, из которых состоит книга (или любое другое печатное издание), обычно указывается в типографской информации (см. на первой или последней странице).
Размеры реально используемых листов разные, поэтому для стандартизации объем рукописей измеряют в 
условных печатных листах. Как написано в словаре, это понятие, "используемое для подсчета и сопоставления объемов печатных изданий разных форматов, и равное печатному листу формата 60 х 90 см".

               

               

Bindaree

  • Гость
Арвинд,

именно так.

Под "печатным листом" понимается совершенно стандартный типографский формат.
По площади он равен 16 листам А5 (стандартный формат  книги).

Печатный лист - это стандарт. Общепринятый стандарт. Правда это - типографский стандарт. Правда, его также принято использовать для обозначения неформатированных текстов (например, рукописи так измеряют).

Upd: Арвинд, мы с тобой ошиблись слегка, по моему :) печатный лист - это 16 А4, то есть 32 А5 :)


               

               

Bindaree

  • Гость
Мунин,

Цитата:
В символах, а не в байтах!!!

Во-первых, мы беседуем именно о байтах, а не символах :)
Во-вторых, оцените размер 4-го  тома "Путешествия на Запад", пожалуйста. В символах  ;) и в страницах :) Будем на примерах разбирать, раз Вы так настаиваете :)

Цитата:
Когда книга - текст, это одно и то же. А про книжки с картинками я не говорю: картинки не читают.

С точки зрения символов с одной стороны, и электронных книг - с другой - совсем не всегда. В частности, абзацы часто ставять пробелами, а строки - знаками абзаца  ;)

Цитата:
Я как раз постоянно говорю, что 1 байт - примерно один символ, причём для текстового файла в однобайтовой кодировке.


Точная цитата:
Цитата из: Мунин on 30-07-2004, 22:28:34
Всё, что говорите, лекго приводится к единому знаменателю, про который я уже говорил выше: "символ". Для форматов text и Word старых версий символ приблизительно равен байту, чт позволяет успешно использовать для оценки размер файла в байтах.


У меня получается, что Ваше "примерно" дает разброс в три раза :) Это очень неточная оценка, Вам не кажется?  ;) А вот как определить байтовость кодировки файла я даже представить себе не могу, так что  :P

               

               

Bindaree

  • Гость
Мёнин,

Цитата:
Биндари, к вашему сведению, 1000 страниц (LoTR, допустим), это тоже не меньше двух.


Давайте теперь будем разбирать также и принятые в обществе словоформы, да? :)

Цитата:
Поэтому моя оценка была сделана, но была сделана неверно - там их 7-8 крупным (14) шрифтом, но я до сих пор этого не проверял - зачем?..


Да, не верно :) Только вот Вы и в килобайтах неправильно оценили :) причем с той же погрешностью :)
Цитата из: Мёнин on 08-07-2004, 07:27:43
Там килобайт десять, если с примечаниями, и килобайта четыре, если без. Между тем, печатный лист - 2-3 Кб, книжный лист - 1-2 Кб


Четыре килобайта поплам - это как раз 2 листа и получится :) по Вашим же подсчетам :)


Цитата:
Т.е. эти 20 листов - это роман Перумова. Как в ваши эти самые страницы эти листы загнать - понятия не имею... при чём, это явно по объёму текста (в символах) считается.

За меня уже Арвинд ответил - это в печатных листах :) каждый авторский лист равен 16 страницам формата А4 так что примерно то на то и выходит с учетом переплета  :)

               

               

Мёнин

  • Гость

Цитата из: Bindaree on 17-08-2004, 18:06:23
У меня получается, что Ваше "примерно" дает разброс в три раза :) Это очень неточная оценка, Вам не кажется?  ;) А вот как определить байтовость кодировки файла я даже представить себе не могу, так что  :P


Современная кодировка файлов .txt - это кодировка, когда каждому печатному символу находится в соответствии октет (восемь бит, в данном случае - байт).
Разброса - ноль.

               

               

ODIN

  • Гость
Я создал документ в ворде содержащий 1000 символов.
Размер файла составил 24 576 байт.

Прошу пояснить.

               

               

Мёнин

  • Гость
ОDIN, домашнее задание, оно же-  материал для размышления.

Создай файл в Word и сохрани его. Символов на экране будет 0.
А размер файла - между 10 и 20 Кб, в зависимости от версии Word.
После этого, сохрани тот же пустой файл, используя опцию "Сохранить как..." и сменив формат на формат .txt.
Cохрани свои 1000 символов как txt. Посмотри на размеры всех 4-х файлов.

Многое станет понятно...

Собственно, Ворд всегда, по меньшей мере, удваивает текст, плюс использует сколько-то места для запоминания использованных шрифтов и шаблонов (те самые минимальные 10-20 Кб)
(собственно, в Ms Word 2003, что в ыкспе, этот "пустой" файл размером 19,968 б, у меня - у вас может получиться другая цифра)
Информативность текста от того, набрали его в WordPad или в Frontpage, меняется мало. Объём, занимаемый на винчестере - меняется, но меняется объём, занимаемый форматированием - сам же текст наиболее адекватно может быть оценен только в форматах типа .txt, и весьма правдоподобно - в правильно сделанном и не навороченном html.

               

               

Bindaree

  • Гость

Цитата из: Мёнин on 22-08-2004, 09:38:16

Цитата из: Bindaree on 17-08-2004, 18:06:23
У меня получается, что Ваше "примерно" дает разброс в три раза :) Это очень неточная оценка, Вам не кажется?  ;) А вот как определить байтовость кодировки файла я даже представить себе не могу, так что  :P


Современная кодировка файлов .txt - это кодировка, когда каждому печатному символу находится в соответствии октет (восемь бит, в данном случае - байт).
Разброса - ноль.



Мёнин,

Вы ушли от ответа. То, что я не знаю, как измерять этот текст (что, в принципе, не факт  ;)) не отменяет того факта, что Вы ошиблись втрое.  :P

               

               

ODIN

  • Гость
Хмм, геморой.
Создал простой пустой файл - 10,7 килобайт.
Перевел его в тхт - 10,7
2000 символов туда вбил - 22,016
И? 2000 символов в тхт - 11 килобайт?

Либо я тупой, либо все это фигня.
Меряйте текст в страницах!