October 13th, 2016

размышление

Где применяется закон Ципфа?

Открытие закона Ципфа стало началом инфометрии, науки об измерении количественных характеристик информации. Эта наука сейчас очень востребована. На ее основе работают алгоритмы поисковых систем вроде Google и Yandex, определяющие популярность сайтов и степень их соответствие поисковому запросу.

Главная задача хозяев Интернет-сайта состоит в том, чтобы продвинуть свой сайт в число самых первых по соответствию какой-нибудь поисковой фразе.  В своей борьбе за первые места в топе некоторые из этих ребят не брезгуют откровенным жульничеством. Например, относительно недавно был в ходу такой прием: вставлять в текст сайта желаемую поисковую фразу везде, где можно. И где нельзя, тоже, маскируя это безобразие нечитаемым шрифтом. Например, писали поисковую фразу белыми буквами по белому фону или употребляли очень мелкий шрифт. Зачем? Затем, чтобы доказать поисковым системам, что их сайт лучше других соответствует данному поисковому запросу. Чем чаще встречается поисковый запрос на их странице, тем лучше. Вероятно, жулики считали, что кашу маслом не испортишь.

Но современные поисковые системы эту хитрость легко обнаруживают и обезвреживают. И помогает им в этом закон Ципфа.

Естественно, что закон Ципфа должен соблюдаться и для всего языка и для некоторого его подмножества, небольшого текста, находящегося на сайте. Поисковым  системам не сложно определить частоту встречаемости слов на проверяемом сайте. При этом частота слов, «накручиваемых» с помощью недобросовестных приемов, будет значительно превышать значения частот, какие соответствовали бы закону Ципфа. Таким образом, обман довольно легко обнаруживается, и сайты, создатели которых хотели обмануть поисковые системы, этими системами вообще блокируются.

В языкознании, как в любой науке, вопросов больше, чем ответов. Распределение слов по частотам только констатирует уже сложившееся в языке положение: одни слова встречаются чаще, чем другие. С помощью закона Ципфа можно определить некоторые количественные зависимости в частоте встречаемости слов.

Но можно ли ответить на вопрос, почему одни слова становятся более популярными, чем другие? Примеров того, как одни слова вдруг начинают употребляться чаще, чем другие, и очень быстро занимают высокие места в частотных словарях, мы знаем множество. Один из самых головокружительных взлетов претерпело английское слово yahoo. До 1994 года это слово встречалось, пожалуй, только в одной книге, в «Путешествиях Гулливера» Дж.Свифта. В третьем своем путешествии капитан Гулливер попадает в страну, где люди – дикие и неразумные существа, которых называют yahoo (в русском переводе «йеху»). В 1994 году образовалась

компания Yahoo!, занимавшаяся бизнесом в сфере Интернета. Параллельно росту и коммерческим успехам этой компании слово yahoo становилось все более популярным и, главное, поменяло свой смысл. Теперь, произнося это слово, мы только в последнюю очередь вспомним о первоисточнике, английской книге 17-го столетия.

Оказывается, закон Ципфа позволяет дать, хотя бы качественно, ответ на вопрос о том, как происходит рост популярности тех или иных слов.



В начале графика

В «хвосте» графика

Если не слишком вдаваться в математические тонкости, то объяснение будет таким.

Как уже было сказано, зависимость между частотой встречаемости слова в тексте, f, и его местом в частотном словаре (рангом), r, обратно пропорциональная. Чем больше ранг слова (чем дальше оно находится от начала словаря), тем меньше частота его встречаемости в тексте. График такой зависимости - гипербола, которая при небольших значениях рангов очень резко спадает, а затем, в области малых значений частоты встречаемости, f, тянется очень далеко, постепенно, но очень незаметно, уменьшаясь по мере роста ранга, r.  В самом деле, если частота встречаемости одного слова 4 на миллион, а частота другого - 3 на миллион, не имеет значения, что ранги этих слов различаются в тысячу раз. Эти слова употребляются настолько редко, что многие носители языка их даже не слышали. Вспомните тантамареску и тинтамар.

Однако эта дальняя область примечательна тем, что слово, находящееся здесь, может очень легко многократно уменьшить значение своего ранга. Даже самое маленькое увеличение частоты встречаемости слова резко сдвигает его положение к началу частотного словаря. Например, начинающий артист будет рад упоминанию своего имени даже

В терминах этого закона мерой популярности слова является его положение в частотном словаре языка. Более популярное слово находится ближе к началу словаря, чем менее популярное.

Сам закон Ципфа отражает зависимость частоты использования слова в языке от его места в частотном словаре. Популярные слова языка употребляются чаще. С математической точки зрения график этой зависимости является гиперболой с резким подъемом по мере приближения к началу координат и длинным, пологим, почти горизонтальным, «хвостом». БОльшая  часть слов языка размещается именно в этом «хвосте». Здесь место слова в частотном словаре, если и изменяет частоту использования этого слова в языке, то совсем не на много.

Обратный процесс тоже имеет место. Совсем небольшое изменение частоты встречаемости слова в языке может сильно сдвинуть это слово в частотном словаре к началу, то есть значительно повысить его популярность. Еще одно небольшое изменение частоты встречаемости слова – снова большое повышение популярности. Причем в начале рост популярности слова не требует значительных усилий.  Все происходит как бы само собой. Слово, о котором много говорят, без видимых усилий становится все более популярным.

Но как только положение слова в частотном словаре достигает того места на гиперболе закона Ципфа, где по мере приближения к началу координат начинается существенный подъем кривой, ситуация изменяется. Теперь небольшое изменение частоты встречаемости слова уже не приводит к значительным изменениям его ранга, то есть положение слова в частотном словаре перестает изменяться. Значит, рост популярности слова затормозился. Для того, чтобы он продолжался, следует предпринять специальные меры для того, чтобы повысить частоту встречаемости слова. Например, если слово – название товара, необходимо потратить средства на рекламную компанию. Если это – имя киноактера, этот актер должен сняться в каком-нибудь блокбастере или совершить некий экстравагантный поступок, чтобы о нем снова заговорили. И не просто заговорили, а заговорили гораздо громче, чем прежде. Только тогда он сможет сдвинуться вверх в рейтинге себе подобных. Но это перемещение будет достигаться, чем дальше, тем с большим трудом. И, наконец, остановится. Дальнейшие затраты на рекламу в целях повышения популярности имени станут неэффективными. Более того, излишняя реклама может привести к результатам, противоположным ожидаемым. Так, слишком назойливая реклама консервов «Ветчина со специями», SPAM («SPiced hAM») привела к тому, что эту торговую марку в 1969 году осмеяли в телевизионном скетче комик-группы «Монти Пайтон». А потом эта торговая марка превратилась в имя нарицательное, обозначающее любую назойливую и неуместную рекламу. Это – самое худшее, что может произойти с торговой маркой. Впрочем, для актеров и для политиков тоже небольшая радость, когда их имя превращается в нарицательное. Может статься, что, в конце концов, имя Ю.В.Андропова станет ассоциироваться только с дешевой водкой, «андроповкой», выпущенной во время его недлинного правления Советским Союзом.

Как видим, закон Ципфа, казалось бы, академический и абстрактный, может помочь нам понять некоторые очень конкретные процессы, происходящие в окружающем нас мире, который все более и более становится миром информационным.


Статья опубликована на сайте Школа жизни

Статья опубликована на сайте Школа жизниПолезные ссылки:

  1. Частотный словарь русского языка

  2. Частотные словари английского языка

  3. Закон Ципфа. Условная энтропия. Свойства иерархической аддитивности

  4. Законы царства документов

  5. Фрактальная модель информационного пространства

  6. Закон Ципфа и фрактальная природа социальных и экономических явлений

  7. Закон Ципфа – вводная

  8. Интерпретация текста музыки

  9. Эрец Эйден Жан-Батист Мишель. Неизведанная территория [Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры]

  10. Бенуа Мандельброт

  11. Национальный корпус русского языка

  12. Закон Зипфа в случайных текстах.

  13. Иосиф Ольшаницкий. Закон Зипфа и шифры Новой Машинописи

  14. Ramon Ferrer i Cancho - On the universality of Zipf’s law for word frequencies

  15. Евин Игорь Алексеевич. Синергетика и языкознание

  16. Kenji Kawamura; Naomichi Hatano - Universality of Zipf's Law

promo eponim2008 september 21, 2020 12:37 3
Buy for 10 tokens
Женщинам дозволено кокетство. Скрывать свой возраст у прелестных дам стало общепринятой причудой. Даже если и скрывать особенно нечего. Потому я в начале моего рассказа тоже пококетничаю немного и своего возраста сразу не назову. Скажу только, что нахожусь я на том отрезке женской жизни,…
размышление

Джок Стёрджес - самый противоречивый фотограф, фотографии которого становятся скандалом

Если в одном из поисковых сервисов, Google или Яндекс, набрать всего две буквы, «д» и «ж», среди наиболее популярных запросов появится: «Джок Стёрджес». Кто же это такой, кто по популярности среди пользователей русского Интернета затмил Джину Лоллобриджиду и Джека Николсона?

Джок Стёрджес (Jock Sturges) – известный американский фотограф. Он родился в 1947 году в Нью-Йорке, на западном берегу Соединенных Штатов. Однако большую часть своей жизни он прожил на восточном побережье страны: в Калифорнии, в Сан-Франциско. Сейчас Стёрджес проживает в Сиэтле, штат Вашингтон. Те, кто смотрел сериал «Анатомия страсти» («Grey's Anatomy»), наверняка запомнили контур этого современного и красивого города на побережье Тихого океана.

В конце 1960-х годов, когда Джок закончил общеобразовательную школу, в США еще был обязательный призыв в армию. Стёрджес проходил воинскую службу в Японии. Там же он добился первых успехов в фотографии, которая впоследствии стала делом его жизни. Стёрджес стал главным фотографом военной базы.

Демобилизовавшись в 1970 году, Джок Стёрджес продолжил образование сначала в колледже Мальборо в штате Вермонт. Он получил первую степень по педагогике, что позволило ему работать преподавателем фотографии. Одновременно Джок работал фотографом в различных рекламных агентствах, участвовал в выставках. В его портфолио постепенно накапливались выразительные фотоработы, а сам он вырабатывал свой стиль и искал собственную тему.

В 1978 году Стёрджес переезжает в Калифорнию, живет и учится в Сан-Франциско. Сан-Франциско – город красивый, яркий и, можно сказать, дерзкий. Люди, проживающие здесь, готовы прорывать все барьеры, и научные, и технологические, и нравственные тоже. Достаточно сказать, что борьба за свои права людей с нетрадиционной сексуальной ориентацией началась именно здесь.

И достаточно сказать это, чтобы кое-кто тут же начал брызгать слюной и трясти кулаками, называя этот красивый и стильный город в лучшем случае гнездом порока. Окститесь, товарищи, позвольте продолжить.

В 1985 году Джон Стёрджес заканчивает обучение в Институте Искусств в Сан-Франциско и получает вторую степень в области искусств. Но что такое ученая степень в области искусств? Там, где самое важное не то, какие предметы ты выучил, а то, что ты сам можешь предложить «городу и миру» Самое главное для фотохудожника, как и для художника вообще

Свою тему Стёрджес нашел еще в конце 1970-х годов. Побывав на пляжах Нормандии и Бретани, а также на пляжах западного побережья Ирландии он начал фотографировать нудистов, которых на этих пляжах было довольно много.

Пляжи Нормандии привлекали еще импрессионистов. Многие из них кучковались вокруг роскошных городов-курортов Довиль и Трувиль. Здесь было все для развлечения богатой публики. Виллы, казино, модные магазины (Коко Шанель начинала в одном из них), шезлонги, в которых богатые мужчины и красивые женщины сидели, любуясь темно-синей поверхностью океана и дыша соленным воздухом. И купальни, в которых и те, и другие окунались в прохладные воды, одевши смешные для нас купальные костюмы конца 19-го – начала 20-го века.

Но пляжи Нормандии настолько протяжены, что там можно было довольно легко отыскать место совершенно пустое и дикое, да еще к тому же слегка прикрытое дюнами. Самое то, чтобы, не раздражая общественного мнения (даже во Франции того времени весьма консервативного), побеситься. Сбросить с себя одежку и побегать по бережку, в чем мама родила. Испытывая удивительное чувство возвращения в детство, когда обнаженное тело не вызывало никаких порочных эмоций.

И, кстати, если кто-то подумает плохо, представив оргии на пляжах, то, во-первых, да будет ему стыдно (как сказал один английский король, придумав орден Подвязки). А во-вторых, пусть он попробует представить эти пресловутые оргии на песке поподробнее. Пусть ляжет на мелкий песочек и немного по нему покатается. Впечатление получит незабываемое независимо от пола. Мелкий песок, забивающийся во все отверстия – то еще удовольствие. Нет-нет, только не оргии, только чистый и непорочный нудизм!

Черно-белые фотографии нудистов были сделаны Джоком Стёрджесом мастерски. И, что характерно, совершенно асексуально. Тот, кто пробовал фотографировать ню, знает, что эти фотографии могут быть вызывающе эротичными, а могут быть совершенно не привлекательными с этой точки зрения. Дело в позе, которую придумает для модели и «поймает» своим объективом художник. Так что снять асексуальную обнаженку – для этого требуется мастерство. И, кстати, асексуальность снимков лучше всего передает чувства людей, собирающихся в нудистские сообщества. Они не хотят потрахаться на берегу, потому что знают, как это противно. О чем уже было сказано в предыдущем параграфе.

Начав съемки нудистов в Европе, Стёрджес продолжил их на бесконечных пляжах Калифорнии, где тихоокеанская вода еще холоднее, чем волны Северной Атлантики. Это по-прежнему были черно-белые фотографии, снятые специальным объективом, который позволяет зрителю разглядеть красоту тела, не слишком его приближая, чтобы не сделать уродливым. А сделать это довольно просто. Вспомните, как Лемюэль Гулливер описывал свои прогулки по телам местных красавиц в Стране Великанов. Бр-р-р и еще раз бр-р-р!

В глазах многих россиян (а еще раньше, в глазах жителей советского государства) Америка представала притоном разврата! Ах, стриптиз, ах, «Playboy»! Ужас, ужас, ужас!!! Между тем, Америка – страна в основном с протестантской моралью. Протестанты – это христианские фундаменталисты, и взгляды их на вопросы взаимоотношения полов и на вопросы общественной морали весьма коррелируют со взглядами фундаменталистов исламских. Но они живут в обществе, где никто не вправе навязывать своих взглядов другим. Волей-неволей даже фундаменталистам приходится ограничивать свой пыл в борьбе за нравственность (как они ее понимают) рамками семьи или общины. Волей-неволей приходится соблюдать взаимную терпимость. Терпимость взаимно выгодную. Ведь если ты не будешь навязывать другим свои взгляды, то и другие не смогут навязывать свои взгляды тебе. Смотреть фотографии обнаженной натуры имеют право только те, кто это желает. Те же, кто считают такие фотографии аморальными, смотреть на них не обязаны. Могут тихо стоять в сторонке и радоваться, что никто не заставляет их смотреть на то, что они считают развратом. Как говорит хорошая русская поговорка:

«Не любо – не слушай, а врать не мешай»

Взаимная терпимость (она же толерантность) предполагает, что запрещать можно только то, что противоречит закону. И что запрещать это могут только те, кто на это уполномочен, то есть судьи. При этом перед судьей предстают представители обоих мнений, каждый из которых свою правоту должен доказать. Никто и никаким другим образом не может человеку ничего запретить. Пусть даже этот человек бегает по пляжу без одежды. Или же если другой человек такое безобразие (?) фотографирует.

Джок Стёрджес столкнулся с законом, когда стал фотографировать обнаженных девочек в период полового созревания («Лолит»). Власти решили, что это – детская порнография, демонстрация которой законом запрещена. В 1990 году 25 апреля полиция и агенты ФБР ворвались в студию, где работал фотограф и конфисковали фотоаппараты, негативы, готовые фотографии и компьютер, в котором хранились другие фотографии, сделанные Стёрджесом.

Доказывать свою правоту фотографу пришлось больше года. В результате судебного разбирательства фотографии Джока Стёрджеса порнографией признаны не были. Действия полиции и ФБР были признаны неправомерными. Суд Сан-Франциско не признал фотохудожника виновным и никаких обвинений против него не выдвинул.

Подобные процессы поднимают популярность деятелей искусства. Так было и в 19 веке, когда многие художники провоцировали общественное мнение, чтобы добиться популярности, а с нею славы и признания. Джок Стёрджес тоже стал известным благодаря скандальному процессу. За время, прошедшее со времени суда он издал более 10 персональных фотоальбомов. Его работы начали охотно покупать, галеристы с не меньшей охотой организовывали его персональные выставки. Но и другая сторона не успокаивалась. Против художника не раз выступали пуританские общины Америки. Религиозные активисты устраивали пикеты возле магазинов, которые продавали фотоальбомы Джока Стёрджеса. Пуританские общины несколько раз выдвигали против Стёрджеса новые обвинения. Но поскольку в США существует прецедентное право, иски против фотографа проигрывались на основании того, самого первого, приговора.

Почему же Джок Стёрджес стал столь знаменит в русском сегменте Интернета?

Потому что 7 сентября 2016 года в Москве была открыта его первая выставка в России, которая называлась «Без смущения» (Я бы перевел название «Absence of Shame», как «Без стыда»). Планировалось, что выставка будет работать до 30 октября 2016 года.

И вдруг, по прошествии двух с половиной недель, одна известная дама, член Госдумы, вдруг заметила, что эта выставка – публичная демонстрация детской порнографии. При том, что Джок Стёрджес, уже наученный горьким опытом, имел все документы, свидетельствующие, во-первых, что все съемки производились с согласия моделей, а во-вторых, что обнаженными на представленных фотографиях были сняты только совершеннолетние модели. Копии документов были в наличии у организаторов выставки в Москве. Кроме того, посетители до 18 лет на эту выставку не допускались.

Но здесь вам не Америка. Появились какие-то общественники, облаченные в какую-то униформу, представляющие какую-то общественную организацию и телами закрыли доступ на выставку. Ах, как это было героически! Ах, как это было духоподъемно! Ах, как это было скандально!

Российские ревнители нравственности, в конце концов, наступили на те же грабли, что и ревнители нравственности американские. Скандал сделал выставку популярной. Через несколько дней ее возобновили, и она проработала до конца сентября, приняв за неделю, наверное, раза в три больше посетителей, чем это было бы без скандала.

А Джок Стёрджес, благодаря случившемуся скандалу, получил свою долю славы в России. Чему подтверждением – выдачи самых популярных запросов к поисковым системам Интернета, начинающихся на буквы «д» и «ж».

Опубликовано на сайте Топавтор
topauthor
Полезные ссылки:

  1. Джок Стёрджес. Без смущения