Виберіть країну: |
![]() |
Україна |
Не про деяких сусідів (Білорусь тощо). Випадкова загадка.
В англійській мові найуживаніше слово — the — вживається приблизно удвічі частіше за друге за вживаністю слово, утричі частіше за третє, в 4 рази за четверте і так далі. Такий розподіл має спостерігатися в багатьох, якщо не усіх, інших мовах.
Я порахував слова у кількох своїх україномовних текстах (не дуже великих — ледь більше 4500 слів загалом). Трійка лідерів зустрілася 115, 87 і 82 рази — це якось не дуже схоже на [X; X/2; X/3]. Що не так? (Окрім того, що вибірка досить мала)
В англійській мові найуживаніше слово — the — вживається приблизно удвічі частіше за друге за вживаністю слово, утричі частіше за третє, в 4 рази за четверте і так далі. Такий розподіл має спостерігатися в багатьох, якщо не усіх, інших мовах.
Я порахував слова у кількох своїх україномовних текстах (не дуже великих — ледь більше 4500 слів загалом). Трійка лідерів зустрілася 115, 87 і 82 рази — це якось не дуже схоже на [X; X/2; X/3]. Що не так? (Окрім того, що вибірка досить мала)
дозволю собі припустити, що є ще різні мовні "сімї"... хоча не впевнений що це вірно...
або щось звязане із артиклями в інгліші... у нас артиклів вроді не має... не великий я вже фахівець у лінгвістиці

Мовна сім'я тут неважлива.
Нема артиклів, але є прийменники, сполучники, частки.
Нема артиклів, але є прийменники, сполучники, частки.
Це говорить тільки про те, що українська значно багатша і різноманітніша за англійську. Англійська мова досить "скупа" і "примітивна".
Давай відповідь... або хоч якусь підказку... не хочеться вже сильно чекати
проблема в употреблении "у" и "в".Перед гласными одно ,согласными другое.С употреблением "і","та","й", тоже самое.
Красивої відповіді нема. Я спершу тупо порахував окреми усі різні послідовності літер. Вийшло так:
У — 3.10%; НА — 2.34%; І — 2.34%; НЕ — 1.97%; З — 1.91%; В — 1.56%; ЗА — 1.02%; ЩО — 0.92%; ЛІГА — 0.81%; ЩЕ — 0.67%
Зі слова "ліга" зрозуміло, що усі тексти на одну тему були.
Але оскільки ("не про деяких сусідів" ) "в" та "у" є одним словом, краще було порахувати так:
У + В — 4.66%
І + Й — 2.91%
НА — 2.34%
НЕ — 1.97%
З — 1.91%
ЗА — 1.02%
ЩО — 0.92%
ЛІГА — 0.81%
ЩЕ — 0.67%
А — 0.65%
Ось так близько до послідовності [X; X/2; X/3, ...] вийшло:
www.awesomescreenshot.com...
Знайшов дані для різних мов, але тут, схоже, кожна словоформа рахується як окреме слово. І дані з онлайн-спілкування, а не статей.
invokeit.wordpress.com/fr...
Топ-100 слів у англійській-2012 — 57.07% від загальної кількості слововживань. Перша десятка: YOU, I, THE, TO, A, IT, AND, THAT, OF, IN (від 4,32% до 1,07%).
Топ-100 слів в українській-2012 — 41.68% від загальної кількості слововживань. Перша десятка: Я, НЕ, ЩО, ТИ, ЦЕ, І, НА, З, У, В (від 2,85% до 1,05%).
YOU vs Я, хе-хе.
У — 3.10%; НА — 2.34%; І — 2.34%; НЕ — 1.97%; З — 1.91%; В — 1.56%; ЗА — 1.02%; ЩО — 0.92%; ЛІГА — 0.81%; ЩЕ — 0.67%
Зі слова "ліга" зрозуміло, що усі тексти на одну тему були.
Але оскільки ("не про деяких сусідів" ) "в" та "у" є одним словом, краще було порахувати так:
У + В — 4.66%
І + Й — 2.91%
НА — 2.34%
НЕ — 1.97%
З — 1.91%
ЗА — 1.02%
ЩО — 0.92%
ЛІГА — 0.81%
ЩЕ — 0.67%
А — 0.65%
Ось так близько до послідовності [X; X/2; X/3, ...] вийшло:
www.awesomescreenshot.com...
Знайшов дані для різних мов, але тут, схоже, кожна словоформа рахується як окреме слово. І дані з онлайн-спілкування, а не статей.
invokeit.wordpress.com/fr...
Топ-100 слів у англійській-2012 — 57.07% від загальної кількості слововживань. Перша десятка: YOU, I, THE, TO, A, IT, AND, THAT, OF, IN (від 4,32% до 1,07%).
Топ-100 слів в українській-2012 — 41.68% від загальної кількості слововживань. Перша десятка: Я, НЕ, ЩО, ТИ, ЦЕ, І, НА, З, У, В (від 2,85% до 1,05%).
YOU vs Я, хе-хе.
Ты всё таки вернулся)А я думал уже ушел на всегда.С возвращением
Обрані теми
Нові повідомлення