ISSN 2224-087X (Друкована версія)
ISSN 2224-0888 (Online версія)

Збірник наукових праць "Електроніка та інформаційні технології"

(З 1966 року до 2010 року виходив під назвою "Теоретична електротехніка")

Свідоцтво про державну реєстрацію КВ № 17618-6468ПР від 11.02.2011 р.

Головна сторінка Пошук Правила оформлення статей English     Русский

Випуск 5

Випуск 5, Сторінки: 167-174
Рангові залежності та лексичні частотні спектри для підгруп слів тексту з різними довжинами
О. С. Кушнір, Л. Б. Іваніцький, М. Я. Максисько, С. В. Рихлюк
У роботі знайдено статистичний розподіл слів із англомовного тексту роману Дж. Толкіна "Володар Перснів" за їхніми довжинами. Вивчено "парціальні" залежності f(r) частоти від рангу і густини ймовірності частоти p(f) для підгруп слів окремих довжин (l = 1-16 букв), а також відповідні "об’єднані" залежності для слів усіх довжин. Установлено, що "парціальні" залежності загалом гірше описуються степеневими законами, відомими як закони Ціпфа, аніж "об’єднані". Найближчими до степеневої є функції f(r) і p(f) для проміжних довжин слів l = 5-10, які описуються показниками α≈1 для f(r) і β≈2 для p(f). Висловлено гіпотезу, що рангові залежності для найменших довжин можуть виявитися близькими до експоненційних (α→∞), схоже до функції f(r) для деяких східних мов із обмеженим словником, а рангова залежність і густина ймовірності для найбільших l - прямувати в границі відповідно до логарифмічної (α→0) і експоненційної (β→∞) функцій.
PDF-версія

Головна сторінка Пошук Правила оформлення статей English     Русский

© Львівський національний університет імені Івана Франка, 2011

Розробка програмного забезпечення та підтримка - лабораторія високопродуктивних обчислювальних систем