Крайнее обновление версии программы от 27 июня 2026 года
Число Рейнольдса спектрограммы как новый инвариант для анализа аудиосигналов
Просто о сложном и важном.
Все вяжется с железной математической логикой:
Центральная предельная теорема — это одна из ключевых теорем, по которой мы можем понять что такое идеальный звук.
Если ваш трек нарушает эту теорему, программа покажет это и трек гарантированно не пролетит мимо топа.
1. Что такое Предельная теорема на языке звука?
Центральная предельная теорема (ЦПТ) гласит: если смешать огромное количество случайных, независимых звуков,
их общая сумма на выходе ВСЕГДА образует идеальную, плавную кривую Гаусса.
* Живой эталон: Когда вы слушаете живой оркестр в зале, миллиарды звуковых волн,
отражений от стен и колебаний воздуха смешиваются по закону ЦПТ.
Человеческое ухо миллионы лет росло в этой среде.
Для нашего мозга «Гаусс» — это синоним слов «естественно», «живо», «дорого» и «приятно».
2. Чем «плохой Гаусс» опасен для трека?
Слушатель не знает математики, но его обмануть нельзя.
На подсознательном уровне мозг мгновенно считывает сломанную геометрию звука:
* Появляется так называемая «слуховая усталость».
* Трек хочется сделать потише или просто переключить его через 30 секунд.........
О Проекте и Краткая история
===========================================================
Анализатор потоков — бесплатная программа 5 версии.
Мы верим, что хороший звук должен быть доступен каждому.
Никакой регистрации, никаких ограничений.
Предыдущие версии 1–4 остаются закрытыми лабораторными
прототипами из-за чрезвычайно сложной математики и топологии,
несовместимых с работой на пользовательских системах.
Весь накопленный опыт мы упаковали в этот Анализатор потоков 5 версии.
Одна кнопка. Одна ручка. Магия внутри.
===========================================================
Дата: май 2026
ТОПОЛОГИЧЕСКАЯ ТЕОРИЯ КАЧЕСТВА ЗВУКА: ОТ РЕКИ ДО ПЕРЕСТРОЙКИ МОРСА
Аннотация
Представлен новый подход к анализу и обработке аудиосигналов, основанный на гидродинамической аналогии и топологии спектрограмм.
Вместо традиционной эквализации и компрессии, система управляет «склеенностью», энтропией и фрактальной фрагментацией звука.
Ключевая идея: спектрограмма трактуется как рельеф, а звук – как течение воды.
С помощью потока и инвариантов (числа Бетти, эйлерова характеристика) измеряется «турбулентность» и «гауссовость».
Затем с помощью полиномиальной сатурации (перестройки Морса) топологические свойства референсного трека переносятся на целевой.
Экспериментально показано, что розовый шум является математической утопией – идеальным донором топологической архитектуры.
Наилучший практический результат даёт связка ReferenceStyleTransfer3 с Утопией;
упрощённые полиномы (AsymmetricTube, HoleCreator8)
также обеспечивают качественное музыкальное насыщение.
В работе также исследованы десятки полиномов и сплайнов, предложен метод «бесконечно малых вариаций»
для управляемого рождения новых полиномов.
1. Введение: звук как река
Мы используем метафору: трек – это река.
Русло – частотный диапазон, скорость течения – спектральный поток (движение энергии во времени).
Водовороты и турбулентность – это резкие нелинейные изменения (число Рейнольдса).
Ламинарное течение – гладкий, предсказуемый звук.
Пороги, островки и перекаты – это спектральные «дыры» (Betti-1) и фрактальная изрезанность.
Когда множество маленьких ручейков сливаются в единый поток – это высокая «склеенность» (монолитный звук).
Когда река разбивается на множество русел и заводей – высокая фрагментация, характерная для живых записей.
1.1. Звукорежиссёр, слушатель и река
Звукорежиссёр стоит на берегу и настраивает потоки: сужает русло (увеличивая склеенность),
убирает камни (клиппинг), создаёт пороги (повышая Betti-1).
Он смотрит на цифры – уровни воды, скорости, турбулентность – и приближает картину к идеалу
(или к машинному эталону – Утопии).
Слушатель либо плывёт по реке, погружаясь в поток, либо стоит на берегу и наблюдает.
Первому важна «живая» турбулентность и фрагментация, второму – порядок и предсказуемость.
Задача звукорежиссёра – настроить реку под нужный тип восприятия.
2. Гидродинамическая модель спектрограммы
Спектрограмма F(t,f) – двумерная поверхность, где высота – амплитуда. В каждой точке:
- Градиент – аналог скорости течения.
- Лапласиан – аналог вязкости.
- Число Рейнольдса Re = |∇A|/(|ΔA|+ε). Высокое Re – турбулентный звук, низкое – ламинарный.
3. Топологические инварианты
Бинаризованная по уровню -40 дБ спектрограмма – чёрно-белая картинка «островов звука» и «озёр тишины».
- Betti-0 – количество связных островов.
- Betti-1 – количество озёр (дыр), полностью окружённых звуком.
- Эйлерова характеристика χ = (#островов) - (#дыр).
- Фрактальная размерность D – изрезанность границ (ближе к 2 – «лохматый» спектр).
- Гауссовость – KL-дивергенция распределения амплитуд от нормального.
Чем ближе к нулю, тем более «гауссов» звук (как сумма многих независимых событий).
4. Центральная предельная теорема
Распределение амплитуд стремится к нормальному тогда и только тогда,
когда спектрограмма состоит из множества мелких,
независимых, короткоживущих островов с высокой Betti-1.
Этим объясняется, почему розовый шум (сумма независимых флуктуаций)
почти идеально гауссов (KL≈0.001), а чистый тон или белый шум – нет.
4.1. Экспериментальное подтверждение
При росте Betti-1 с 335 до 764 (после обработки Утопией) KL уменьшилась с 0.0583 до 0.0549.
Чистый тон (Betti-1=0) имеет KL≈0.49 – прямое следствие ЦПТ.
5. Измерение склеенности: поток
Итеративный процесс сглаживания поверхности (аналог распространения тепла) изменяет кривизну.
Коэффициент связности = (количество островов после сглаживания)/(количество до сглаживания).
Если он близок к 0 – река была турбулентной, если к 1 – гладкой.
5.1. Как исключить сингулярность (камень на дороге)
Представьте, что вы едете по горной дороге.
Внезапно на пути возникает камень — он преграждает движение.
Можно выйти, убрать камень и продолжить путь.
В классическом потоке сингулярности — это такие же камни.
Способ исключить сингулярности:
вырезать область с бесконечной кривизной, заклеить отверстие и запустить поток снова.
В нашей дискретной модели мы используем тот же принцип: когда замечаем нежелательный эффект (клиппинг, излишнюю склеенность),
мы исключаем эту проблему — применяем полиномиальную сатурацию или сглаживание.
5.2. Тензор кривизны: дискретные аналоги и численные фильтры
Мы не вычисляем полный тензор.
Вместо этого используем дискретные характеристики: градиент, гауссову кривизну, лапласиан.
Для оценки «ламинарности» полинома введены численные критерии отбора:
- Монотонность: P'(x) > 0 на [-1,1].
- Единственный перегиб (одна смена знака P''(x)).
- Максимальная вторая производная |P''(x)| < 5.0.
Все «хорошие» полиномы (AsymmetricTube, ArctanApprox, HoleCreator8, Tanh)
им удовлетворяют; «плохие» (ExtremeEven12, ChebyshevMix) – нет.
5.3. Сравнение полиномов и сплайнов
Исследованы кубические сплайны Эрмита с параметрами gain и a.
На треке сплайны показали ухудшение KL (0.0583 → 0.07-0.08) и неудовлетворительное звучание.
Вывод: сплайны непригодны для мастеринга на эталонных треках; предпочтение следует отдавать проверенным полиномам.
5.4. Оптимальная граница высокочастотного фильтра
Экспериментально установлено, что для стандартных треков (44.1 кГц) оптимальной верхней границей полосового фильтра в
сатураторе является 15000 Гц.
При расширении до 20000 Гц топологические метрики (KL, Betti-1, энтропия) практически не меняются,
однако субъективное качество ухудшается из-за интермодуляционных искажений,
возникающих при взаимодействии ультразвуковых компонент
(присутствующих в некоторых записях) с нелинейностью полинома.
Таким образом, значение 15000 Гц рекомендуется как безопасное по умолчанию.
6. Перестройка Морса и хирургия полиномов
В дифференциальной топологии перестройка Морса – изменение многообразия при переходе через критическую точку.
В нашей модели мы создаём или уничтожаем критические точки с помощью полиномов HoleCreator8 (добавляем дыры)
или сглаживающих фильтров (удаляем дыры).
6.1. Перестройка Морса через микро-вариации полиномов
Вдохновившись идеей «бесконечно малой хирургии», разработан класс HarmonicTweaker для контролируемого рождения новых полиномов:
- Выбирается базовый полином (например, AsymmetricTube).
- Задаётся степень коэффициента и желаемое изменение амплитуды гармоники (например, +5%).
- Численно оценивается чувствительность ∂H/∂a.
- Вычисляется Δa = (p·H) / (∂H/∂a).
- Новый полином нормируется и регистрируется.
Эксперимент на NS показал, что микро-вариации (порядка 0.001) не ухудшают KL и субъективное качество,
но дают разную «окраску» звука.
//--------------------------------------------------------------------------------
7. Управление хаосом: энтропия
В процессе потока оцениваем энтропию (информационную насыщенность) спектрограммы.
Высокая энтропия – частые смены паттернов (турбулентность), низкая – монотонность.
При переносе стиля приближаем энтропию целевого трека к эталонной.
8. Reference Style Transfer закрытая лабораторная разработка
Алгоритм (ReferenceStyleTransfer3/4) измеряет 5–11 топологических метрик у целевого трека и референса,
итеративно подбирает силы трёх полосных полиномов, добиваясь приближения метрик к референсным.
9. Утопия – идеальный референс
Синтезированный розовый шум с реверберацией и асимметричным насыщением обладает KL≈0.001,
Betti-1≈500-600, низкой склеенностью (0.07).
Добавление Утопии на -42 дБ улучшает гауссовость реального трека, повышает Betti-1.
10. Экспериментальные результаты
10.1. Первые испытания
На треке NS после обработки Утопией: Betti-1 вырос с 335 до 764, KL уменьшилась с 0.0583 до 0.0549,
энтропия выросла с 6.98 до 7.94 бит.
10.2. Сравнение доноров топологии: Утопия vs запись 1977 года
Утопия дала Betti-1=764 (у референса 472), энтропию 7.94 (у референса 7.35),
фрактальную размерность 1.9135 (у референса 1.8510).
Утопия оказалась лучшим донором топологии.
10.3. Исследование полиномов и сплайнов
Протестировано 12 полиномов и сплайны. «Хорошие» полиномы (AsymmetricTube, ArctanApprox, HoleCreator8, Tanh)
обладают монотонной производной, одним перегибом и |P''(x)|<5.
«Плохие» (ExtremeEven12, InverseDynamic, ChebyshevMix) не удовлетворяют этим критериям.
Сплайны ухудшают гауссовость на NS.
10.4. Микро-вариации полиномов
Созданы клоны AsymmetricTube с изменением коэффициента a₃ на ≈0.001.
На NS они сохранили KL=0.0583 и дали новую окраску звука.
10.6. Влияние границы highFreq
При сравнении обработки одного и того же трека с highFreq=15000 и 20000 Гц топологические метрики (KL,Betti-1,энтропия)
практически не изменились (различия менее 1%).
Однако субъективно вариант с 15000 Гц звучит чище.
Рекомендуемое значение по умолчанию – 15000 Гц.
Заключение
Предложена целостная топологическая теория качества звука, включающая гидродинамические и топологические инварианты,
центральную предельную теорему для спектрограммы,
численные критерии отбора полиномов, метод бесконечно малых вариаций, гармонический анализатор,
нелинейный поток с tanh-ограничением и экспериментально обоснованную границу высокочастотного фильтра.
Практическая реализация доказывает работоспособность подхода.
//---------------------------------------------------------
Дата: май 2026
===========================================================
УТОПИЯ: НАСЛЕДИЕ ВЕРСИИ 3 В АНАЛИЗАТОРЕ ПОТОКОВ
===========================================================
ПРОИСХОЖДЕНИЕ
-----------------------------------------------------------
Утопия была открыта и реализована в 3 версии— закрытом лабораторном
прототипе с полным многополосным спектральным анализом,
топологической персистентностью в реальном времени и STFT-ресинтезом
с перекрытием 8x.
3 вычисляла поток на полной спектрограмме (4096×N)
и строила персистентные диаграммы для каждого частотного диапазона
ОТДЕЛЬНО. Это позволяло менять ровно 10% трека с хирургической
точностью — по диапазонам, по времени, по персистентности.
3 НЕ ПУБЛИКУЕТСЯ.
Причина: чрезвычайно сложная математика и топология.
Вычислительные требования 3 несовместимы с работой
на пользовательских системах в реальном времени.
Обработка одного трека занимала долгое время.
ЧТО ПЕРЕШЛО В НОВУЮ ВЕРСИЮ
---------------------------------------------------------
Анализатор потоков унаследовал от 3:
1. ХИТ-ПАРАД ФОРМУЛ — все формулы класса Утопия,
обнаруженные в 3, перенесены в 5 как пресеты.
2. ОСНОВНЫЕ МЕТРИКИ — L2, персистентный L2, кривизна,
число Рейнольдса, энтропия. Вычисляются постфактум
для анализа, но не используются в реальном времени.
3. ПРИНЦИП 10% — формулы класса Утопия меняют микро-топологию
спектрограммы, сохраняя макро-динамику. В 5 это достигается
подбором drive, а не полным топологическим
анализом как в 3.
ЧТО ОСТАЛОСЬ В 3 (недоступно)
---------------------------------------------------------
- Полный поток с хирургией
- Персистентная гомология в реальном времени
- Функция Морса на спектрограмме с отслеживанием
рождения/смерти критических точек
- Многополосная Утопия (разные формулы для разных диапазонов)
- STFT-ресинтез с перекрытием 8x и фазовой коррекцией
- Адаптивная Утопия (формула подбирается под каждый кадр)
ПОЧЕМУ 3 ЗАКРЫТА
---------------------------------------------------------
Официальная версия:
"Чрезвычайно сложная математика и топология, несовместимые
с работой на пользовательских системах."
Техническая правда:
3 требовала вычисления персистентных диаграмм для каждого
частотного диапазона на каждом кадре. Сложность O(N³ log N)
по количеству частотных бинов. На треке длиной 5 минут
это миллиарды операций. Даже с оптимизациями очень долго.
5 делает то же самое за O(N log N) путём
предварительно подобранных формул и одного прохода.
ЧТО ЭТО ЗНАЧИТ.....
---------------------------------------------------------
3 была экспериментальной платформой для проверки гипотез:
- Можно ли управлять звуком через поток ? → ДА
- Можно ли менять ровно 10% трека? → ДА (Утопия)
- Можно ли это делать в реальном времени? → НЕТ (пока)
5 — практический результат: берём лучшее из 3,
упаковываем в быстрый алгоритм.
Для всех 3 остаётся легендой: лаборатория, где
теория Морса, потоки и топологическая персистентность
впервые были применены к звуку. Все результаты 3 подтверждены
и воспроизведены в 5 на тех же тестовых треках.
ИСТОРИЧЕСКАЯ СПРАВКА
--------------------------------------------------------------------------------
1: базовый waveshaper, одна формула
2: многополосный, 3 диапазона
3: полный топологический анализ, Утопия (ЗАКРЫТА)
4: оптимизация RT3, частичный успех (ЗАКРЫТА)
5: публичная версия
================================================================================
================================================================================
ПАМЯТКА ПО ФУНКЦИЯМ И ХИТ-ПАРАД ФОРМУЛ
================================================================================
Дата: май 2026
Контекст: итоги тестирования на треке untitled26
Режим: Direct (mode=1), пост-нормализация modenormalize=ON, targetPeak=-3 dBFS
================================================================================
1. ДОСТУПНЫЕ МАТЕМАТИЧЕСКИЕ ФУНКЦИИ
================================================================================
Функция Синтаксис Примечание
------------------------------------------------------------------------
Синус sin(x) Мягкие нечётные гармоники
Косинус cos(x) ⚠ Чётная, DC-смещение
Тангенс tan(x) Агрессивные гармоники, защита от pi/2
Арктангенс atan(x) Нормирован: atan(x)*2/pi → выход [-1, 1]
Арксинус asin(x) Нормирован: asin(x)*2/pi, клиппинг ±1
Экспонента exp(x) Гауссовы окна, сглаживание
Степень x^N Целочисленные и дробные показатели
Корень sqrt(x) sqrt(abs(x)) для безопасности
Модуль abs(x) Для асимметричных искажений
Знак sign(x) -1, 0, +1
Гиперб. тангенс tanh(x) Плавный клиппинг
Логарифм log(x) log(abs(x))
Константы: pi, e
================================================================================
2. ХИТ-ПАРАД ФОРМУЛ (по L2 — топологической близости к референсу)
================================================================================
🥇 ARCTAN SMOOTH — сверхгладкий невидимый
Формула: atan(pi*x/2)*2/pi
Drive: 0.50
L2: 0.042 (РЕКОРД)
EQ: нет отклонений
Для: невидимый мастеринг, максимальное сохранение текстуры
🥈 БАРХАТ (VELVET) — мягкая невидимость
Формула: x - 0.3*x^3
Drive: 0.50
L2: 0.075
KL: почти идентичен референсу
Для: лёгкое сжатие пиков без окраски
🥉 ПРИЗРАК (GHOST) — прозрачная компрессия
Формула: Arcsin[1.0, 0.1] (через WaveshaperType.Arcsin)
Drive: 0.30–0.50
L2: 0.114
Для: чистая динамическая обработка без изменения текстуры
4. ГАУСС-ОКНО ШИРОКОЕ — невидимое смягчение верха
Формула: x*exp(-x^2/0.8)
Drive: 0.20
L2: 0.146
EQ: нет отклонений
Персист. L2: 0.0006 (РЕКОРД)
Для: убрать резкость верха, сохранить воздух
5. ГАУСС-ОКНО УЗКОЕ — заметное смягчение верха
Формула: x*exp(-x^2/0.3)
Drive: 0.20–0.50
EQ: 16255 Hz: +2.7 dB (при drive 0.50)
Для: явное смягчение верха, де-эссер
6. ГАУССОВ МОЛОТ — текстурный хамелеон
Формула: x - 0.3*x*exp(-2*x^2)
Drive: 0.50–0.70
L2: 0.204–0.368
Для: творческая обработка, «перековка» звука
7. FORGE SIN+TAN — резкий генератор текстуры
Формула: x + 0.1*sin(pi*x) + 0.05*tan(pi*x/2)
Drive: 0.50
Кривизна: ~20 (прогноз)
Для: агрессивная окраска, Lo-Fi
================================================================================
3. МАТРИЦА ВЫБОРА ФОРМУЛЫ
================================================================================
Задача Формула Drive
------------------------------------------------------------------------
Максимальная невидимость atan(pi*x/2)*2/pi 0.50
Лёгкое сжатие без окраски x - 0.3*x^3 0.30–0.50
Прозрачная компрессия Arcsin[1.0, 0.1] 0.30
Невидимое смягчение верха x*exp(-x^2/0.8) 0.20
Заметное смягчение верха x*exp(-x^2/0.3) 0.20–0.50
Творческая ковка x - 0.3*x*exp(-2*x^2) 0.50–0.70
Агрессивная окраска x + 0.1*sin(pi*x) + 0.50
0.05*tan(pi*x/2)
================================================================================
4. РЕКОМЕНДАЦИИ ПО DRIVE
================================================================================
Drive Уровень воздействия
--------------------------------------------------------------------------------
0.10–0.30 Минимальное, почти незаметное
0.30–0.50 Умеренное, слышимое, но чистое
0.50–0.80 Заметное, творческое
0.80–1.20 Агрессивное, спецэффекты
================================================================================
5. ПРАВИЛА ХОРОШЕЙ ФОРМУЛЫ
================================================================================
1. f(0) = 0 — проходит через ноль (нет DC-смещения)
2. Нечётность — для чистого спектра без чётных артефактов
3. Ограничение — формула не должна улетать в бесконечность при x ∈ [-1, 1]
4. Предупреждения, не запреты — cos, x^8 работают, но с предупреждением
================================================================================
6. ОСНОВНЫЕ МЕТРИКИ (эталонные значения)
================================================================================
Метрика Идеал Описание
---------------------------------------------------------------------------------
L2 < 0.05 Топологическая близость к референсу
KL 0.003–0.008 Близость к гауссову распределению
Кривизна ~5–7 Гладкость микро-текстуры
Рейнольдс ~7–9 Динамическая турбулентность
Персистентные L2 < 0.005 Устойчивость спектральных структур
Спектральный поток 0.0 дБ разницы Сохранение микро-динамики
===========================================================
ПАМЯТКА: ПОТОК
===========================================================
Дата: 19 мая 2026
===========================================================
ЧТО ТАКОЕ ПОТОК В КОНТЕКСТЕ АУДИО
-----------------------------------------
Это наш способ адаптивного сглаживания звука.
Аналогия проста: если сигнал — это поверхность,
то наш поток «нагревает» её неравномерно — сильнее там,
где есть острые пики (большая кривизна), и слабее там, где поверхность почти плоская.
В контексте звука:
• Сигнал рассматривается как линия (одномерная кривая).
• Кривизна в точке — это вторая производная (лапласиан).
• Поток «разглаживает» участки с высокой кривизной,
сохраняя участки с низкой кривизной почти нетронутыми.
===========================================================
ДИСКРЕТНЫЙ ЛАПЛАСИАН (ОПЕРАТОР КРИВИЗНЫ)
===========================================================
Симметричный лапласиан (использует прошлое и будущее):
curvature = (xp1 - 2*x + x1) / 4
Где:
xp1 — следующий семпл (будущее)
x — текущий семпл
x1 — предыдущий семпл (прошлое)
Для чистого синуса кривизна мала.
Для резкого щелчка или атаки — кривизна велика.
===========================================================
ФОРМУЛА ПОТОКА (АДАПТИВНОЕ СГЛАЖИВАНИЕ)
===========================================================
Проверенная формула:
x + 0.2 * abs(xp1 - 2*x + x1) * (xp1 - 2*x + x1)
Разбор:
(xp1 - 2*x + x1) — лапласиан (может быть + или -)
abs(...) — модуль лапласиана (всегда >= 0)
0.2 * abs(...) * (...) — скорость сглаживания пропорциональна
КВАДРАТУ кривизны
Свойства:
• Плавные участки (синус, ровный тон) — почти не меняются
• Резкие атаки, щелчки, перепады — сильно сглаживаются
• Не меняет частотный баланс (SpectralDifference ≈ 0 dB)
• Сохраняет долгоживущие структуры (персистентный L2 ~ 0.006)
• Добавляет микро-текстуру (+42% обогащение по DifferenceProfile)
===========================================================
РЕЗУЛЬТАТЫ ТЕСТА (untitled26)
===========================================================
SpectralDifferenceAnalyzer: 0.02 dB (идентично)
Персистентный L2: 0.006604 (близко к Утопии)
Фрактальная D: +0.0008 (идентично)
Когнитивная нагрузка: 0.0212 (идентично)
Корреляция потока: 1.0000
===========================================================
ВАРИАНТЫ ФОРМУЛ
===========================================================
1. Простейший поток:
x + 0.1 * (xp1 - 2*x + x1)
→ мягкое линейное сглаживание
2. Адаптивный поток :
x + 0.2 * abs(xp1 - 2*x + x1) * (xp1 - 2*x + x1)
→ квадратичная зависимость от кривизны
3. С защитой от перегрузки:
clamp(x + 0.2 * abs(xp1-2*x+x1)*(xp1-2*x+x1), -1.0, 1.0)
4. Односторонний (только прошлое):
x + 0.2 * abs(x1 - 2*x2 + x3) * (x1 - 2*x2 + x3)
→ работает без предзаполнения буфера
===========================================================
ЧТО НУЖНО ДЛЯ РАБОТЫ
===========================================================
Обязательно:
• Переменные xp1..xp8 (будущие семплы)
• Переменные x1..x8 (прошлые семплы)
Email: admin@pianoscript.ru
Политика конфиденциальности