Конечные автоматы заходят в AI?

arhip1985

Client
Регистрация
31.10.2011
Сообщения
3 071
Реакции
800
Баллы
113
(статья-обзор от меня)

Последние пару лет развитие AI шло по проторенной колее, где все дороги вели в «больше»:
Больше параметров.
Больше контекста.
Больше агентов.
Больше инструментов.

RAG притащил внешние базы. Agentic AI научился дёргать за ручки API. MCP наконец-то навёл порядок в этом зоопарке.

Но, если снять розовые очки, все эти архитектуры — близнецы-братья.

Все они, как заклинание, твердят одно и то же: решение через токены.
Даже если у вас рой из сотни агентов, оркестраторов и критиков — в основе всё равно лежит языковая модель, которая просто угадывает следующий кусочек текста.
Это похоже на строительство небоскрёба путём подбрасывания кирпичей вверх — рано или поздно конструкция рухнет.

Именно на фоне этого бесконечного «токен-спамма» рождается глоток свежего воздуха. Идея проста до гениальности: вынести часть рассуждений за пределы LLM и сделать их вычислимыми.

Встречайте — SymFSM.
mapsym.png



В чём соль? Не просто ответ, а карта местности​

SymFSM не лезет в пекло с шашкой наголо. Он не генерирует текст, пока не поймёт, куда идёт.

Сначала он в режиме сканера строит когнитивную карту задачи. Это не просто набор фактов, это чертёж с вашими:

  • Целями (куда плывём);
  • Ограничениями (рифы и мели);
  • Сущностями (что у нас в трюме);
  • Зависимостями (что от чего завязано).
А затем в игру вступает слой конечных автоматов. Их задача — проверить, ведёт ли этот чертёж к выходу, до того как модель выдаст хоть один токен.

Если между пунктом «А» и пунктом «Б» пропасть — система не будет героически строить воздушный замок. Она зафиксирует разрыв и начнёт искать обходной путь математически, а не вероятностно.

И только когда структура проверена и признана годной, на сцену выпускают зверя — LLM.

В итоге мы меняем примитивную схему:

Запрос → LLM → Ответ
На инженерную:

Запрос → Когнитивная картаАвтоматы → LLM → Ответ

Почему это выворачивает привычный мир наизнанку?​

Современные агенты — это отличные исполнители. Если дать им чёткую инструкцию, они отпашут как проклятые.

Но есть одна загвоздка: они не проверяют структуру задачи.
Они плывут по течению. Агент может надергать данных из поиска, сходить в SQL, накликать в CRM и выдать красивый отчёт. Но он никогда не задастся вопросом: «А существует ли вообще путь к этому выводу?» — этот вопрос остаётся в чёрном ящике модели.

SymFSM вытаскивает этот этап наружу, делая его отдельным вычислительным слоем.
Мы перестаём гадать на кофейной гуще (токенах) и начинаем вычислять структуру рассуждений как математическую задачу.


Чем это отличается от Chain-of-Thought? Принципиально​

На первый взгляд кажется: «Ну, ещё одна схема рассуждений, как CoT или GoT».
Но разница — фундаментальная.

В Chain-of-Thought вы просто пишете модельке в промпт: «Подумай шаг за шагом». И она генерирует текст. Все эти «рассуждения» — это просто слова, пыль в контекстном окне.

В SymFSM часть структуры материализуется. Она превращается в граф состояний и переходов, который существует вне модели. С этим графом работают алгоритмы и автоматы — точные, детерминированные, без галлюцинаций.

Мы доверяем проверку структуры не вероятностной угадайке, а чистым вычислениям. Разницу чувствуете?


Почему именно конечные автоматы, а не нейросети?​

Конечные автоматы — это старая школа. Компиляторы, протоколы связи, системы управления ракетами. Надёжно, как швейцарские часы.

В SymFSM они взяты на вооружение для управления когнитивными состояниями:

  1. Анализ задачи.
  2. Поиск дыр в логике.
  3. Построение гипотез.
  4. Проверка на достижимость цели.
  5. Ремонт структуры (да, они умеют чинить логику).
  6. И только потом — генерация ответа.
Каждый шаг — это строгое состояние. Это позволяет отделить логику управления процессом от «мнения» языковой модели. Машина говорит, куда идти, а LLM просто красиво озвучивает маршрут.


Рекурсия: когда карта становится живой​

И вот тут начинается самое вкусное.

В последних версиях архитектуры разработчики добавили рекурсивное расширение карты.

Представьте: модель начала отвечать, споткнулась о нестыковку и говорит системе: «Эй, автомат, я тут наткнулась на подзапрос, построй-ка мне локальную карту для этого куска».

Получается живой цикл:

LLM → запрос на анализ → Автоматы → расширение карты → продолжение генерации
Карта перестаёт быть скучным статичным файлом в начале сессии. Она дышит, растёт и уточняется прямо на лету, пока идёт рассуждение. Это уже не просто «подумать перед ответом», это мышление в реальном времени.


Практика: работает с кем угодно​

И самое приятное — SymFSM не пытается занять трон. Это не «убийца GPT».

У него есть API, и он прекрасно уживается с более чем 150 современными моделями от любых провайдеров.
Это не замена вашему любимому чат-боту. Это инженерный щит и навигатор для него.


Это новый этап или просто игрушка?​

Скажу честно: пока рано трубить фанфары.

Но сама идея — чертовски своевременная.
Мы устали от бесконечной гонки вооружений. Устали накидывать терабайты данных и миллиарды параметров в надежде, что модель вдруг поумнеет.

SymFSM предлагает другой путь: перенос когнитивной нагрузки из вероятностной генерации в формальные вычисления.

Если этот подход выстрелит, следующий шаг эволюции AI будет заключаться не в том, чтобы сделать модель ещё больше. А в том, чтобы сделать рассуждение вычислимым объектом, а не просто потоком токенов.

И это, друзья, гораздо интереснее, чем очередной «GPT-ультра-мега-макс».

image_1781758849244.png
 
  • Спасибо
Реакции: BAZAg

Сравнение: стандартная LLM vs LLM + SymFSM​

В рамках эксперимента проводилось сравнение качества работы одной и той же модели в двух режимах:
  • стандартный режим генерации
  • режим с применением SymFSM
Для оценки использовался бенчмарк GPQA Main, содержащий 448 сложных вопросов с вариантами ответов из областей биологии, физики и химии. Каждый вопрос представлял собой multiple-choice задачу с четырьмя вариантами ответа, где требовалось выбрать только один правильный вариант.

📊 Результаты​

РежимПравильных ответовТочность
Стандартная LLM282 из 44862,95%
LLM + SymFSM314 из 44870,09%

📈 Улучшение​

Применение SymFSM увеличило точность на 7,14 процентных пункта при одинаковом наборе тестовых данных.
 
Может есть пример шаблона для зенно для решения какой-то простой задачи с использованием описанных подходов-методов?
 
Может есть пример шаблона для зенно для решения какой-то простой задачи с использованием описанных подходов-методов?
для простых задач достаточно ЛЛМ-ки без всяких стероидов. Это больше для сложных и аналитических задач. Могу рассказать, где дало качество x100: требовалось ответить в переписке, поставил запрос так, чтобы придумало не просто как ответить, а так, что после этого ответа - диалог продолжился так-то и так-то, потом загрузил всю цепочку раннее произошедшей переписки и получил требуемый результат. (модель без SymFSM выдала хорошо составленный вариант, а та же модель через SymFSM - выдала вариант с формулировками, которые дают результат требуемый в виде ответа на это письмо)
 
Последнее редактирование:
  • Спасибо
Реакции: BAZAg
в зеннопостере можно использовать через гет запросы к программе (можно локально запустить апи или на выделенный сервер поставить)
апи.png
 
кухня инновации на изображении - официальная страница приложения для Windows - https://principium.pro/ru/symfsm-2/


image_1782035114896.png
 
в рамках текущих реалий

Красивый ответ. А на деле нейро текст + нейро картинки + пара скринов по которым ничего не понятно.
Букв много, но за ними вашего продукта не видно.
 
Раз здесь публикуете - действительно хотелось бы пример использования со связкой c ZP, из текста что написали - не понял, а зачем оно мне?
 
Красивый ответ. А на деле нейро текст + нейро картинки + пара скринов по которым ничего не понятно.
Букв много, но за ними вашего продукта не видно.
суть в двух словах - надо без галюцинаций - надо контролировать - тут контролируется через автоматы - просчётом и построением логики рассуждения и дальнейшей верификацией через автоматы (есть такое понятие в алгоритмах).
Получается что контролируют обычно - через другого агента - т.е. LLM контролирует LLM, а тут алгоритмы дают карту LLM заранее проверенную - чтобы пути были достижимы, и потом проверяют результат тоже автоматы, LLM пишет по заранее выстроенному маршруту, и потом исправляет по выстроенным маршрутам. но если не интересно, то оно и коротко не интересно, а когда интересно - то нейросеть описала более подробно
 
Раз здесь публикуете - действительно хотелось бы пример использования со связкой c ZP, из текста что написали - не понял, а зачем оно мне?
любые ваши запросы, которые вы отправляете обычной LLM, но которые требуют большего качества ответов, которые критически важны - можно отправлять в SymFSM (выбрав предварительно любую из 156 моделей)
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)