Как работает нейросеть: объясняем простыми словами

5 минут
Как работает нейросеть: объясняем простыми словами

Рассказываем, из чего состоит нейросеть, что происходит после того, когда вы задаете вопрос, и как ее вообще научили «думать».

Архитектура ИИ: из чего состоит нейросеть

Само слово «нейросеть» отсылает нас к биологии — и не случайно: прообразом ИИ стал человеческий мозг с миллиардами взаимосвязанных между собой клеток.

Искусственная нейросеть включает в себя следующие элементы:

  • Нейрон. Базовый элемент сети, который проверяет один простой признак, делает вывод и передает информацию дальше. 

Допустим, нейросети нужно определить, самолет на фото или нет. Один нейрон смотрит только на форму крыльев, другой проверяет, есть ли турбины, а третий анализирует цвет. Поодиночке каждый видит лишь фрагмент изображения, но вместе они составляют полную картину, на основании которой могут дать ответ.

  • Вес. «Умозаключения» нейронов в разной степени влияют на ответ — за это отвечает вес. 

Например, у признака «крылья» вес большой: это сильный довод в пользу самолета. А у признака «цвет» вес маленький — самолет бывает любой окраски, этот признак почти не влияет на итоговое решение. 

Сеть суммирует выводы всех нейронов с учетом веса каждого из них, и делает вывод: да, это самолет. 

  • Слои. Каждый запрос проходит через несколько слоев:

    Вводный: принимает текст, изображение, аудиозапись и другие исходные данные.

    Скрытый: определяет суть запроса и ищет решение. Количество скрытых слоев может достигать нескольких сотен — чем их больше, тем сложнее запросы, которые обрабатывает модель. 

    Выходной: суммирует результаты работы скрытых слоев и формулирует ответ на запрос.

Как на самом деле работает нейросеть

Есть мнение, что нейросеть просто ищет информацию в интернете, копирует оттуда текст и выдает его в качестве ответа. Иногда так и происходит, но только при активации режима «Поиск в интернете»: тогда она действительно может открыть страницу и процитировать нужный фрагмент. 

В остальных случаях модель опирается только на то, что узнала при обучении, и генерирует ответ с нуля. Кстати, именно поэтому вы получаете разные формулировки на один и тот же запрос.

«Магия» нейросетей происходит благодаря их уникальной возможности находить закономерности. То есть модель не хранит тексты, изображения и другую информацию — она анализирует загруженные данные, выявляет паттерны и формулирует правила. 

Разберем по шагам, как работает нейросеть, когда отвечает на вопрос:

  1. Перевод в числа. Нейросеть не понимает слова и буквы — она работает только с числами. Поэтому сначала ваш запрос делится на короткие фрагменты — токены. Каждый такой кусочек получает свой числовой код, причем числа не случайны: у близких по смыслу слов они похожи.
  2. Обработка запроса. Числа проходят через скрытые слои, на каждом из которых нейросеть ищет закономерности с самым сильным весом, отсекая остальные варианты. 
  3. Формулирование ответа. Модель собирает набор наиболее подходящих чисел и трансформирует их обратно в текст или изображение — получается итоговый ответ.

Схема работы нейросетей

Безусловно, это упрощенное представление процесса: на деле модель одновременно определяет смысл и важность слов, сравнивает варианты, подбирает подходящие формулировки. При этом весь путь от запроса до готового письма занимает считанные секунды — хотя точное время зависит от сложности промпта и мощности модели.

Процесс обучения ИИ

Откуда сеть знает, какие признаки важны и какой вес им дать? Никто не прописывает это вручную — модель сама делает выводы во время обучения. У необученной сети все веса стоят наугад, поэтому она выдает набор случайных слов. 

Как тренируют модель:

  • Подготовка данных. Для обучения собирают датасет — массив информации, который будет выступать «учебником». Это могут быть статьи, книги, документы, изображения — чем разнообразнее материал, тем больше закономерностей уловит модель. 
  • Обучение. После обработки датасета, нейросети дают задачу: например, определить, что изображено на картинке. Она выдает свою догадку (скорее всего, ошибочную), а алгоритм проверяет, насколько сильно модель ошиблась. 
  • Корректировка. Сеть прикидывает, какие веса привели к ошибке, и слегка их меняет, чтобы в следующий раз ответ был ближе к верному.

И так миллионы раз. С каждым повтором сеть ошибается все меньше, а веса понемногу настраиваются: полезные признаки получают вес побольше, бесполезные — поменьше.  

После основного обучения нейронку часто дообучают под конкретные задачи: например, показывают примеры удачных ответов поддержки, чтобы она отвечала вежливо и по делу.