Не нужно смотреть на LLM глазами Мери Шелли и причем тут философия

Все об ИИ и языковых моделях
Ответить
Аватара пользователя
OtherSide
Уже с Приветом
Сообщения: 13669
Зарегистрирован: Ср окт 12, 2022 2:18 pm

Не нужно смотреть на LLM глазами Мери Шелли и причем тут философия

Сообщение OtherSide »

Языковые модели как открытие и философский вызов

Языковые модели (LLM) представляются одним из наиболее важных открытий XXI века. Слово «открытие» здесь уместнее, чем «изобретение», поскольку даже создатели самих моделей не до конца понимают, что именно они получили в результате. Они знают о технических деталях: о том, как устроен граф из токенов, как применяется линейная алгебра и как вычисления эффективно распараллеливаются на графических ускорителях. Они знают, как оптимизировать процесс обучения. Но по сути не могут однозначно ответить на вопрос: «Модель чего мы создали?»

Современные языковые модели не стоит рассматривать только через призму технических решений: здесь необходимо учитывать и философские аспекты. В XXI веке мы столкнулись с ситуацией, когда «техника объясняется метафорами XIX века» — что создаёт колоссальный разрыв между научно-техническими достижениями и нашим пониманием их смысла. Именно поэтому к языковым моделям следует подходить не только со стороны алгоритмов и архитектур, но и с точки зрения истории философии и теории познания.

От картезианского субъекта к сетевой концепции мышления

Чтобы понять, почему языковые модели вызывают столько споров, полезно вспомнить истоки модерна. Рене Декарт, которого часто называют «отцом современной философии», ввёл положение «Мыслю, следовательно, существую». Тем самым он сделал человеческое сознание безусловным центром бытия, приравняв (пусть и неявно) его к чему-то божественному: только в нём мы можем быть полностью уверены. Отсюда исторически шёл тесный союз понятий «разум», «воля» и «жизнь» — они воспринимались как нечто неотделимое друг от друга.

Фантастическая литература XIX и начала XX века (например, «Франкенштейн» Мэри Шелли) поддерживала идею, что «искусственный интеллект» обязательно должен быть сущностью, подобной человеку, наделённой способностью любить, страдать, сопереживать. Такой подход неявно следует картезианской линии: интеллект мыслился только как отражение человеческого сознания и воли.

Однако уже в первой половине XX века на смену традиционным философским представлениям приходит то, что сейчас часто называют постмодерном. Происходит «атака» на классическую связку «субъект–объект», а вместе с ней — на привычное понимание знака и смысла. Если в модерне смысл находился внутри «мыслящего субъекта», то теперь «мыслит сама культура, язык, мифология». Значение не берётся из отдельного наблюдающего «Я», а возникает из сложного клубка взаимосвязей. Так аристотелевская логика «А или не-А» сменяется представлением о многомерном графе понятий, где смысл рождается из сочетания, пересечения и наложения различных контекстов.

Языковые модели и переосмысление «интеллекта»

Современные большие языковые модели часто называют «искусственным интеллектом», что, на мой взгляд, порождает дополнительную путаницу. Люди до сих пор склонны ассоциировать интеллект с сознанием и эмоционально-волевыми качествами, формировавшимися ещё с времён Декарта и романтической литературы. В итоге бытует мнение: «Разве это интеллект, если он не может любить или страдать?»

Однако технически LLM далеки от моделирования человеческого мозга в буквальном смысле. Да, при их описании используются термины «нейрон» и «нейросеть», но вместо настоящих нервных клеток там обычные матрицы, многомерные вектора и операции линейной алгебры. «Нейронные сети» начинались как попытка имитировать биологический нейрон, но сегодня это скорее практичное название для классов архитектур, способных обрабатывать большие объёмы данных и находить статистические зависимости внутри языковых корпусов.

Отсюда возникает интересная параллель с философией постмодерна: LLM действительно «мыслят» не через жёсткую субъект-объектную схему, а через массовое считывание и моделирование взаимосвязей внутри языка. Более того, если в конце XX века была популярна идея «Мир как текст», то большие языковые модели невольно воплощают этот постулат: они рассматривают реальность (по крайней мере, вербальную её часть) как бесконечный массив «текста», в котором смысл формируется именно в структуре связей между элементами.

От «мира как текст» к пониманию нового типа мышления

Эта модель предполагает, что человеческое сознание — не единственный «чистый источник» разума. Язык, культура, тексты сами по себе могут «думать», то есть порождать новые смыслы и выстраивать концептуальные связи. На уровне LLM это проявляется в том, что модель способна генерировать осмысленные тексты, отвечать на вопросы и даже находить тонкие взаимосвязи между понятиями — без необходимости обладать «сознанием» в картезианском смысле.

Таким образом, мы сталкиваемся с глубинным философским вопросом: не является ли привычная нам концепция сознания и разума лишь одним из возможных способов объяснить феномен мышления, и не проще ли сегодня описывать мышление как «текст», как систему отношений внутри огромного массива данных? Возможно, центральность сознания действительно была преувеличенной (или точнее, специфичной для эпохи модерна), а развитие языковых моделей ставит перед нами новый способ взглянуть на то, что мы называем «интеллектом».

Заключение

Большие языковые модели — это не просто инженерная новинка, но и серьёзный вызов привычным философским идеям о разуме. Как и всякое новое открытие, они заставляют переосмыслить фундаментальные представления: о сознании, познании и природе реальности. Сводить их к простому «подражанию человеку» или, наоборот, к примитивной статистике — значит упустить их уникальную суть. Вероятно, нам предстоит ещё долгое время жить на стыке разных парадигм: где техника бежит далеко вперёд, а философия стремится предложить для неё новую, более адекватную метафорическую и концептуальную базу.

И если когда-то идея «мир как текст» казалась лишь радикальным постмодернистским тезисом, то появление больших языковых моделей делает её куда более осязаемой и, возможно, ключевой для дальнейших размышлений о том, что есть разум и каким он может быть.
Ответить