Долгое время считалось, что язык — это фундамент человеческого разума, ключ к математике, музыке и сложному социальному познанию.
Однако исследования Евгении Федоренко, нейробиолога из MIT (Массачусетского технологического института), не оставили от этой красивой теории камня на камне. Оказалось, что в мозге каждого взрослого человека работает специализированный «языковой парсер», который не имеет никакого отношения к высокоуровневому мышлению.
Но главная ирония открытия заключается в другом. Изучая эту сугубо биологическую структуру, Федоренко обнаружила ее пугающее сходство с архитектурой нейросетей искусственных — тех самых, что сегодня лежат в основе современных языковых моделей.
Даже в мире, наводненном большими языковыми моделями и умными чат-ботами, трудно смириться с тем фактом, что гладкое, связное письмо может быть продуктом бездумной машины. Для человека поиск верного слова — это неотъемлемая часть мыслительного процесса, а не изолированное действие.
Федоренко начала изучать механизмы речи в мозге взрослого человека задолго до появления ChatGPT. Она выделила специализированную структуру — так называемую «языковую сеть», которая отвечает за сопоставление слов с их значениями.
Ее исследования показывают: в некотором смысле мы действительно носим в себе биологическую версию языкового процессора. И, судя по всему, работает этот механизм так же, как и его цифровые аналоги — полностью неосознанно.
Последние 15 лет Федоренко собирает биологические доказательства существования этой системы в своей лаборатории в MIT.
В отличие от больших языковых моделей, человеческая сеть не просто комбинирует слова в правдоподобные шаблоны. Она работает как переводчик, связывая внешние стимулы — устную речь, текст или язык жестов — со смыслами, хранящимися в других отделах мозга (включая эпизодическую память и социальное познание, которыми машины не обладают).
Физически эта структура совсем невелика: если собрать все составляющие ее ткани вместе, по размеру они будут сопоставимы с клубникой.
Однако повреждение столь малого участка ведет к драматическим последствиям. Нарушение работы языковой сети вызывает различные формы афазии. Трагедия в том, что высокий интеллект и сложные когнитивные способности остаются нетронутыми, но оказываются запертыми внутри мозга. Человек теряет возможность выразить себя или вычленить смысл из потока чужой речи.
Страсть к языкам проявилась у Евгении еще в детстве. В 1980-х годах, пока она росла в Советском Союзе, по требованию матери ей пришлось освоить пять иностранных языков — английский, французский, немецкий, испанский и польский — в дополнение к родному русскому.
Юность пришлась на тяжелый период распада страны. Несмотря на лишения и даже голод, который пришлось пережить в те годы, Евгения была прилежной ученицей и добилась полной стипендии в Гарварде.
Там она поначалу планировала заниматься лингвистикой, но вскоре добавила вторую специальность — психологию. «Лингвистика была увлекательной, но больше напоминала решение абстрактных головоломок, чем попытку понять, как все устроено в реальности», — признается она.
Спустя три года аспирантуры в MIT Федоренко снова сменила курс, на этот раз уйдя в нейробиологию. Она начала работать с Нэнси Канвишер — первооткрывательницей веретенообразной извилины, области мозга, отвечающей за распознавание лиц. Федоренко поставила перед собой амбициозную цель: найти аналогичную специализированную зону для языка.
Задача оказалась непростой.
Заберите максимум новогодних подарков с 15 по 23 декабря🎁
Один день — один сюрприз: адвент-календарь со скидками до 100% на IT-инфраструктуру.
Подробнее →
Итогом многолетней работы стала статья, опубликованная в 2024 году в журнале Nature Reviews Neuroscience. В этом фундаментальном обзоре Федоренко определяет сеть обработки речи как «естественный тип» (natural kind): интегрированный набор областей, специализирующихся исключительно на языке. Эта структура, по утверждению автора, присутствует в мозге каждого типичного взрослого человека.
Багаж из шести языков, выученных в детстве, привел Федоренко сначала в лингвистику, а затем — в нейробиологию. Проведя сканирование мозга 1 400 человек, она доказала существование универсальной языковой сети. Это, по ее словам, особая «ткань, которая надежно выполняет лингвистические вычисления».
В интервью изданию Quanta Федоренко рассказала, почему сравнивает эту сеть с пищеварительной системой, что известно о «языковом декодере» и действительно ли в наших головах работают биологические аналоги больших языковых моделей. Ниже приведена отредактированная для ясности запись той беседы.
— Что такое языковая сеть?
— В мозге взрослого человека работает группа взаимосвязанных областей, отвечающая за лингвистическую структуру. Это живая база данных, где хранятся значения слов и правила их сборки. Изучая язык, вы, по сути, загружаете в себя эти инструкции и соответствия.
Система эта невероятно гибкая: она позволяет мгновенно кодировать абстрактную мысль в конкретную последовательность слов на любом известном вам языке.
— Звучит абстрактно. Вы называете эту сеть «естественным видом» (natural kind). Значит ли это, что она так же реальна, как, скажем, пищеварительная система?
— Именно так. Системы, обнаруженные нами в мозге — будь то языковая сеть или зоны зрительного восприятия, — по своей сути являются органами. Возьмите ту же веретенообразную извилину, отвечающую за лица: это четко очерченная биологическая единица.
Анатомия языковой сети тоже конкретна. У большинства людей она базируется в левом полушарии: три основные зоны в лобной доле и пара участков, тянущихся вдоль средней височной извилины.
Единство системы подтверждается тестами. Если поместить человека в сканер МРТ, мы увидим, что эти области всегда активируются синхронно, как единый механизм.
Мы обследовали уже около 1 400 человек и составили вероятностную карту. Топография у всех немного разная — индивидуальная, как отпечатки пальцев, — но общая схема неизменна. В пределах этих зон у каждого человека гарантированно присутствует ткань, которая занята исключительно лингвистическими вычислениями.
— А как же хрестоматийная зона Брока? Разве не она отвечает за речь?
— Зона Брока — территория бесконечных научных споров. Я бы вообще поостереглась называть ее языковой областью. Это скорее диспетчерская для мышц, центр артикуляционного планирования.
Прямо сейчас она занята тем, что дирижирует моим ртом, чтобы я могла издавать звуки. Нюанс в том, что ей все равно, что озвучивать: Шекспира или полную абракадабру — она включится одинаково активно.
Ее функция чисто техническая: получить звуковой образ и рассчитать, какие рычаги дернуть, чтобы мышцы его воспроизвели. Это исполнитель, которому языковая сеть просто спускает инструкции.
— Вы также сказали, что язык — это не то же самое, что мышление. Но если языковая сеть не генерирует мысли и не шевелит языком физически, то чем она вообще занята?
— Она работает посредником. По сути, это интерфейс между «низким уровнем» (сенсорика, моторика) и «высшими сферами» (абстрактные смыслы, логика).
Возьмем, к примеру, генерацию речи. Все начинается со смутной, нечеткой мысли. Чтобы вытащить ее наружу, мозг обращается к своему лингвистическому багажу. Это не просто мешок со словами, а сложная библиотека конструкций и правил их стыковки.
Мы подбираем код, чтобы упаковать эту абстрактную мысль в стройный ряд слов. И только когда такая внутренняя работа завершена, даем команду моторной системе: озвучить, написать или показать жестами.
С пониманием языка процесс разворачивается на 180 градусов. Все начинается с физики: звуковая волна ударяет в перепонку или свет падает на сетчатку.
Сначала мозг проводит первичную обработку, вычленяя из потока цепочку слов. Затем в игру вступает языковая сеть. Она сканирует полученное, находит знакомые блоки и использует их как указатели — ссылки на смыслы, хранящиеся в глубинах памяти.
В обоих режимах — и при генерации речи, и при ее восприятии — эта сеть работает как библиотека соответствий между формой и значением. Это не застывший архив, а живое, изменчивое хранилище, которое мы пополняем и обновляем на протяжении всей жизни.
Но как только код усвоен, мы получаем универсальный ключ. Можем гибко использовать его и чтобы транслировать свои идеи вовне, и чтобы дешифровать смысл чужих слов.
Зачем нужна такая сложная система? Исключительно для того, чтобы мы могли обмениваться мыслями. Телепатии ведь не существует, верно?
— Насколько глубока эта специализация? Есть ли в языковой сети уникальные клетки, которые включаются на конкретные фразы — подобно тому, как «нейроны концепций» реагируют на определенные образы?
— Я подозреваю, что обработка информации здесь скорее распределена по всей системе, ведь язык критически зависит от контекста. Но существование клеток, настроенных на отдельные языковые аспекты, вполне вероятно.
В подтверждение этому группа Ицхака Фрида из Калифорнийского университета в Лос-Анджелесе (UCLA) уже выпустила предварительную публикацию. Изучая работу отдельных нейронов, они обнаружили те же закономерности, которые мы фиксировали на уровне целых популяций с помощью МРТ и внутричерепных датчиков.
Например, выяснилось, что эти клетки абсолютно одинаково реагируют и на письменную речь, и на устную. И искать таких «универсальных солдат» следует именно в языковой сети.
Механизм распознавания объектов в мозге работает на том же уровне абстракции, что и языковая сеть. Принцип здесь почти не отличается от устройства высших зрительных зон, например, нижневисочной коры. Там хранятся «чертежи» форм, а в веретенообразной извилине — базовые шаблоны лиц. Мы используем эти заготовки, чтобы идентифицировать предметы вокруг, но сами по себе эти шаблоны оторваны от глубоких знаний о мире.
Идеальный пример — знаменитая фраза лингвиста Ноама Хомского: «Бесцветные зеленые идеи яростно спят».
Вы считываете структуру, понимаете грамматику, но не можете соотнести написанное с реальностью — в этом просто нет смысла. Тем не менее, наши исследования (как и данные других групп) доказывают: языковая сеть реагирует на подобную бессмыслицу так же активно, как и на абсолютно логичные высказывания.
Я бы не хотела называть эту систему «глупой», но она, безусловно, довольно поверхностна.
— Складывается впечатление, что вы утверждаете, будто в мозг каждого человека вшита большая языковая модель (LLM). Вы это имеете в виду?
— По сути, да. Я считаю, что наша языковая сеть поразительно похожа на ранние версии LLM. Она точно так же обучается на статистических закономерностях и запоминает, как слова цепляются друг за друга.
Представить это совсем несложно. Вы наверняка встречали людей, которые говорят невероятно бегло. Речь льется рекой, но спустя минуту вы ловите себя на мысли: «В этом нет ничего связного». Форма идеальна, а содержание нулевое. И заметьте: для такого эффекта собеседнику вовсе не обязательно иметь повреждения мозга.
— И все же мысль о том, что люди создают речь с помощью механизма, столь же бессмысленного, как ChatGPT, кажется нелогичной.
— Согласна — поначалу она казалась такой и мне! Когда я приступала к этим исследованиям, была убеждена: язык — это фундамент сложного, высокоуровневого мышления.
Существовала гипотеза, что секрет кроется в умении человека работать с иерархическими структурами. Ведь иерархия — это ключевая особенность не только языка, но и математики, музыки, социального познания. Поэтому я ожидала обнаружить в мозгу универсальные процессоры, которые обрабатывают любые сложные структуры.
Но эмпирические данные разрушили эту теорию. Еще в 2011 году стало очевидно: все компоненты этой системы узко специализированы исключительно под язык. А если вы ученый, вы просто принимаете факты, корректируете свои убеждения и работаете дальше.
Источник


