Разбираемся в сущности нейросетей. Что ты такое? Эпизод II. Атака клонов

Двигаемся дальше, переступая порог миллениума в попытке вникнуть в суть нейросетей. ChatGPT: удачный стартап или игрушка дьявола? «Деньги не пахнут» или «как тебе такое, Илон Маск»? Может ли цифровая женщина согреть своим теплом? Это и многое другое в новом выпуске.

Революции не случилось

С приходом нового тысячелетия изменился подход к программированию. Раньше программный код сокращали изо всех сил, лишь бы приложение

использовало как можно меньше ресурсов. Но сегодня компьютеры накопили столько вычислительной мощности, что любой ноутбук может взять пригоршню нейронов и прогнать их через миллион циклов обучения. Неудивительно, ведь по этому же принципу работают все законы природы, начиная от квантовой физики и заканчивая эволюцией.

Если из раза в раз повторять бесчисленные случайные события, отбирая самые успешные варианты, то в конечном итоге из хаоса получится упорядоченная система. В руках человечества оказался инструмент, который позволяет не ждать изменений миллиарды лет, а обучать сложные системы буквально по щелчку клавиши. В итоге современные нейросети взяли на себя все трудоемкие задачи, на которые человеку не хватило бы и жизни.

Например, до недавних пор для поиска новых лекарств ученым приходилось вручную определять, какие химические соединения можно протестировать. А сегодня с этой задачей успешно справляются нейросети, рассматривая все возможные комбинации элементов и предлагая наиболее перспективные направления для исследований.

ЧЕМ БОЛЬШЕ, ТЕМ МЕНЬШЕ

«Марк‑I» Розенблатта, основанный на первом серийном компьютере IBM 704, занимал целую комнату, весил около 9 тонн и был способен распознавать некоторые из букв английского алфавита. Суперкомпьютер IBM Deep Blue по габаритам был сравним с холодильником, весил около 1,5 тонны и мог просчитывать миллионы шахматных комбинаций. Сегодня современные смартфоны весят в среднем 300 граммов, помещаются в узком кармане брюк и при этом охватывают более широкий спектр задач с точки зрения обработки информации.

Второе пришествие

Неудивительно, что громче всех в новостях об успехах в сфере искусственного интеллекта кричат такие технологические мастодонты, как Google, IBM и Microsoft. Но их главный ресурс не деньги всего мира, хотя и без них тут не обошлось, а исполинские массивы данных, бережно собранные в огромных дата‑центрах по всей планете. Там на мощных серверах и начали обучаться нейросети.

Но новая эпоха машинного обучения по-настоящему началась только в начале 2010‑х годов. К этому моменту в интернете наконец‑то накопились те самые big data — гигантские массивы информации, которые и скармливают нейросетям для обучения. А добывать «корм» для их пропитания в эру повсеместного распространения соцсетей и смартфонов стало проще простого.

С большой силой приходят большие деньги

Одним из самых прорывных событий в сфере искусственного интеллекта является релиз в 2020 году GPT‑3 — языковой модели, разработанной компанией OpenAI и на момент выхода ставшей самой крупной и продвинутой в мире. Ее обучили на огромном количестве текстовых данных и научили выполнять разные языковые задачи.

ФАКТ

В качестве массива информации для обучения GPT‑3 использовались архивные данные интернета, английская Википедия, две крупные электронные библиотеки и наборы с текстами веб‑ссылок. И лишь 0,11 процента составляли тексты на русском языке, не способные вместить в себя всю полноту русской души.

А под конец 2022 года свет увидел ChatGPT — веб‑интерфейс, основанный на улучшенной модели GPT‑3.5. Не пройдет и пары месяцев, как он вызовет фурор публики и на отметке 100 миллионов пользователей получит статус самого быстрорастущего онлайн‑сервиса за всю историю истории. Ребята из OpenAI, кажется, и сами не предполагали такого результата.

Успех не остался незамеченным, и со всех уголков мира начал доноситься шелест рук, потираемых в предвкушении прибыли. Но, как говорится, не только лишь все смогут получать доступ к коду GPT‑3, мало кто сможет это делать. Так, в гонке в денежных мешках одержала победу «маленькая независимая» компания Microsoft, получившая в качестве призов эксклюзивную лицензию на использование модели GPT‑3 в своих продуктах и доступ к ее исходному коду. Среди остальных бегунов победила дружба: они получили доступ к сервису, но только через программный интерфейс API. За несколько месяцев после релиза OpenAI, получила десятки тысяч заявок на подключение.

Изначально компания планировала предоставлять доступ к своему интерфейсу бесплатно, но впоследствии, следуя древним догмам капиталистов, взяла и ввела платные тарифы на использование модели. К слову, один из основателей OpenAI Илон Маск высказался негативно об этой идее. «Это действительно похоже на противоположность открытому. OpenAI, по сути, захвачен Microsoft», — колко заявил он в Twitter.

ТЕМ ВРЕМЕНЕМ

Начинает сбываться и предсказание Розенблатта о самокопирующихся роботах. Такие нейросети, как Copilot и ChatGPT, научились самостоятельно писать программы. На самом деле они очень умело компилируют чужой код, которого в интернете больше, чем видео с котиками.

Армия клонов

Но самым перспективным направлением, как и полвека назад, остается задача распознавания образов. Сегодня сети не только успешно различают людей по фотографиям и определяют выражения лиц, но и сами генерируют изображения, которые по праву можно называть произведениями искусства.

И как говорится в современной пословице, «дай человеку рыбу — и он будет сыт один день, дай человеку нейросеть — и интернет заполнят миллионы сгенерированных картинок». В начале 2021‑го OpenAI выпустила первую версию нейросети DALL‑E, которая использовала текстовые данные и на их основе генерировала изображения в разных стилях.

ИНТЕРЕСНО

Название нейросети отсылает как к одному из самых знаменитых художников XX века Сальвадору Дали, так и к роботу‑уборщику WALL‑E из одноименного льтфильма 2008 года.

Даже самые ярые скептики не смогли сдержать возгласы удивления, ибо факт прорыва налицо. Особенно интересным считается то, что нейросеть получила некоторые навыки визуального мышления, позволившие ей пройти тест Рейвена, созданный для оценки интеллекта людей.

КСТАТИ

6 апреля 2022 года была анонсирована DALL‑E 2. В новой версии нейросети были доработаны алгоритмы, позволяющие создавать фотореалистичные изображения, а также встроенный редактор для внесения правок в режиме реального времени. Пример работы нейронной сети продемонстрировал журнал Cosmopolitan, который использовал DALL‑E 2 для создания обложки одного из своих выпусков.

«А в это время по всему миру — в старых гаражах и в научных институтах — вызревают новые семена конкуренции. Механизм положительной обратной связи помогает всем, а значит, нельзя почивать на лаврах: конкуренты не дремлют», — Билл Гейтс.

К середине 2022‑го в режиме бета‑тестирования стала доступна нейросеть Midjourney, а месяцем позже состоялся релиз Stable Diffusion. Сети DALL‑E и Midjourney хоть и доступны для широкого круга лиц за определенную плату, но все еще имеют под собой проприетарные корни, сдерживающие распространение.

А вот Stable Diffusion занимает особое место в новом мире. Ее авторы намеренно развивают свой проект открыто, чтобы его могло поддерживать сообщество энтузиастов. Благодаря этому уже появились тысячи модификаций на основе Stable Diffusion как от крупных организаций, так и от обычных пользователей.

Революция откладывается

Несмотря на большие достижения в сфере искусственного интеллекта, в нейросетях накопилось множество проблем. Не исключено, что за периодом бурного роста может ждать очередной застой в развитии. Главный недостаток кроется в том, что каждая сеть обучается под конкретную задачу.

Так, для нейросети, обученной на фотографиях голых женщин, написание программного кода окажется неразрешимой проблемой. Для по‑настоящему умных компьютеров требуется изобрести новый инструмент, способный объединять разные сети в один огромный массив.

Нейросети способны успешно улавливать и воспроизводить закономерности, которые неочевидны для человека. Но одну из главных проблем — понимание человеческого языка — невозможно решить простым перебором ключевых слов. А именно такого подхода до сих пор придерживаются даже самые продвинутые нейросети. Им можно объяснить правила игры в футбол, но они не способны понять радость и восклицания фанатов на трибунах после забитого мяча.

И хоть до настоящего искусственного интеллекта все еще далеко, но мы с вами уже живем в чудесное время. Машины умнеют на глазах и заодно служат людям отличным примером, потому что всегда учатся на своих ошибках.