Какая нейросеть самая умная? Ранжирование искусственного интеллекта по IQ

Искусственный интеллект постепенно заполняет интернет, стабильно появляются новые возможности и он быстро развивается. Однако оценить его мощь все еще сложно. Журналист Максим Лотт опубликовал результаты IQ-тестов, в которых участвовали нейросети. Давайте разберемся, какой ИИ ближе всего к превосходству человека и что за закон Мура, о котором все сейчас говорят.

Кто лидирует?

В процессе проверки применялся визуальный IQ-тест компании Mensa. В исследовании участвовали знаменитый chat gpt-4, chat gpt-3.5, claude-3, claude-2, claude-1, bing copilot, gemini normal и gemini advanced, grok, grok fun, llama-2, random guesser.

Изначально все завалили тест и прошли на результаты умственно отсталого. Тогда журналист преобразил картинки в текст. После этого ИИ смог с этим работать.

Тест был проведен дважды, чтобы стабилизировать разброс результатов. Первое место заняла claude-3, набрав 101 балл, это среднестатистический результат для человека. На второе место ступает chat-gpt с результатом 85 баллов, этот результат тоже присущ многим людям. И топ-3 закрывает claude-2 с баллом 82.

Закон Мура

Максим Лотт предположил, что по закону Мура через 1-2 года ИИ сможет достигнуть результатов в 140 баллов на IQ-тесте. Закон Мура — количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые 24 месяца. Простым языком закон говорит о неизбежности развития технологий: чем больше они развиты на данный момент, тем в два раза быстрее они придут к новым свершениям.

Таким образом, claude-4 должен получить 120 баллов через 12-16 месяцев, а через 16-32 месяцев claude-5 получит 140 баллов.

Достоверность результатов

Стоит ли беспокоиться по поводу таких впечатляющих результатов и многообещающих прогнозов? Федор Чемашкин — технический директор компании «Яков и партнеры» — заявил, что IQ-тесты не обходятся без психоэмоционального состояния, которого у ИИ быть не может, поэтому нейросети придерживаются только заложенного в них логического мышления. Также есть подозрения, что какие-то задатки IQ-теста были применены при разработке искусственного интеллекта.

Помимо этого нейросети прошли лишь один IQ-тест, а их гораздо больше. Логичнее будет судить превосходство ИИ над человеком в прикладных задачах. То, что нейросети будут со временем только лучше проходить подобные тесты, не удивило эксперта, потому что логической части в нейросетях уделяют много времени при разработке.

Его поддерживает Мария Дорохова — сотрудница по компании и соавтор исследования «Искусственный интеллект в России — тренды и перспективы». Она назвала это исследование лишь «интересным подходом».

А директор по науке компании «Тридиви» (ГК «Папилон») Алексей Самосюк считает, что сравнивать человеческий интеллект и машинный по одинаковому тесту не несет никакого смысла, потому что это совершенно некорректно.

Прогнозы

Закон Мура очень многие подвергают критике, однако это не отменяет факта стремительного развития нейросетей. Есть еще несколько фактов, влияющих на стремительный рост в этой области.

Например, больше компаний берутся разрабатывать свои нейросети, а также сейчас в эту сферу вкладывается множество инвесторов. Соответственно, финансирование также помогает увеличивать скорость разработки искусственного интеллекта.

Заглавное фото: CQ.RU с помощью ruDALL-E