Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко используются людьми по всему миру для получения информации, а также для обобщения, анализа и создания текстов.
Исследования, изучающие ответы, предоставляемые LLM в различных сценариях, могут помочь глубже понять их тенденции во время социальных взаимодействий, что может способствовать их будущему развитию. Исследователи из Института ИИ, ориентированного на человека, имени Гельмгольца в Мюнхене, Института биологической кибернетики Макса Планка и Тюбингенского университета недавно приступили к изучению того, как ведут себя разные LLM, когда они взаимодействуют друг с другом, в частности, во время игры в различные кооперативные или конкурентные игры.
Их выводы, опубликованные в Nature Human Behaviour , предполагают, что, хотя LLM не очень хорошо справляются с играми, требующими координации, есть способы сделать их взаимодействие во время игры в эти игры более похожим на человеческое.
«На эту работу меня вдохновил простой, но важный вопрос: если LLM собираются взаимодействовать с людьми и друг с другом в реальных приложениях, насколько хорошо они на самом деле понимают социальную динамику?» — рассказала Элиф Аката, первый автор статьи.
«Мы опирались на поведенческую теорию игр — математический подход, позволяющий понять, как люди принимают стратегические решения в интерактивных ситуациях, — и применили его к магистрам права».
Многие недавние исследования оценивали производительность LLM по конкретным задачам, таким как резюмирование текстов или поиск логических решений проблем.
Вместо того, чтобы оценивать производительность этих моделей по отдельным задачам, Аката и ее коллеги хотели лучше понять, как они ведут себя во время взаимодействий, которые гораздо ближе к разговорам, которые люди могут вести друг с другом в реальных условиях.
«Мы позволили разным LLM, включая GPT-4, Claude 2 и Llama 2, сыграть сотни раундов классических игр для двух игроков (например, «Дилемма заключенного» и «Битва полов») друг с другом, используя простые вручную закодированные стратегии или с участием людей», — объяснил Аката.
«Каждая игра игралась многократно, чтобы имитировать постоянное взаимодействие.
Мы изучали, могут ли модели научиться сотрудничать или координировать свои действия с течением времени, и проверяли, как изменения в структуре подсказок могут улучшить их социальное поведение».
Результаты тестов, проведенных Акатой и ее коллегами, показывают, что магистры права на удивление хорошо действуют в собственных интересах, поскольку они особенно хорошо проявили себя в соревновательных играх, таких как «Дилемма заключенного».
Это известная задача, используемая в исследованиях теории игр, которая требует от двух участников, или в данном случае от двух магистров права, представить, что они преступники, которые совершили преступление вместе и которых по отдельности допрашивают сотрудники правоохранительных органов, которые пытаются убедить их признаться, чтобы избежать тюремного заключения, даже если это повлечет за собой длительный срок для другого участника.
Хотя было обнаружено, что LLM действовали в своих собственных интересах во время игры (т.
е. признаваясь в преступлении), они часто плохо справлялись с играми, требующими координации, взаимопонимания и компромисса, такими как Battle of the Sexes. Это еще одна игра, которая представляет собой ситуацию, в которой романтические партнеры разделены и должны выбрать между двумя видами деятельности для совместного выполнения, несмотря на то, что у них были заметно разные предпочтения.
«Мы также обнаружили, что их поведение можно улучшить с помощью простых вмешательств, например, побуждая модель сначала предсказать, что может сделать ее партнер, прежде чем действовать», — сказал Аката.
«Эти результаты показывают, что текущие модели еще не обладают надежным социальным интеллектом, но они также показывают, что есть способы направить их к более человеческому поведению.
«Последствия выходят за рамки теории игр, поскольку наши результаты показывают, что мы можем превратить LLM в более социально сознательных агентов, не только тех, кто генерирует правильные ответы, но и тех, кто более осмысленно участвует в общих задачах.
Представьте себе ИИ, который не просто отвечает на вопрос, но и знает, когда слушать, когда адаптироваться и как мягко направлять разговор».
В целом, выводы, собранные Акатой и ее коллегами, показывают, что нынешние LLM более склонны действовать в своих собственных интересах и не очень хорошо координируют свои действия с другими. Тем не менее, исследователи определили некоторые стратегии, которые могли бы помочь LLM стать более кооперативными и социально осведомленными.
Таким образом, их статья могла бы направить будущие усилия, направленные на улучшение существующих моделей или разработку новых, которые будут более отзывчивы к потребностям и наклонностям пользователей-людей.
«Теперь мы хотели бы перейти к более насыщенным и реалистичным социальным ситуациям, например, изучая игры с участием более двух игроков, взаимодействия с неполной информацией или долгосрочные отношения, в которых модели должны выстраивать и поддерживать доверие», — добавил Аката.
«В долгосрочной перспективе подобные исследования могут помочь разработать системы ИИ, которые будут лучше взаимодействовать друг с другом.
Например, в здравоохранении, образовании или социальной поддержке успех часто зависит от того, сможет ли ИИ выражать сочувствие, устанавливать взаимопонимание и действовать таким образом, чтобы люди чувствовали себя поддерживающими и заслуживающими доверия».
Рубрика: Интернет и Игры. Читать весь текст на android-robot.com.
Топ 5 - Лучшие проекторы с аккумуляторами За яркость проекторов с аккумуляторами приходится переплачивать в 3-6 раз больше по сравнению с обычными моделями, поэтому приобретать такой проектор...
ТОП 5 - Лучшие LED/LASER проекторы для домашних кинотеатров LED/LASER проекторы пока так и не приблизились по ценам к ламповым моделям, а их уже вытесняют большие телевизоры, которые стремительно дешевеют Наст...
Рынок подводных кабелей расширяется, поскольку ИИ и геополитика меняют глобальные сети Гиперскейлеры стимулируют ускоренные инвестиции в подводную кабельную инфраструктуру, поскольку глобальные беспорядки подчеркивают необходимость разн...
Датчики в реальном времени количественно определяют биомаркеры для улучшения ухода за ранами Оценка ран медицинскими специалистами в значительной степени основана на визуальном осмотре, который может быть сложным из-за его субъективной природ...
Инструмент ИИ позволяет автоматизировать оценку паралича лицевого нерва «Тонко настроенный» инструмент на основе искусственного интеллекта (ИИ) демонстрирует перспективность объективной оценки пациентов с параличом лицево...
Рынок подводных кабелей расширяется, поскольку ИИ и геополитика меняют глобальные сети Гиперскейлеры стимулируют ускоренные инвестиции в подводную кабельную инфраструктуру, поскольку глобальные беспорядки подчеркивают необходимость разн...
Valve официально прекратила поддержку CS:GO Компания Valve объявила о прекращении поддержки легендарной игры Counter-Strike: Global Offensive с 1 января 2024 года.С начала нового года компания ...
CS2: борьба за 200 тыс. долларов. Кто победит? В данной статье вы увидите обзор финалистов Elisa Masters Espoо 2023, а также общую информацию по турниру! Турнир Elisa Masters Espoo 2023 – это круп...
Чистка зубов ультразвуком. За и против Терапевтическая стоматология рекомендует чистить зубы ультразвуком, так как он помогает эффективно удалить с них налет и камень. Ультразвуковая чистк...
Где купить пульсоксиметры? Пульсоксиметр — это небольшой диагностический прибор, который измеряет уровень кислорода в крови и частоту пульса. Он помогает быстро оценить насыщен...
Обработанное мясо и другие худшие для здоровья продукты, если вам 45+ Некоторые виды пищи могут серьёзно навредить организму после 45 лет. Подробнее об этом рассказала диетолог Тара Коллингвуд. Сладкие напитки. К ним от...
В России предложили ввести этичный подход к использованию ИИ в учебе Российские эксперты в сфере образования выступили против полного запрета на использование искусственного интеллекта (ИИ) в учебной деятельности студе...
Рассекречен внедорожник Dongfeng, который могут собирать в России В Китае на автосалоне в Макао впервые показали журналистам Mengshi M-Hero M817. Речь идёт об упрощенном аналоге знакомого россиянам вездехода M-Hero ...
Крупнейший автопроизводитель Китая ответил на сообщения о банкротстве Руководитель отдела по связям с общественностью BYD Ли Юньфэй в соцсетях отреагировал на недавнее интервью босса Great Wall Вэя Цзяньцзюня. Основател...
«Почему он не в колонии?»: Известный адвокат возмущена «щадящим» условным сроком для Навального Лидеру ФБК в 2017 году продлили испытательный срок до 2020 года. Адвокат Сталина Гуревич вновь призывает МВД обратить пристальное внимание на персону...
Уже отпустили? Экс-глава Раменского района активничал в соцсети после ареста за якобы убийство любовницы Проверка на полиграфе косвенно подтвердила вину Андрея Кулакова, сообщают СМИ. После задержания экс-главы Раменского района, на странице подозреваемо...
Умер отец Рианны, с которым певица была в сложных отношениях На 71-м году жизни умер отец 37-летней Рианны, Рональд Фенти. Об этом сообщает Page Six.По информации издания, Рональда не стало в субботу, 31 мая. П...
"Абсолютная пошлость". Николай Цискаридзе о фильме "Анора", скандальном дебюте Марии Шуваловой в Большом театре, Максиме Галкине* и Алле Пугачёвой 51-летний Николай Цискаридзе дал развёрнутое интервью Лауре Джугелии. В нём он высказался о недавнем скандале вокруг дебюта в Большом театре Марии Шу...
Рынок подводных кабелей расширяется, поскольку ИИ и геополитика меняют глобальные сети Гиперскейлеры стимулируют ускоренные инвестиции в подводную кабельную инфраструктуру, поскольку глобальные беспорядки подчеркивают необходимость разн...
Химчистка ковров: Искусство восстановления уюта и чистоты Ковер — это не просто декоративный элемент. Он играет важную роль в интерьере, создавая атмосферу тепла, уюта и комфорта. Однако с течением времени д...
mindmoney отзывы: Реальные истории успеха и трудностей в MindMoney MindMoney — международный брокер нового поколения MindMoney — это современный брокер, предлагающий своим клиентам доступ к широкому спектру финансовы...
Skyworth запускают продажи первых в мире телевизоров с функцией AI Karaoke Главной особенностью новинок является функция Karaoke на базе искусственного интеллекта, впервые интегрированная в телевизор. Технология Al Vocal Rem...
HONOR представил серию 400_400 Pro в Китае рекордная батарея 7200 мАч, мощный процессор и защита по стандартам IP69+IP69 В Шэньчжэне состоялась презентация новой серии HONOR 400, в рамках которой бренд HONOR, мировой лидер в создании экосистемы устройств с искусственным...
"С Гришей мой крейсер поплыл чуть-чуть быстрее". 19-летняя невеста Григория Лепса ответила на критику Филиппа Киркорова Невеста 62-летнего Григория Лепса, Аврора Киба ответила на слова Филиппа Киркорова о том, что она "не является личностью". В своём инстаграме* девушк...
Девять женщин обвинили Джареда Лето в груминге и непристойном поведении В Airmail вышел материал о 53-летнем Джареде Лето: девять женщин обвинили его в груминге и непристойном поведении.О Джареде давно ходили слухи, что о...
Химчистка ковров: Искусство восстановления уюта и чистоты Ковер — это не просто декоративный элемент. Он играет важную роль в интерьере, создавая атмосферу тепла, уюта и комфорта. Однако с течением времени д...
mindmoney отзывы: Реальные истории успеха и трудностей в MindMoney MindMoney — международный брокер нового поколения MindMoney — это современный брокер, предлагающий своим клиентам доступ к широкому спектру финансовы...
"С Гришей мой крейсер поплыл чуть-чуть быстрее". 19-летняя невеста Григория Лепса ответила на критику Филиппа Киркорова Невеста 62-летнего Григория Лепса, Аврора Киба ответила на слова Филиппа Киркорова о том, что она "не является личностью". В своём инстаграме* девушк...
Девять женщин обвинили Джареда Лето в груминге и непристойном поведении В Airmail вышел материал о 53-летнем Джареде Лето: девять женщин обвинили его в груминге и непристойном поведении.О Джареде давно ходили слухи, что о...
Ультразвуковая зубная щетка обещает безболезненную проверку скрытых проблем с деснами При посещении стоматолога вы, возможно, помните, как вас тыкали и кололи тонким металлическим инструментом, чтобы проверить зубы и десны. Эта техника...
Инвестиции в европейские центры обработки данных превысят 100 млрд евро к 2030 году Первый отчет EUDCA о состоянии рынка показывает, что европейская индустрия центров обработки данных привлечет стремительный рост инвестиций, несмотря...
С 15 июня полностью будет запрещена установка заборов на даче: их придётся убрать С 15 июня полностью будет запрещена установка заборов на даче: их придётся убратьНовые нормы запретят сплошные высокие заборы между дачными участками...
Потрясающе вкусное тесто: готовится за 5 минут — годится для любой выпечки Потрясающе вкусное тесто: готовится за 5 минут — годится для любой выпечкиЭто тесто готовится за 5 минут с кипятком и молоком, остаётся мягким даже н...
Представлена macOS 26 Tahoe – новый дизайн и обновлённый Spotlight На сегодняшнем мероприятии WWDC 25 Apple официально представила свою новую операционную систему для Mac – macOS 26 Tahoe. Дизайн Liquid GlassСамой за...
Apple представила watchOS 26 с персональным голосовым помощником На WWDC 2025 Apple анонсировала новую версию своей операционной системы для умных часов – watchOS 26, предложив пользователям расширенные возможности...
Россияне нашли альтернативу кредитам Займы на сумму 302 млрд рублей выдали гражданам в 2024 году ломбарды. Данный показатель вырос на четверть по сравнению с предыдущим годом, сообщил ЦБ...
Названы страны, куда россияне могут поехать без виз в 2025 году Россиянам для путешествия без въездных виз доступны более 70 стран. Как правило, это дружественные по отношению к РФ государства. Информацию о визовы...
Аппаратная замена масла акпп Аппаратная замена масла в АКПП предполагает полную замену масла для поддержания работы АКПП и продления срока её эксплуатации. К основным преимуществ...
Специальная мойка Чистый воздух Чистый воздух В мире загрязнение воздуха становится всё более актуальной проблемой, обеспечение чистоты является серьезной задачей. Чтобы улучшить ка...
Новая портативка PlayStation может получить ИИ-апскейлинг и 16 ГБ оперативки По информации от авторитетного инсайдера KeplerL2, будущая портативная консоль PlayStation будет оснащена рядом нестандартных решений.Устройство полу...
Представлен HUAWEI Pura 80 Pro с дюймовой камерой и быстрой зарядкой Вместе с суперфлагманом HUAWEI Pura 80 Ultra китайский производитель гаджетов выпустил смартфоны HUAWEI Pura 80 Pro и Pro+, а также базовый Pura 80.С...