Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко используются людьми по всему миру для получения информации, а также для обобщения, анализа и создания текстов.
Исследования, изучающие ответы, предоставляемые LLM в различных сценариях, могут помочь глубже понять их тенденции во время социальных взаимодействий, что может способствовать их будущему развитию.
Исследователи из Института ИИ, ориентированного на человека, имени Гельмгольца в Мюнхене, Института биологической кибернетики Макса Планка и Тюбингенского университета недавно приступили к изучению того, как ведут себя разные LLM, когда они взаимодействуют друг с другом, в частности, во время игры в различные кооперативные или конкурентные игры.
Их выводы, опубликованные в Nature Human Behaviour , предполагают, что, хотя LLM не очень хорошо справляются с играми, требующими координации, есть способы сделать их взаимодействие во время игры в эти игры более похожим на человеческое.
«На эту работу меня вдохновил простой, но важный вопрос: если LLM собираются взаимодействовать с людьми и друг с другом в реальных приложениях, насколько хорошо они на самом деле понимают социальную динамику?» — рассказала Элиф Аката, первый автор статьи.
«Мы опирались на поведенческую теорию игр — математический подход, позволяющий понять, как люди принимают стратегические решения в интерактивных ситуациях, — и применили его к магистрам права».
Многие недавние исследования оценивали производительность LLM по конкретным задачам, таким как резюмирование текстов или поиск логических решений проблем.
Вместо того, чтобы оценивать производительность этих моделей по отдельным задачам, Аката и ее коллеги хотели лучше понять, как они ведут себя во время взаимодействий, которые гораздо ближе к разговорам, которые люди могут вести друг с другом в реальных условиях.
«Мы позволили разным LLM, включая GPT-4, Claude 2 и Llama 2, сыграть сотни раундов классических игр для двух игроков (например, «Дилемма заключенного» и «Битва полов») друг с другом, используя простые вручную закодированные стратегии или с участием людей», — объяснил Аката.
«Каждая игра игралась многократно, чтобы имитировать постоянное взаимодействие.
Мы изучали, могут ли модели научиться сотрудничать или координировать свои действия с течением времени, и проверяли, как изменения в структуре подсказок могут улучшить их социальное поведение».
Результаты тестов, проведенных Акатой и ее коллегами, показывают, что магистры права на удивление хорошо действуют в собственных интересах, поскольку они особенно хорошо проявили себя в соревновательных играх, таких как «Дилемма заключенного».
Это известная задача, используемая в исследованиях теории игр, которая требует от двух участников, или в данном случае от двух магистров права, представить, что они преступники, которые совершили преступление вместе и которых по отдельности допрашивают сотрудники правоохранительных органов, которые пытаются убедить их признаться, чтобы избежать тюремного заключения, даже если это повлечет за собой длительный срок для другого участника.
Хотя было обнаружено, что LLM действовали в своих собственных интересах во время игры (т.
е. признаваясь в преступлении), они часто плохо справлялись с играми, требующими координации, взаимопонимания и компромисса, такими как Battle of the Sexes.
Это еще одна игра, которая представляет собой ситуацию, в которой романтические партнеры разделены и должны выбрать между двумя видами деятельности для совместного выполнения, несмотря на то, что у них были заметно разные предпочтения.
«Мы также обнаружили, что их поведение можно улучшить с помощью простых вмешательств, например, побуждая модель сначала предсказать, что может сделать ее партнер, прежде чем действовать», — сказал Аката.
«Эти результаты показывают, что текущие модели еще не обладают надежным социальным интеллектом, но они также показывают, что есть способы направить их к более человеческому поведению.
«Последствия выходят за рамки теории игр, поскольку наши результаты показывают, что мы можем превратить LLM в более социально сознательных агентов, не только тех, кто генерирует правильные ответы, но и тех, кто более осмысленно участвует в общих задачах.
Представьте себе ИИ, который не просто отвечает на вопрос, но и знает, когда слушать, когда адаптироваться и как мягко направлять разговор».
В целом, выводы, собранные Акатой и ее коллегами, показывают, что нынешние LLM более склонны действовать в своих собственных интересах и не очень хорошо координируют свои действия с другими.
Тем не менее, исследователи определили некоторые стратегии, которые могли бы помочь LLM стать более кооперативными и социально осведомленными.
Таким образом, их статья могла бы направить будущие усилия, направленные на улучшение существующих моделей или разработку новых, которые будут более отзывчивы к потребностям и наклонностям пользователей-людей.
«Теперь мы хотели бы перейти к более насыщенным и реалистичным социальным ситуациям, например, изучая игры с участием более двух игроков, взаимодействия с неполной информацией или долгосрочные отношения, в которых модели должны выстраивать и поддерживать доверие», — добавил Аката.
«В долгосрочной перспективе подобные исследования могут помочь разработать системы ИИ, которые будут лучше взаимодействовать друг с другом.
Например, в здравоохранении, образовании или социальной поддержке успех часто зависит от того, сможет ли ИИ выражать сочувствие, устанавливать взаимопонимание и действовать таким образом, чтобы люди чувствовали себя поддерживающими и заслуживающими доверия».
Рубрика: Игры и Интернет. Читать весь текст на android-robot.com.
Любовь, интриги, Босфор: секреты успеха турецких фильмов и сериалов Первый турецкий фильм, снятый в 1914 году, стал началом большой истории турецкого кино. Его расцвет наступил в 1950-х, когда киностудии выпускали до ...
Почему мы так любим индийское кино? Индийское кино — это удивительный мир, в котором переплетаются традиции и современность, драма и комедия, музыка и танец. С момента своего появления ...
Аппаратная замена масла акпп Аппаратная замена масла в АКПП предполагает полную замену масла для поддержания работы АКПП и продления срока её эксплуатации. К основным преимуществ...
Специальная мойка Чистый воздух Чистый воздух В мире загрязнение воздуха становится всё более актуальной проблемой, обеспечение чистоты является серьезной задачей. Чтобы улучшить ка...
Видеоигра Fortnite возвращается в магазин приложений iPhone в США Популярная видеоигра Fortnite вернулась в магазин приложений для iPhone в США, положив конец длительному изгнанию, вызванному юридическим разбиратель...
Google добавляет рекламу в поиск ИИ в битве ChatGPT Google заявила, что начинает встраивать рекламу в свой новый режим искусственного интеллекта для онлайн-поиска. Это стратегический шаг, призванный пр...
«Почему он не в колонии?»: Известный адвокат возмущена «щадящим» условным сроком для Навального Лидеру ФБК в 2017 году продлили испытательный срок до 2020 года. Адвокат Сталина Гуревич вновь призывает МВД обратить пристальное внимание на персону...
Уже отпустили? Экс-глава Раменского района активничал в соцсети после ареста за якобы убийство любовницы Проверка на полиграфе косвенно подтвердила вину Андрея Кулакова, сообщают СМИ. После задержания экс-главы Раменского района, на странице подозреваемо...
Датчики в реальном времени количественно определяют биомаркеры для улучшения ухода за ранами Оценка ран медицинскими специалистами в значительной степени основана на визуальном осмотре, который может быть сложным из-за его субъективной природ...
Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко ...
В сети появились рендеры Sony Xperia 1 V Мы надеемся, что Xperia 1 V уже не за горами. По-прежнему существует определенная вероятность того, что телефон появится на выставке MWC в Барселоне ...
Samsung показала Galaxy S23 и S23+ с обновленным дизайном Вслед за Galaxy S23 Ultra сегодня показали и обновление базовых моделей Galaxy S. И хотя Samsung улучшила основные аппаратные и программные функции, ...
В Гагарине подрядчик сорвал сроки капремонта моста На совещании, проведенном главой района, принято решение «регулярно мониторить ход выполнения работ» В Гагарине подрядчик сорвал срок капит...
Обзор TECNO CAMON 40 Pro 5G: теперь с ИИ-помощником Хватит ли вам смартфона среднего сегмента? А, может, нужен флагман? Получив на тест TECNO CAMON 40 Pro 5G, мы решили не писать стандартный обзор, а с...
Лучший пылесос для бассейна: инструкция по выбору и мини-подборка отличных моделей Водный пылесос — это специальное устройство, предназначенное для очистки бассейна от грязи, песка, листьев и других загрязнений. Например, с его помо...
С 4 июня запрещено электричество на дачных участках: от сети придётся отключиться, а провода снять — будут массовые проверки С 4 июня запрещено электричество на дачных участках: от сети придётся отключиться, а провода снять — будут массовые проверки С лета 2025 года начнутс...
«Ростелеком» построил гигабитную сеть в поселке Исса Пензенской области «Ростелеком» построил гигабитную сеть в поселке Исса Пензенской области «Ростелеком» завершил монтаж современной гигабитной сети в рабочем поселке Ис...
Где купить цифровую видеокамеру в Москве? Все цифровые камеры создают цифровые изображения, которые можно сохранить при необходимости на компьютере. Они выполняют быструю съемку и передачу из...
Расход воды в системах очистки: особенности работы мембранной фильтрации Современные технологии водоподготовки позволяют получать питьевую воду превосходного качества. Наиболее эффективным методом считается обратный осмос,...
В Гагарине подрядчик сорвал сроки капремонта моста На совещании, проведенном главой района, принято решение «регулярно мониторить ход выполнения работ» В Гагарине подрядчик сорвал срок капит...
Где купить цифровую видеокамеру в Москве? Все цифровые камеры создают цифровые изображения, которые можно сохранить при необходимости на компьютере. Они выполняют быструю съемку и передачу из...
Расход воды в системах очистки: особенности работы мембранной фильтрации Современные технологии водоподготовки позволяют получать питьевую воду превосходного качества. Наиболее эффективным методом считается обратный осмос,...
Рынок подводных кабелей расширяется, поскольку ИИ и геополитика меняют глобальные сети Гиперскейлеры стимулируют ускоренные инвестиции в подводную кабельную инфраструктуру, поскольку глобальные беспорядки подчеркивают необходимость разн...
До 6 тысяч рублей: смартфоны Infinix, Xiaomi, Realme и Tecno сравнили Ведущий YouTube-канала KLGadgetTV узнал, какой из супербюджетных смартфонов сейчас лучше покупать: Poco C71, Realme Note 60Х, Tecno Spark Go 1S или I...
WWDC 2025: Apple не будет делать большой акцент на ИИ во время презентации За неделю до начала ежегодной конференции Apple Worldwide Developers Conference 2025 (WWDC) стали известны новые подробности о ключевых анонсах компа...
Xiaomi представила SU7 Ultra Track Edition — самую экстремальную версию своего первого электромобиля На автосалоне Greater Bay Area Auto Show 2025 компания Xiaomi показала новую трековую модификацию своего седана SU7 — версию SU7 Ultra Track Edition....
СБУ утверждает, что провела операцию по подрыву подводных опор Крымского моста. В спецслужбе заявили, что мост «фактически в аварийном состоянии». Движение по нему останавливали только на три часа Служба безопасности Украины (СБУ) утверждает, что провела «новую уникальную спецоперацию» по подводному подрыву опор Крымского моста. В заявлении спе...
Война. Тысяча сто девяносто шестой день. Каким будет ответ России на операцию «Паутина»? Медведев заявил: «Все, что должно взорваться, непременно будет взорвано» Покровск, июнь 2025 года «Медуза» с 24 февраля 2022 года в прямом эфире рассказывает о российско-украинской войне. В наших ежедневных материалах мы п...
Газизов поднимет вопрос о расширении РПЛ: «Есть доказательная база. Мы даже Бразилии уступаем – мало играем. Клубы из Москвы лишь 10 раз выезжают за пределы города – смешные цифры» На данный момент в Мир РПЛ выступают 16 команд. – Вопрос о расширении РПЛ не поднимался? – Нет. Но 1 июля мы с клубами соберемся, я подниму этот вопр...
Тедеев о детском футболе: «Нам презентуют западные программы – мы перестали уважать себя, похоронили наработки Лобановского, Бескова. В Европе делают то, что мы делали в советских дворах» – Мне жаль, что даже в условиях изоляции российского футбола мы не уделяем особое внимание детскому футболу. И в плане финансов, и в плане единой мет...
«Почему он не в колонии?»: Известный адвокат возмущена «щадящим» условным сроком для Навального Лидеру ФБК в 2017 году продлили испытательный срок до 2020 года. Адвокат Сталина Гуревич вновь призывает МВД обратить пристальное внимание на персону...
Уже отпустили? Экс-глава Раменского района активничал в соцсети после ареста за якобы убийство любовницы Проверка на полиграфе косвенно подтвердила вину Андрея Кулакова, сообщают СМИ. После задержания экс-главы Раменского района, на странице подозреваемо...
В Туле завершился межрегиональный «Кубок Защитников Отечества» В Туле завершилось Межрегиональное комплексное физкультурное мероприятие среди ветеранов специальной военной операции «Кубок Защитников Отечества». В...
Брянская область вошла в топ-30 по количеству заявок на конкурс для тренеров проекта «СпортТрек» Подведены итоги заявочной кампании на конкурс для тренеров проекта «СпортТрек» президентской платформы «Россия – страна возможностей». 19 жителей Бря...
Skyworth запускают продажи первых в мире телевизоров с функцией AI Karaoke Главной особенностью новинок является функция Karaoke на базе искусственного интеллекта, впервые интегрированная в телевизор. Технология Al Vocal Rem...
HONOR представил серию 400_400 Pro в Китае рекордная батарея 7200 мАч, мощный процессор и защита по стандартам IP69+IP69 В Шэньчжэне состоялась презентация новой серии HONOR 400, в рамках которой бренд HONOR, мировой лидер в создании экосистемы устройств с искусственным...
Изыскания для строительства: основа успешного проектирования и безопасного строительства Процесс строительства является многогранным и сложным, включающим множество этапов, начиная от проектирования и заканчивая сдачей объекта в эксплуата...
Где применяется струя бобра? Струя бобра – это уникальное натуральное средство, которое добывается из желез бобров. Используется в различных областях, включая медицину, парфюмери...
Топ 5 - Лучшие проекторы с аккумуляторами За яркость проекторов с аккумуляторами приходится переплачивать в 3-6 раз больше по сравнению с обычными моделями, поэтому приобретать такой проектор...
ТОП 5 - Лучшие LED/LASER проекторы для домашних кинотеатров LED/LASER проекторы пока так и не приблизились по ценам к ламповым моделям, а их уже вытесняют большие телевизоры, которые стремительно дешевеют Наст...
Любовь, интриги, Босфор: секреты успеха турецких фильмов и сериалов Первый турецкий фильм, снятый в 1914 году, стал началом большой истории турецкого кино. Его расцвет наступил в 1950-х, когда киностудии выпускали до ...
Почему мы так любим индийское кино? Индийское кино — это удивительный мир, в котором переплетаются традиции и современность, драма и комедия, музыка и танец. С момента своего появления ...
Море и тапочки за 150 тысяч: Бородина и Сердюков отправились в медовый месяц После свадьбы Ксения Бородина и ее муж, бизнесмен Николай Сердюков, отправились в Турцию в медовый месяц. Как стало известно из социальных сетей, пар...
В сети обсуждают "помолодевшую" Мэрайю Кэри В сети обсуждают заметно "помолодевшую" Мэрайю Кэри. Поклонники заподозрили 56-летнюю певицу в том, что она сделала пластическую операцию, после её в...
"Жанна классная". Николай Василенко рассказал о романе с Жанной Фриске Блогер и бизнесмен, 55-летний Николай Василенко, который известен как "человек-антидепрессант", дал интервью Forbes, в котором рассказал, что состоял...
Студентка из Брянской области вошла в число дипломантов VIII сезона Всероссийской олимпиады студентов «Я – профессионал» Всероссийская олимпиада студентов «Я – профессионал» президентской платформы «Россия – страна возможностей» подвела итоги VIII сезона. В число диплом...
Ультразвуковая зубная щетка обещает безболезненную проверку скрытых проблем с деснами При посещении стоматолога вы, возможно, помните, как вас тыкали и кололи тонким металлическим инструментом, чтобы проверить зубы и десны. Эта техника...
Инвестиции в европейские центры обработки данных превысят 100 млрд евро к 2030 году Первый отчет EUDCA о состоянии рынка показывает, что европейская индустрия центров обработки данных привлечет стремительный рост инвестиций, несмотря...
СК проверит дружинников, которые пытались задержать уроженку Бурятии как мигрантку В Подмосковье разгорелся скандал, после того как уроженку Бурятии попытались задержать люди в камуфляже, представившиеся народными дружинниками. Мужч...
Волынец предложила признать фембоев деструктивным движением Уполномоченная по правам ребёнка в Татарстане Ирина Волынец предложила признать деструктивным движение фембоев. К ним она причислила молодых мужчин д...
С 16 июня полностью будут запрещены скважины на дачном участке: их придётся засыпать С 16 июня полностью будут запрещены скважины на дачном участке: их придётся засыпатьЕсли вы планируете бурить скважину на даче, важно знать новые огр...
Вот почему у китайцев кухонные полотенца и тряпки всегда кипенно белые, как новые, — простая хитрость Вот почему у китайцев кухонные полотенца и тряпки всегда кипенно белые, как новые, — простая хитростьВы наверняка замечали: в китайских домах даже по...
Поездка с риском для жизни: смолянин «налетел» на неожиданное препятствие на дороге в центре города Крышка люка, на которую наехал молодой человек, больно ударила не только по авто, но и по бюджету горожанина. Максим, герой нашей истории, — об...