Здесь больше нет рекламы. Но могла бы быть, могла.

Автор Тема: [Архив] И всё-таки, Парадокс Заключённых!  (Прочитано 11762 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #140 : 13/05/2004, 12:02:25 »
Мёнин,

Цитата:
Вы опять забыли, что есть короткая форма... Короткая форма в случае симметричных игр есть отображение полной формы, в которой указаны лишь выигрыши первого партнёра, а выигрыв второго партнёра в ситуации (i,j) равен Zij=Xji. Что ещё непонятно?


Это не я забыла, что есть короткая форма, это Вы не умеете переводить полную форму в упрощенную и обратно.  Мне все понятно с самого начала, что Вы хотите сказать. Это Вы не хотите понять, что я Вам объясняю. НЕПРАВИЛЬНО Вы это делаете. Просто вот так взять и вторые значения в полдной форме стереть НЕЛЬЗЯ. Потому что фигня получается, а не та же матрица.

Цитата:
"Функция полезности" высчитывается из короткой формы.


Нет, ну если у Вас первична матрица, то наш разговор не имеет смысла - какие циферки нарисуете, так и будет... Жаль только, что это никакого отношения ни к чему не имеет.

Цитата:
Теория игр не может быть разделом математики - математика не учитывает психологии, и ей неизвестны слова "хочет", "намеревается"... Да и слова "равновесия" математика тоже не знает. Равновесие появляется в приложении математики к конкретным областям - физике, психологии, экономике...


Игр теория, - раздел математики, изучающий формальные модели принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается явление, в котором участвуют различные стороны, наделённые различными интересами и возможностями выбирать доступные для них действия в соответствии с этими интересами. (Большая Советская Энциклопедия)

Game theory - branch of applied mathematics fashioned to analyze certain situations in which there is an interplay between parties that may have similar, opposed, or mixed interests. In a typical game, decision-making “players,” who each have their own goals, try to outsmart one another by anticipating each other's decisions; the game is finally resolved as a consequence of the players' … (Britannica, 2004) (в пер.: Теория игр - раздел прикладной математики... )

Цитата:
Теория Нэша - это теория игр в том виде, в каком её понимал сам Нэш. И всё.


А он Вам сам сказал, как он ее себе представляет? А откуда Вы тогда знаете?

Цитата:
Я думаю, современная теория игр отличается от теории Нэша.

А Вы не думайте. Вы проверьте. А то заняли позицию "Я ничего не знаю и в предмете не разбираюсь, но я уверен что я прав, что я прав, потому что я явно умнее чем собеседники" и спорите о том, чего ВООБЩЕ не знаете.

Цитата:
 той полной матрице я ошибся, только не проставив лишний -, т.е., написав в спешке 10 вместо -10.
Всё остальное - сходно.
Только в первом случае я указал варианты выбора, но не указал их порядок в матрице - может быть, вы это приняли за ошибку?.. Можно было бы и догаадаться, так?..


В той полной матрице Вы перепутали местами стратегии. Давайте в матрице два на два их местами перепутаем - посмотрим тогда, где Вы будете Ваше кооперативное равновесие искать в точке отказа от кооперации. Это Вам не в бирюльки играть - в каком порядке написали, в таком и анализировать будте любезны. И скажите спасибо, что я Вам на ошибку указала.

               

               

Симагин Гендо

  • Гость
Ерунда это ваше равновесие.
« Ответ #141 : 14/05/2004, 06:09:48 »
   Биндари,
Цитата:
Спасибо за напоминание. Но мне все равно не понятно, при чем тут это. Даже зная, что такое производная по вектору и даже будучи способной ее найти, я не могу логически связать нашу дискуссию с производной по вектору.

     Объясняю: параметры функции полезности - поведение различных игроков.
Цитата:
  А подавляющее большинство взаимодействий имеет место "нефактчтоповторяющиеся" взаимодействия в больших популяциях.

   Даже "неповторяющиеся" взаимодействия обычно являются многоходовыми. Далее, большинство людей предпочитают повторяющиеся вщзаимодействия. - они отличаются большей определенностью матрицы. Кроме того, даже два различных взаимодействия могут иметь почти одинаковые матрицы.
Цитата:
 Поэтому, как я уже и говорила, кооперативное равновесие может устанавливаться, но редко.

      Поэтому, кооперативное поведение устанавливается гораздо чаще.
    "Опытным путем бабы установили, что легче вдесятером вскопать десять огородов, чем в одиночку один огород". (Солженицын, "Матренин двор").
Цитата:
Про "равновесие Нэша": Нэш придумал, как искать равновесие. Он не придумал ничего нового в самой концепции равновесия.

    Он придумал, что люди никогда не учитывают возможное изменение чужого поведения.
Цитата:

Цитата:
 В смысле, что при действии, теории не соответствующем (применительно к Нэшу - не являющегося равновесным), выигрыш будет больше, чем для равновесного. И правила так устроены, что невыгодно получать выигрыш "за мой счет".

 Вы не можете заставить людей в(даже в повторяющейся игре) действовать неравновесно, не можете объяснить.

    Значит так. Имеется сообщество из 10 человек. Взаимодействуют они согласно матрице 3*3 из №113. 9 "умных" взаимодействуют равновесным образом со счетом 5:5, и имеется один "дурак", использующий только стратегию №2 и взаимодействующий со счетом 8:10. Но при этом "дурак" живет гораздо лучше "умных"!

Цитата:

Цитата:
Но при этом я получаю меньше, чем в равновесии, а он столько же! И зачем такое "равновесная стратегия" нужна?

пример?

   Ответ №75. Можно доказать, что подобная ситуация имеет место в любой задаче, где простого равновесия нет.

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #142 : 17/05/2004, 11:27:04 »
Симагин,

Цитата:
     Объясняю: параметры функции полезности - поведение различных игроков.

Стало еще более непонятно.

Цитата:
 Даже "неповторяющиеся" взаимодействия обычно являются многоходовыми. Далее, большинство людей предпочитают повторяющиеся вщзаимодействия. - они отличаются большей определенностью матрицы. Кроме того, даже два различных взаимодействия могут иметь почти одинаковые матрицы.


Многоходовость к повторяемости не имеет отношения.
Мало ли что они предпочитают, они не всегда могут на это влиять. Чаще всего - не могут. Мало повторяющихся взаимодействий, просто они гораздо более заметны. И еще. Не "предпочитают". Они просто издержки снижают.
Не могут, потому что я Вам уже устала повторять - числовые матрицы в реальных взаимодействиях редко можно построить.

Цитата:
Поэтому, кооперативное поведение устанавливается гораздо чаще.
    "Опытным путем бабы установили, что легче вдесятером вскопать десять огородов, чем в одиночку один огород". (Солженицын, "Матренин двор").

А вот примеры из литературы тут совсем лишние... мало ли что написано  ;)

Цитата:
  Он придумал, что люди никогда не учитывают возможное изменение чужого поведения.


С чего Вы взяли? Найдите мне место, где это написано.

Цитата:
 Ответ №75. Можно доказать, что подобная ситуация имеет место в любой задаче, где простого равновесия нет.

Я уже ответила Вам на этот пост. Вы оперируете не смешанной, а чистыми стратегиями для одного из игроков.

               

               

Симагин Гендо

  • Гость
  Биндари,
Цитата:
А вот примеры из литературы тут совсем лишние... мало ли что написано  ;)

    AFAIK, Солженицын описывал реальные или почти реальные факты... И в "симпатии к СССР" его сложно упрекнуть.
Цитата:
 Я уже ответила Вам на этот пост. Вы оперируете не смешанной, а чистыми стратегиями для одного из игроков.

     Ну и что? Это ведь не запрещает второму игроку применять чистую стратегию?
   Ладно, допустим я поверил. И все же, для некоторых случаев ПЗ имеет смысл некоторый "альтруизм".
    Приведу пример. Поймали те же самые дикари Шаси и Гендо. И заствили их играть по матрице
    10:10 0:15
    15:0   5:5
      Единицами полезности были, например, мандарины (урожай, наверное, удался).
    Гендо посмотрел на схему взаимодействия и сказал: "Я принимаю на себя обязательсво отдавать шаси 6 мандаринов в случае, если я использую вторую стратегию, а шаси первую". И попросил дикарей проследить за соблюдением обязательства. Дикари подумали и не возражали - против "права дарить подарки" они ничего не имели. Шаси тоже не возражала - зачем от бесплатных мандаринов отказываться?
    В результате, матрица взаимодействия приняла вид:
    10:10  0:15
    9:6      5:5
    После игры в соответствии с равновесием Нэша средний выигрыш Гендо составил 8.33 мандарина, а у шаси всего 6.67 мандарина.

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #144 : 18/05/2004, 10:22:18 »
Симагин,

Цитата:
 AFAIK, Солженицын описывал реальные или почти реальные факты... И в "симпатии к СССР" его сложно упрекнуть.


Тут ключевое слово почти  ;) и потом - эта цитата никак не противоречит моей позиции. Вообще ни в чем  ;) Деревня - ограниченная популяция, вообще-то :)

Цитата:
 Ну и что? Это ведь не запрещает второму игроку применять чистую стратегию?


Ну, давайте смоделируем - запуталась я с Вами.

Матрица:
10:10 10:7 0:15
7:10   7:7   7:5
15:0   5:7   5:5

Второй игрок использует равновесную по Нэшу стратегию. Что Вы предлагаете первому игроку?

Цитата:
    Гендо посмотрел на схему взаимодействия и сказал: "Я принимаю на себя обязательсво отдавать шаси 6 мандаринов в случае, если я использую вторую стратегию, а шаси первую". И попросил дикарей проследить за соблюдением обязательства. Дикари подумали и не возражали - против "права дарить подарки" они ничего не имели. Шаси тоже не возражала - зачем от бесплатных мандаринов отказываться?


Спасибо ;) К вопросу о распозноваемости, обучаемости и пр. вообще не надо было обращаться :) это я перемудрила  ;D Ваша ошибка в данном случае: ЭТО НЕ ДИЛЕММА ЗАКЛЮЧЕННЫХ   ;) ;D Потому что в этом парадоксе в начальных условиях написано "игроки принимают решения одновременно и независимо". А вот когда Гендо принимает на себя обязательства - это уже не независимая игра. У нее другие правила и другие равновесия  ;D Поймите, парадокс в том и заключается, что в случае, когда торг и вобще переговоры не возможны, устанавливается равновесие в точке 5, 5. Потому что если Гендо ничего не сказал, а шаси раньше Гендо никогда не видела и ничем, собственно, ему не обязана, и ничего о нем не знает, то она будет вести себя некооперативно :) как и Гендо :)

               

               

Симагин Гендо

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #145 : 19/05/2004, 09:01:57 »

Цитата:
 Деревня - ограниченная популяция, вообще-то :)

   Ну и что? В большой популяции данный факт также может быть установлен и использован. Всегда выделеются относительно небольшие группы - применительно к экономике это "фирмы". Более того, в большой популяции более велико разнообразие возможных позитивных взаимодействий.
Цитата:
Матрица:
10:10 10:7 0:15
7:10   7:7   7:5
15:0   5:7   5:5
Второй игрок использует равновесную по Нэшу стратегию. Что Вы предлагаете первому игроку?


Третью стратегию, нет, это действие имеет определенные недостатки. Он применяет смешанную стратегию с коэффициэнтами (0, 0.8, 0.2) Его выигрыш равен 7, а выигрыш первого игрока равен 6.6
Цитата:
   Спасибо ;) К вопросу о распозноваемости, обучаемости и пр. вообще не надо было обращаться :) это я перемудрила  ;D Ваша ошибка в данном случае: ЭТО НЕ ДИЛЕММА ЗАКЛЮЧЕННЫХ   ;) ;D Потому что в этом парадоксе в начальных условиях написано "игроки принимают решения одновременно и независимо". А вот когда Гендо принимает на себя обязательства - это уже не независимая игра. У нее другие правила и другие равновесия  ;D Поймите, парадокс в том и заключается, что в случае, когда торг и вобще переговоры не возможны, устанавливается равновесие в точке 5, 5. Потому что если Гендо ничего не сказал, а шаси раньше Гендо никогда не видела и ничем, собственно, ему не обязана, и ничего о нем не знает, то она будет вести себя некооперативно :) как и Гендо :)

    Я говорю о применении к реальности. В реальной ситуации всегда есть возможность изменить матрицу некоторым "альтруистичным" образом. Что в таком изменении особенного - оно имеет минимальные издержки. В отличие от "силовых мер". Но при этом, для некоторых взаимодействий получается, что данный "альтруизм" приносит пользу не только "объекту альтруизма", но и самому "альтруисту", причем польза для "альтруиста" может превышать пользу для объекта. (В моем примере разница в 2 раза, но она может быть намного выше.)

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #146 : 19/05/2004, 10:29:28 »
Симагин,

Цитата:
Ну и что? В большой популяции данный факт также может быть установлен и использован. Всегда выделеются относительно небольшие группы - применительно к экономике это "фирмы". Более того, в большой популяции более велико разнообразие возможных позитивных взаимодействий.


Потому что, как я уже неоднократно говорила, для ограниченных и неограниченных популяций выводы в данной модели для повторяющихся игр разные. В ограниченных популяциях равновесие смещается в некооперативную точку. В неограниченных - не смещается. И никакого разнообразия взаимодействий не предвидится. ВЫ неограниченной популяции игра совпадает с неповторяющмся взаимодействием.

Цитата:
Третью стратегию, нет, это действие имеет определенные недостатки. Он применяет смешанную стратегию с коэффициэнтами (0, 0.8, 0.2) Его выигрыш равен 7, а выигрыш первого игрока равен 6.6

А зачем ему это?  :o Вы предлагаете ему перейти в точку, неэффективную по Парето  ;) Потому что его выигрыш не меняется, а выигрыш второго игрока снижается   ::) И это - максимизация общественного благосостояния?  ;D

Цитата:
 Я говорю о применении к реальности. В реальной ситуации всегда есть возможность изменить матрицу некоторым "альтруистичным" образом.

У заключенных такой возможности нет, к примеру. Да и когда она есть, она далеко не всегда используется.

Цитата:
Что в таком изменении особенного - оно имеет минимальные издержки.

Отсутствие стимулов в общем случае.

Цитата:
Но при этом, для некоторых взаимодействий получается, что данный "альтруизм" приносит пользу не только "объекту альтруизма", но и самому "альтруисту", причем польза для "альтруиста" может превышать пользу для объекта. (В моем примере разница в 2 раза, но она может быть намного выше.)

И все равно нет стимулов. Только в ограниченных популяциях при повторяющихся взаимодействиях можно так поступать. Так что мир переделать ну никак не получится - общество достсаточно велико, чтобы считаться неограниченной популяцией.

               

               

Симагин Гендо

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #147 : 20/05/2004, 07:45:38 »
Биндари,
Цитата:

Цитата:
Третью стратегию, нет, это действие имеет определенные недостатки. Он применяет смешанную стратегию с коэффициэнтами (0, 0.8, 0.2) Его выигрыш равен 7, а выигрыш первого игрока равен 6.6

А зачем ему это?  :o Вы предлагаете ему перейти в точку, неэффективную по Парето  ;) Потому что его выигрыш не меняется, а выигрыш второго игрока снижается   ::) И это - максимизация общественного благосостояния?  ;D

    На "зачем" отвечаю - а зачем ему применять равновесную стратегию? Она не оптимальна ни по выигрышу против себя, ни по минимаксу, ни по выигрышу при оптимальном ответе.
    Это - не максимизация общественного благо состояния. Но предложенная стратегия превосходит указанную вами как по минимаксу, так и при "оптимальном ответе". И против равновесной она дает такой же результат, как равновесная.
Цитата:
 У заключенных такой возможности нет, к примеру. Да и когда она есть, она далеко не всегда используется.

    Ну, большинство людей сидят все же не в тюрьме. :) А что до неиспользования - люди, не использующие каких-либо возможностей, как правило проигрывают.

Цитата:

Цитата:
Что в таком изменении особенного - оно имеет минимальные издержки.

Отсутствие стимулов в общем случае.

    Отсутствие стимулов для кого? Для объекта альтруизма стимул есть. И я показал, что "альтруист" при этом выигрывает еще больше.
Цитата:
И все равно нет стимулов. Только в ограниченных популяциях при повторяющихся взаимодействиях можно так поступать.

    В моем примере повторяемость взаимодействий не использовалась. (если не считать таковой необходимость использования случайной стратегии)
Цитата:
 Так что мир переделать ну никак не получится - общество достсаточно велико, чтобы считаться неограниченной популяцией.

    Между десятком и миллиардом разница ниже, чем между миллиардом и бесконечностью. Не говоря уж о том, что реально большинство взаимодействий происходят внутри групп численностью максимум несколько тысяч человек.
    Кстати, по поводу "равновесия". Коэффициэнты матриц взаимодействия для реального общества постоянно изменяются. При этом, для "равновесия Нэша" выигрыши зависят от коэффициэнтов разрывным образом. А для разрывных функций никакого "предельного равновесия" может вообще не быть. А вот для максимизирующей общ. благо стратегии выигрыши зависят непрерывным образом.
    И еще - в приведенном мной примере шаси, увидев эффективность альтруизма, могла бы тоже стать альтруисткой. При этом, равновесияе смещается в точку (10, 10). Обращаю внимание, что ситуация, в которой шаси должна для этого сменить поведение, встречалась при равновесии лишь на одну игру из 36. А после изменения поведения данная ситуация вообще перестала встречаться. Это к тому, что мной рассматривается ограниченное число ситуаций - равновесие Нэша так устроено, что оно может быть смещено весьма малыми воздействиями!

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #148 : 20/05/2004, 11:31:36 »
Симагин,

Цитата:
 На "зачем" отвечаю - а зачем ему применять равновесную стратегию? Она не оптимальна ни по выигрышу против себя, ни по минимаксу, ни по выигрышу при оптимальном ответе.


По выигрышу против себя она оптимальна. А почему именно по минимаксу? Есть еще максиминная стратегия.

Цитата:
 Но предложенная стратегия превосходит указанную вами как по минимаксу, так и при "оптимальном ответе". И против равновесной она дает такой же результат, как равновесная.


Покажите.

Цитата:
Ну, большинство людей сидят все же не в тюрьме.  А что до неиспользования - люди, не использующие каких-либо возможностей, как правило проигрывают.


Трансакционные издержки еще есть.

Цитата:
Отсутствие стимулов для кого? Для объекта альтруизма стимул есть. И я показал, что "альтруист" при этом выигрывает еще больше.


Нету стимулов для кооперативного поведения игроков.

Цитата:
В моем примере повторяемость взаимодействий не использовалась. (если не считать таковой необходимость использования случайной стратегии)


Не использовалась. У вас решения принимались не независимо. И смешанная стратегия тоже не использовалась вроде... мы же про матрицу 2*2 говорим про мандарины.

Цитата:
  Между десятком и миллиардом разница ниже, чем между миллиардом и бесконечностью. Не говоря уж о том, что реально большинство взаимодействий происходят внутри групп численностью максимум несколько тысяч человек.


Миллиард - вполне достаточно, чтобы признать популяцию неограниченной. Утверждение о тысячах человек не верно.
Да и тысячи (при том, что всего миллиард) вполне достаточно для неограниченности... вот если бы речь шла об острове, где нет чужаков, а только эти 10 тысяч - я бу еще задумалась... и то - совсем не факт...


Цитата:
  Кстати, по поводу "равновесия". Коэффициэнты матриц взаимодействия для реального общества постоянно изменяются. При этом, для "равновесия Нэша" выигрыши зависят от коэффициэнтов разрывным образом. А для разрывных функций никакого "предельного равновесия" может вообще не быть. А вот для максимизирующей общ. благо стратегии выигрыши зависят непрерывным образом.


Покажите, что зависимость нелинейна. Докажите, что Вы можете посчитать коэффициенты и точные значения выигрышей. Докажите, что непрерывно зависят от максимизирующей общее благосостояние стратегии.

Цитата:
 И еще - в приведенном мной примере шаси, увидев эффективность альтруизма, могла бы тоже стать альтруисткой. При этом, равновесияе смещается в точку (10, 10).

А у нас там было не повторяющееся взаимодействие - сами же говорили выше. Поэтому увидеть эффективность альтруизма шаси не могла.
А если повторяющееся взаимодействие - и все время с одним и тем же игроком, который до того уперт, что все время выбирает кооперативную стратегию - то я уже говорила, что равновесие сместится. И что теперь?

Цитата:
Обращаю внимание, что ситуация, в которой шаси должна для этого сменить поведение, встречалась при равновесии лишь на одну игру из 36. А после изменения поведения данная ситуация вообще перестала встречаться. Это к тому, что мной рассматривается ограниченное число ситуаций - равновесие Нэша так устроено, что оно может быть смещено весьма малыми воздействиями!

Откуда цифру то взяли?  :o
Равновесие по Нэшу сместить можно только изменив соотношение выигрышей в матрице. А уж какое для этого нужно изменение - зависит от конкретной матрицы.

               

               

Симагин Гендо

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #149 : 21/05/2004, 08:43:30 »

Цитата:
По выигрышу против себя она оптимальна. А почему именно по минимаксу? Есть еще максиминная стратегия.

    По выигрышу против себя всегда оптимальна максимизирующая общественное благосостояние стратегия. В данном случае - стратегия 1. И она дает 10 у. е. против каких-то жалких 7 у. е. равновесной.
Цитата:

Цитата:
 Но предложенная стратегия превосходит указанную вами как по минимаксу, так и при "оптимальном ответе". И против равновесной она дает такой же результат, как равновесная.
Покажите.

    Равновесная стратегия в худшем случае - против третьей стратегии - выигрывает 5 у. е. , а предложенная - 0.8*7 + 0.2*5 = 6.6 у.е.
    Против данной стратегии первая выигрывает в среднем 8 у. е. , вторая - 7 у. е., третья - 5 у. е. Поскольку результат при смешанной стратегии является промежуточным, оптимальным ответом является первая стратегия. Соответственно, игрок, применяющий данную смешанную стратегию, при оптимальном ответе выигрывает 8.6 у. е.
Цитата:
Нету стимулов для кооперативного поведения игроков.

    А увеличение _своего_ выигрыша не стимул?
Цитата:
Не использовалась. У вас решения принимались не независимо. И смешанная стратегия тоже не использовалась вроде... мы же про матрицу 2*2 говорим про мандарины.

    Все решения принимались, исходя из матрицы. Смешанная стратегия была в матрице
   10:10  0:15
   9:6     5:5
   Коэффициэнты для первого игрока (0.17, 0.83), для второго (0.83, 0.17)
Цитата:

Цитата:
  Между десятком и миллиардом разница ниже, чем между миллиардом и бесконечностью. Не говоря уж о том, что реально большинство взаимодействий происходят внутри групп численностью максимум несколько тысяч человек.


Миллиард - вполне достаточно, чтобы признать популяцию неограниченной. Утверждение о тысячах человек не верно.
Да и тысячи (при том, что всего миллиард) вполне достаточно для неограниченности... вот если бы речь шла об острове, где нет чужаков, а только эти 10 тысяч - я бу еще задумалась... и то - совсем не факт...

    Ну вот в России 100 миллионов человек. Но, с большей их частью вы никогда не встретитесь. И даже те, с кем вы встречаетесь на улице - с большей их частью опять же никаких взаимодействий не происходит. А вот те, с ке м вы взаимодействуете - друзья, коллеги по работе, родственники - с ними взаимодействия явно повторяющиеся.
Цитата:
 Покажите, что зависимость нелинейна. Докажите, что Вы можете посчитать коэффициенты и точные значения выигрышей. Докажите, что непрерывно зависят от максимизирующей общее благосостояние стратегии.

   Не "нелинейна", а разрывна, что гораздо хуже.
   Пример. Матрица
   10:10          5-k:10+k
   10+k:5-k      5:5
   При k>0 равновесные выигрыши равны 5, при k<0 они равны 10. Налицо разрыв.
   Для максимизации общего благосостояния в общем случае доказать не могу по причине отсуствия четкого понимания, что требуется оптимизировать, а для симметричной игры выигрыш каждого игрока будет равен 0.5*maxi,j(aij+bij).  aij, bij - коэффициэнты матрицы. Данная функция является непрерывной - поскольку непрерывны сумма и максимум.
    Точные значения посчитать нельзя. Но некие оценки я дать не могу. А если выигрыш не поддается оценке - о какой-либо "разумной стратегии" говорить вообще нельзя.
Цитата:
 Равновесие по Нэшу сместить можно только изменив соотношение выигрышей в матрице. А уж какое для этого нужно изменение - зависит от конкретной матрицы.

   Да. Но кто сказал, что нельзя менять матрицу?

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #150 : 21/05/2004, 10:53:10 »
Симагин,

Цитата:

Цитата:
По выигрышу против себя она оптимальна. А почему именно по минимаксу? Есть еще максиминная стратегия.

По выигрышу против себя всегда оптимальна максимизирующая общественное благосостояние стратегия.

Докажите. Теория игр - раздел математики. Так что докажите математически. ЭТО - не доказательство.

Цитата:
   Равновесная стратегия в худшем случае - против третьей стратегии - выигрывает 5 у. е. , а предложенная - 0.8*7 + 0.2*5 = 6.6 у.е.
Против данной стратегии первая выигрывает в среднем 8 у. е. , вторая - 7 у. е., третья - 5 у. е. Поскольку результат при смешанной стратегии является промежуточным, оптимальным ответом является первая стратегия. Соответственно, игрок, применяющий данную смешанную стратегию, при оптимальном ответе выигрывает 8.6 у. е.


"Равновесные" выигрыши смешанных стратегий определяются именно так, как Вы любите - на повторяющихся взаимодействиях одних и тех же игроков. Так что Ваша стратегия (0.8; 0.2) для первого игрока будет давать выигрыш
10:10 10:7 0:15
7:10   7:7   7:5
0 для первого игрока и 15 для второго.

Цитата:
А увеличение _своего_ выигрыша не стимул?


Нет возможности увеличить собственный выигрыш.

Цитата:
  Все решения принимались, исходя из матрицы. Смешанная стратегия была в матрице
   10:10  0:15
   9:6     5:5
   Коэффициэнты для первого игрока (0.17, 0.83), для второго (0.83, 0.17)


Хорошо. Но эта матрица изначально не оптимальна (и потому не будет использована), поскольку в теории игр приняты предположения о "невредности" игроков.

Цитата:
 Ну вот в России 100 миллионов человек. Но, с большей их частью вы никогда не встретитесь. И даже те, с кем вы встречаетесь на улице - с большей их частью опять же никаких взаимодействий не происходит. А вот те, с ке м вы взаимодействуете - друзья, коллеги по работе, родственники - с ними взаимодействия явно повторяющиеся.


И я о том же. Только их не тысячи, а гораздо меньше. А тысячи - это включая тех, с кем встречаешься на улице. И с ними взаимодействия - не повторяющиеся.

Цитата:
 Не "нелинейна", а разрывна, что гораздо хуже.
   Пример. Матрица
   10:10          5-k:10+k
   10+k:5-k      5:5
   При k>0 равновесные выигрыши равны 5, при k<0 они равны 10. Налицо разрыв.
   Для максимизации общего благосостояния в общем случае доказать не могу по причине отсуствия четкого понимания, что требуется оптимизировать, а для симметричной игры выигрыш каждого игрока будет равен 0.5*maxi,j(aij+bij).  aij, bij - коэффициэнты матрицы. Данная функция является непрерывной - поскольку непрерывны сумма и максимум.
    Точные значения посчитать нельзя. Но некие оценки я дать не могу. А если выигрыш не поддается оценке - о какой-либо "разумной стратегии" говорить вообще нельзя.


Описалась.
Показали на примере - хорошо. Не совсем верно - не учтена отрицательная склонность игроков к риску. Впрочем, это не меняет сути.
Про симметричную игру не поняла.
Относительно разрывности и неопределенности: что такое предельная стратегия не понимаю. Но в любом случае ее нельзя посчитать только в точке разрыва. В конкретном случае - для определения равновесия в играх с неполной информацией есть другие методики - см. равновесие Байеса-Нэша.

Цитата:
Да. Но кто сказал, что нельзя менять матрицу?

Можно. Но это будет игра со сговором - в ней свои правила, которые очень плохо поддаются формализации. Парадокс заключенных состоит в том, что люди ведут себя некооперативно, если не могут предварительно договориться. О чем я Вам и толкую уже столько времени. Вы можете создать общество, где, по предварительной договоренности, все будут выбирать кооперативную точку. Но это общество будет нежизнеспособно, потому что в больших обществах предварительная договоренность не существенна - поскольку нет стимулов ее поддерживать.

               

               

Симагин Гендо

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #151 : 28/05/2004, 07:54:37 »
   Биндари,
Цитата:

Цитата:
По выигрышу против себя всегда оптимальна максимизирующая общественное благосостояние стратегия.

Докажите. Теория игр - раздел математики. Так что докажите математически. ЭТО - не доказательство.

    Ну пусть стратегия S при игре против себя дает результат M. Тогда общее благо будет равно 2*М. Величины M и 2*M максимальны при одних и тех же условиях. M1>M2 тогда и только тогда, когда 2*М1>2*M2
Цитата:
 "Равновесные" выигрыши смешанных стратегий определяются именно так, как Вы любите - на повторяющихся взаимодействиях одних и тех же игроков. Так что Ваша стратегия (0.8; 0.2) для первого игрока будет давать выигрыш
10:10 10:7 0:15
7:10   7:7   7:5
0 для первого игрока и 15 для второго.

  Во-первых, вы неправильно посчитали. Если я с вероятностью 0.8 использую стратегию 1, а с вероятностью 0.2 - вторую стратегию, то я получу минимум  1.4 выигрыша.
   Во-вторых, вы еще и стратегию неправильно поняли. Я написал (0, 0.8, 0.2), а не (0.8, 0.2, 0).

Цитата:

Цитата:
  Все решения принимались, исходя из матрицы. Смешанная стратегия была в матрице
   10:10  0:15
   9:6     5:5
   Коэффициэнты для первого игрока (0.17, 0.83), для второго (0.83, 0.17)

Хорошо. Но эта матрица изначально не оптимальна (и потому не будет использована), поскольку в теории игр приняты предположения о "невредности" игроков.

     А это еще что за предположения?
Цитата:
 И я о том же. Только их не тысячи, а гораздо меньше. А тысячи - это включая тех, с кем встречаешься на улице. И с ними взаимодействия - не повторяющиеся.

    Ну, доля неповторяющихся взаимодействий мала.
Цитата:
 Можно. Но это будет игра со сговором - в ней свои правила, которые очень плохо поддаются формализации.

    Ну и что? Как говорил Кристобаль Хозевич: "Мы знаем, что эта задача неразрешима. Но мы будем ее решать!" Объясняю еще раз - я убежден в оптимальности альтруизма. (Рассуждения, доказывающие данный факт, я приводил, но они являются нестрогими. Тот самый стиль "играй на это плохо!") Конкретные соображения мне нужны для решения вопроса: "как при данных условиях альтруизм может быть эффективно использован?"
   И о повторяющейся игре. Для игры двух игроков с нулевой суммой добавление фактора повторяемости не влияет на оптимальную стратегию. Если для игр с ненулевой суммой иначе, это означает, что эти игры нельзя рассматривать обычными методами. Необходимо учитывать факторы повторяемости, сговора и т. д. - и любой из них может привести к выводу об оптимальности некоторой "альтруистичной" стратегии.

               

               

Мёнин

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #152 : 30/05/2004, 08:30:14 »
Не совсем в тему, но в тред:
Многоходовая игра, очень похожая на ПЗ, в которой, тем не менее, кооперативная стратегия выигрышна.

"искусственное ограничение"

1. Два игрока за ход пассивно получают +3 очка.
2. Каждый игрок может, если захочет, сделать ход, приносящий +2 ему и -8 оппоненту.
3. Такой ход нельзя делать два раза подряд

Пояснение: 1 и 2 создают матрицу
+3 -5
+5 -3,
которая есть обыкновенный Парадокс.
Тем не менее, два человека, рассуждающие рационально, по условию 3 не станут так делать.

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #153 : 31/05/2004, 13:24:17 »
Симагин,

Цитата:

Цитата:
По выигрышу против себя всегда оптимальна максимизирующая общественное благосостояние стратегия.

Ну пусть стратегия S при игре против себя дает результат M. Тогда общее благо будет равно 2*М. Величины M и 2*M максимальны при одних и тех же условиях. M1>M2 тогда и только тогда, когда 2*М1>2*M2


То, что Вы привели - справедливо для любой матрицы взаимодействия по-Вашему?  :o


Цитата:
 Во-первых, вы неправильно посчитали. Если я с вероятностью 0.8 использую стратегию 1, а с вероятностью 0.2 - вторую стратегию, то я получу минимум  1.4 выигрыша.


Не совсем  :) Мы же равновесие ищем, так? Вот если Вы постоянно применяете эту стратегию, то матрица преобразуется к указанному мною виду, и второй игрок уже играет исходя из нового вида матрицы. При этом ему выгодно выбирать 15.

Цитата:
Во-вторых, вы еще и стратегию неправильно поняли. Я написал (0, 0.8, 0.2), а не (0.8, 0.2, 0).


Да, ошиблась. Согласна. Логики это на мой взгляд не изменит.

Цитата:
А это еще что за предположения?


Оно означает что игроки - не вредные :) То есть если у Вас есть выбор - выкинуть старый компьютер на помойку или отдать соседскому ребенку, Вы отдадите его ребенку - потому что Вам все равно, а ему приятно  :D (я упрощаю, конечно - так что не придирайтесь про издержки донесения до помойки, ладно?  ;))

Цитата:
 Ну, доля неповторяющихся взаимодействий мала.


Она разная для разных взаимодействий - это да. Но общая доля неповторяющихся игр на порядки больше повторяющихся. Тем более поскольку мы говорим об играх в целом, а не о дилемме заключенных непосредственно.
Хотите - посчитаем? Сколько у Вас сегодня было стратегических взаимодействий( (игр) со знакомыми людьми?

Цитата:
 Ну и что? Как говорил Кристобаль Хозевич: "Мы знаем, что эта задача неразрешима. Но мы будем ее решать!" Объясняю еще раз - я убежден в оптимальности альтруизма. (Рассуждения, доказывающие данный факт, я приводил, но они являются нестрогими. Тот самый стиль "играй на это плохо!") Конкретные соображения мне нужны для решения вопроса: "как при данных условиях альтруизм может быть эффективно использован?"



Ладно. Давайте к вопросу тогда перейдем что-ли... что значит "при каких данных может быть использован"? Может быть ответ как раз и есть в том, что он может быть эффективно использован в тех случаях, когда это поведение можно сделать равновесным? Тогда мы спорим об определениях все это время.


               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #154 : 31/05/2004, 13:29:56 »
Мёнин,

Цитата:
Многоходовая игра, очень похожая на ПЗ, в которой, тем не менее, кооперативная стратегия выигрышна.


в повторяющейся игре при некоторых условиях в дилемме заключенных равновесие смещается в точку кооперации. Откуда "тем не менее"?  :o

Цитата:
"искусственное ограничение"

....

Тем не менее, два человека, рассуждающие рационально, по условию 3 не станут так делать.

Опять недоспецифицировано у Вас взаимодействие. При разных условиях эта Ваша игра может выродиться в обыкновенную "дилемму заключенных" с некооперативным поведением, а может и не выродиться - при других условиях.

Что Вы хотели показать то?

               

               

Симагин Гендо

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #155 : 01/06/2004, 09:04:34 »
   Биндари,
Цитата:
То, что Вы привели - справедливо для любой матрицы взаимодействия по-Вашему?  :o

   Для симметричной - справедливо. Для несимметричной - тут проблема с определением "общего выигрыша". Я еще раз говорю: общей формулы для коэффициэнтов полезности у меня нет. Для конкретной матрицы я могу вывести некоторые оценки, но не для общего случая. В общем, ситуация пнримерно та же, что для "идеальной шахматной стратегии".
    И еще о симметрии. Можно, условно говоря, поделить игры на 3 типа:
    Вариант 1. Возможности игроков примерно равны. Следовательно, игра является "почти симметричной". В этом случае можно считать общее благо суммой.
    Вариант 2. Мои возможности существенно превосходят возможности соперника. В этом случае все почти тривиально - я могу навязать второму игроку наиболее устраивающий меня вариант.
    Вариант 3. Мои возможности существенно ниже возможностей соперника. Наиболее сложный вариант, но прежде чем "бросать вызов более сильному", стоит разобраться хотя бы с равным. (вариант 1) Если не умеешь играть против равного, какие шансы могут быть против сильного?
Цитата:
 
Цитата:
Во-вторых, вы еще и стратегию неправильно поняли. Я написал (0, 0.8, 0.2), а не (0.8, 0.2, 0).

Да, ошиблась. Согласна. Логики это на мой взгляд не изменит.

   Как это не меняет, если там оптимальный ответ другой?
Цитата:

Цитата:
А это еще что за предположения?

Оно означает что игроки - не вредные :) То есть если у Вас есть выбор - выкинуть старый компьютер на помойку или отдать соседскому ребенку, Вы отдадите его ребенку - потому что Вам все равно, а ему приятно  :D (я упрощаю, конечно - так что не придирайтесь про издержки донесения до помойки, ладно?  ;))

    Тогда опять получается, что "смешанное равновесие Нэша" - это никакое не равновесие. Потому что, если я заменю стратегию с равновесной на более альтруистичную (например, на (0.2, 0.8, 0)), то я ничего не теряю, а второй игрок выигрывает. Но, после того, как я изменил стратегию, второй игрок тоже может изменить свою стратегию - и ситуация опять уходит от "равновесия".
Цитата:

Цитата:
 Ну, доля неповторяющихся взаимодействий мала.

Она разная для разных взаимодействий - это да. Но общая доля неповторяющихся игр на порядки больше повторяющихся. Тем более поскольку мы говорим об играх в целом, а не о дилемме заключенных непосредственно.
Хотите - посчитаем? Сколько у Вас сегодня было стратегических взаимодействий( (игр) со знакомыми людьми?

    Ну, о сегодняшнем дне говорить сложно, по причине времени суток, поэтому буду говорить о вчерашнем. Несколько десятков. И что?
    Потом, кроме количества взаимодейстий играет роль и их качество.  Как говорил Врунгель: "Такой важный товар, как селедка, нельзя оцекнивать поштучно. Вы на вес посмотрите!" Я о том, что взаимодействия надо оценивать по влиянию на полезность, а не количеству.
Цитата:
Ладно. Давайте к вопросу тогда перейдем что-ли... что значит "при каких данных может быть использован"? Может быть ответ как раз и есть в том, что он может быть эффективно использован в тех случаях, когда это поведение можно сделать равновесным? Тогда мы спорим об определениях все это время.

    Можно сказать и так. Но, у меня вот получается, что альтруистичное равновесие невозможно лишь при достаточно малом числе случаев (вроде, "общий выигрыш при различных стратегиях ниже выигрыша при совпадающих, независимо от того, какая именно одинаковая стратегия будет выбрана")

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #156 : 01/06/2004, 15:18:12 »
Симагин,

Цитата:
Для симметричной - справедливо.

Для любой симметричной справедливо, так? Больше никаких условий нет?

Цитата:
Как это не меняет, если там оптимальный ответ другой?


7:10   7:7   7:5
15:0   5:7   5:5

да, тут все равно ожидаемый выигрыш 7 получается, по-моему... хотя точно не скажу - что-то меня сегодня плющит :) не вышло у Вас никому положение улучшить - мудрили-мудрили, а толку никакого :)

Цитата:
 Тогда опять получается, что "смешанное равновесие Нэша" - это никакое не равновесие. Потому что, если я заменю стратегию с равновесной на более альтруистичную (например, на (0.2, 0.8, 0)), то я ничего не теряю, а второй игрок выигрывает. Но, после того, как я изменил стратегию, второй игрок тоже может изменить свою стратегию - и ситуация опять уходит от "равновесия".


а при чем тут равновесие? и при чем тут невредность?  ;)

Цитата:
Ну, о сегодняшнем дне говорить сложно, по причине времени суток, поэтому буду говорить о вчерашнем. Несколько десятков. И что?
    Потом, кроме количества взаимодейстий играет роль и их качество.  Как говорил Врунгель: "Такой важный товар, как селедка, нельзя оцекнивать поштучно. Вы на вес посмотрите!" Я о том, что взаимодействия надо оценивать по влиянию на полезность, а не количеству.


А стратегических игр с незнакомыми людьми у Вас было, полагаю, несколько сотен... и еще непонятно, какой был бы ущерб, если бы Вы сыграли неправильно...   ;)

Цитата:
Можно сказать и так. Но, у меня вот получается, что альтруистичное равновесие невозможно лишь при достаточно малом числе случаев (вроде, "общий выигрыш при различных стратегиях ниже выигрыша при совпадающих, независимо от того, какая именно одинаковая стратегия будет выбрана")

Так вот и неправильно у Вас получается :) а в скобках ТАК сложно написано, что и мне даже задуматься страшно :)
хотя нет - тут я не права.... у Вас получится неправильно, если скорректировать все случаи возникновения дилеммы заключенных в реальной практике на устоявшиеся институты. А корректировать можно и нужно - Вы ведь хотите вносить изменения в поведение - поэтому то, что уже и так отлично устоялось, можно исключить из рассмотрения.

               

               

Симагин Гендо

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #157 : 06/06/2004, 06:17:36 »
Биндари,
Цитата:
Для любой симметричной справедливо, так? Больше никаких условий нет?

    Да.
Цитата:
7:10   7:7   7:5
15:0   5:7   5:5


   Коэффициэнты для первого игрока я дал. Поэтому матрица взаимодействия:
8.6:8 6.6:7 6.6:5
   Опртимальный ответ - первый, и оба выигрыша больше "равновесных".
Цитата:

Цитата:
 Тогда опять получается, что "смешанное равновесие Нэша" - это никакое не равновесие. Потому что, если я заменю стратегию с равновесной на более альтруистичную (например, на (0.2, 0.8, 0)), то я ничего не теряю, а второй игрок выигрывает. Но, после того, как я изменил стратегию, второй игрок тоже может изменить свою стратегию - и ситуация опять уходит от "равновесия".

а при чем тут равновесие? и при чем тут невредность?  ;)

    Ну невредность - это поведение игрокв? На матрицу условия "невредности" накладывать, ясное дело, нельзя. Его и не накладывают - в той же "Войне полов" матрица следующая:
   3:3 0:0
   5:5 -5:15
Цитата:
А стратегических игр с незнакомыми людьми у Вас было, полагаю, несколько сотен...

   Вообще-то меньше.
Цитата:
 и еще непонятно, какой был бы ущерб, если бы Вы сыграли неправильно...   ;)

  Это был бы ИМХО по-любому неправильный ход. Который вел бы к снижению общей полезности.
Цитата:
хотя нет - тут я не права.... у Вас получится неправильно, если скорректировать все случаи возникновения дилеммы заключенных в реальной практике на устоявшиеся институты. А корректировать можно и нужно - Вы ведь хотите вносить изменения в поведение - поэтому то, что уже и так отлично устоялось, можно исключить из рассмотрения.

    Ну будут изменены матрицы взаимодействий. И что? Проблемы это не решит. Взаимодействия будут другими, но решать вопрос о методике все равно придется.

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #158 : 08/06/2004, 18:19:30 »
Симагин,

а что тогда значит "против себя"?


Цитата:
 Коэффициэнты для первого игрока я дал. Поэтому матрица взаимодействия:
8.6:8 6.6:7 6.6:5
   Опртимальный ответ - первый, и оба выигрыша больше "равновесных".


1. матрица меня приводит в восторг  ;)
2. Вы что, ожидаемый выигрыш посчитали, что ли? а зачем?

Цитата:
 Ну невредность - это поведение игрокв? На матрицу условия "невредности" накладывать, ясное дело, нельзя. Его и не накладывают - в той же "Войне полов" матрица следующая:
   3:3 0:0
   5:5 -5:15


не... вот это фигулька - ну никак не "битва полов"  ;) никаким боком  ;) ни в слабой форме, ни в сильной форме  ;)

да, "невредность" - предпосылка о поведении игроков. В матрице ее не видно, да :) она только при попытке найти равновесие всплывает - это, по сути, правило выбора равновесия для некоторых видов матриц. Конечно, оно не универсальное... но в "битве полов" действует, да... оно там не единственное, но действует :)

Цитата:
Вообще-то меньше.


ну, если Вы дома сиднем сидите...


Цитата:
Это был бы ИМХО по-любому неправильный ход. Который вел бы к снижению общей полезности.


1. не факт
2. мы говорим не о дилемме заключенных, а вообще об играх  ;)

Цитата:
Ну будут изменены матрицы взаимодействий. И что? Проблемы это не решит. Взаимодействия будут другими, но решать вопрос о методике все равно придется.

тут Вы точно меня не поняли  :) потому что я даже представить себе боюсь, _что_ Вы имели ввиду под этой фразой :)

               

               

Bindaree

  • Гость
Re: И всё-таки, Парадокс Заключённых!
« Ответ #159 : 08/06/2004, 18:22:20 »
Симагин,

а что тогда значит "против себя"?


Цитата:
 Коэффициэнты для первого игрока я дал. Поэтому матрица взаимодействия:
8.6:8 6.6:7 6.6:5
   Опртимальный ответ - первый, и оба выигрыша больше "равновесных".


1. матрица меня приводит в восторг  ;)
2. Вы что, ожидаемый выигрыш посчитали, что ли? а зачем?

Цитата:
 Ну невредность - это поведение игрокв? На матрицу условия "невредности" накладывать, ясное дело, нельзя. Его и не накладывают - в той же "Войне полов" матрица следующая:
   3:3 0:0
   5:5 -5:15


не... вот это фигулька - ну никак не "битва полов"  ;) никаким боком  ;) ни в слабой форме, ни в сильной форме  ;)

да, "невредность" - предпосылка о поведении игроков. В матрице ее не видно, да :) она только при попытке найти равновесие всплывает - это, по сути, правило выбора равновесия для некоторых видов матриц. Конечно, оно не универсальное... но в "битве полов" действует, да... оно там не единственное, но действует :)

Цитата:
Вообще-то меньше.


ну, если Вы дома сиднем сидите...


Цитата:
Это был бы ИМХО по-любому неправильный ход. Который вел бы к снижению общей полезности.


1. не факт
2. мы говорим не о дилемме заключенных, а вообще об играх  ;)

Цитата:
Ну будут изменены матрицы взаимодействий. И что? Проблемы это не решит. Взаимодействия будут другими, но решать вопрос о методике все равно придется.

тут Вы точно меня не поняли  :) потому что я даже представить себе боюсь, _что_ Вы имели ввиду под этой фразой :)