分享
2023年基于博弈论的竞赛学习对学生学习动机影响研究.doc
下载文档

ID:483947

大小:64KB

页数:5页

格式:DOC

时间:2023-04-03

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023 基于 博弈论 竞赛 学习 学生 动机 影响 研究
基于博弈论的竞赛学习对学生学习动机影响研究x 肖达信 摘 要:本文从经典的博弈理论出发,运用“合作与竞争〞的思想解决存在矛盾与冲突的问题,设计“矩阵游戏〞与“竞猜硬币〞的竞赛学习模型,并进行实验研究,分析学习者在学习模式中最优策略的选择,探讨竞赛学习对学生学习动机的影响。结果显示,竞赛学习模式激发学生学习动机,提高自身竞争力,改善学习绩效。 关键词:竞赛学习,博弈论,合作,竞争,学习动机 博弈论,又名对策论〔英文是Game Theory〕,是应用数学的一个分支,其研究具有斗争或竞争性质行为〔即博弈行为〕的数学理论和方法[1]。在这类行为中,参加斗争或竞争的各方具有不同的目标或利益,为了到达各自的目标和利益,各方必须考虑对手的各种可能行为,并力图选取对自己最为有利或最为合理的方案。博弈论的思想在我国有着悠久的历史,古代的孙子兵法就不仅是一部军事著作,而且算是最早的一部博弈论专著,如今在经济、管理、政治、军事、公共选择等方面都已经得到广泛的应用。 竞赛学习是通过竞赛或竞争的形式习得知识的学习模式,是基于游戏学习的一种。竞赛学习策略结合协作学习,基于项目、问题、游戏的学习等理论,激发学生的学习动机,改善学习绩效。本文利用博弈论的思想设计竞赛学习策略,将其与计算机程序设计课程的学习相结合,比照学生不同时期的学习反响与效果,探讨“竞赛学习〞这一具有游戏特性和教育意义的学习模式对学生学习动机的影响。 一、“囚徒困境〞与“重复博弈〞 博弈行为通常由个人、团队或组织,面对一定的环境条件,在一定的规那么约束下,依靠所掌握的信息,同时或先后、一次或屡次从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程[2]。利用博弈行为中的合作博弈与非合作博弈分析竞赛学习中尤为凸显的协作与竞争,探究策略选择问题。 “囚徒困境〞是博弈论的非零和博弈中具代表性的例子,反映个人最正确选择并非团体最正确选择,是典型的非合作博弈模型,囚徒困境的主旨为,警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:假设一人认罪并作证检控对方〔相关术语称“背叛〞对方〕,而对方保持沉默,此人将即时获释,沉默者将判监10年。假设二人都保持沉默〔相关术语称互相“合作〞〕,那么二人同样判监半年。假设二人都互相检举〔互相“背叛〞〕,那么二人同样判监2年[3]。如图1所示,囚徒们虽然彼此坚不吐实,可为全体带来最正确利益,但因为出卖同伙可为自己带来利益,也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最正确共同利益,反而是自己最大利益所在。因此在“囚徒困境“一次性的博弈中,双方都选择背叛是一个纳什均衡, 但显然不是顾及团体利益的解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低,这就是“困境〞所在。 B 合作 B 背叛 A 合作 -1, -1 -10, 0 A 背叛 0, -10 -8,-8 图1 “囚徒困境〞博弈 “囚徒困境〞的博弈次数只为一次,博弈双方并不选择合作而选择彼此认为利益最大的背叛,但当“囚徒困境〞扩展为多人博弈时,就出现很多矛盾与问题,共有的资源是有限的,当每个人都试图从有限的资源中多拿一点儿时,就产生了局部利益与整体利益的冲突。艾克斯罗德做了个实验,他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。他邀请很多人来实验,得分规那么和“囚徒困境〞矩阵一样,什么时候结束游戏是未知的。 第一次比赛时共有15个策略(程序)参加,艾克斯罗德将每一策略分别和所有策略对弈,运转200步,结果得分最高的程序是加拿大学者罗伯布提交“TFT策略〞〔即“一报还一报〞(tit for tat)〕,该程序第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。 为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是:“一报还一报〞仍是最优策略[4]。 “重复博弈〞实验证明了在博弈被反复地进行中,每个参与者都有时机去“惩罚〞另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。 二、关于游戏学习动机的研究 学习动机是影响学习的重要内部因素,是教育理论和心理学研究的一个重要主题。学习动机是指个体由一种学习目标或对象引导、激发和维持学习活动的内在心理过程或内部动力。来自于17173的2023年“第七届中国网络游戏市场调查报告〞数据显示,30%的游戏玩家玩游戏的主要目的是纯粹娱乐;其次是消遣时间和交朋友,其比率分别为14.66%和14.38%;以从游戏中获得现实收益的只占13%;随后的游戏目的是消遣时间〔9%〕和在游戏中成为高手受人尊重〔5%〕[5]。此时游戏玩家玩游戏的最主要目的是娱乐,其次是交朋友和锻炼智力。2023年调研参与用户游戏目的分析显示,娱乐和交友所占比例最高,分别到达了56.5%和42.1%;而游戏中成为高手受人尊重和从游戏中获得现实收益比例有所上升,分别为22.4%和17.8%[6]。说明人们在面对游戏时,娱乐目的最为明显,但逐渐在游戏中增加交流与沟通,玩家可通过游戏交友和收益知识,可见,游戏“有助于学习〞的特性逐渐增加。 影响学习者学习动机的因素很多,诸如学习者的需要,对学习活动的好奇心、兴趣,胜任感和成就感等[7]。学习者在学习活动中感受到的乐趣越多,就越愿意主动参与并完成任务,学习动机就越高,除此之外,具有挑战性活动能激发学习者学习兴趣,友好的竞争活动能增强并提高自身竞争力,这些动力能促进学习者更好的完成活动内容。竞赛学习这种以游戏形式呈现给学习者的学习模式,在挑战与竞争中引发学习者正面且高涨的情绪,在知识性与趣味性结合的活动过程中完成知识学习。 三、竞赛学习模式的设计及实验研究 本研究选取徐州市北大青鸟2023年开设的计算机软件程序设计实验课为例,跟踪调研使用竞赛学习模式的两门课程,通过介绍竞赛学习过程,提交小组最正确程序设计以及学生对该课程学习兴趣及结果的反响,探索竞赛学习对学生学习动机的影响。 〔一〕“矩阵游戏〞 在课程的学习中,设计使用基于P2P模型,由N个参与者参加的文件下载矩阵游戏,将参与者分为G个小组,每个成员为一组,要求彼此运用智慧与技巧与对方实现文件交换,计数方式参考“囚徒困境〞矩阵。 模拟文件的交换过程,首先定义一个2X2的矩阵,竞赛双方可有两个选择:合作〔C〕或背叛〔D〕,每次背叛行动的一方即不共享资源。在交换文件的过程中得分规那么如图2所示,彼此分享各自的资源即可获都获得5分,假设一方保守〔不分享资源〕一方共享,那么共享者获得0分,另一方获8分,假设彼此都不共享资源那么获得0分。 甲 分享 甲 保守 乙 分享 5, 5 0, 8 乙 保守 8, 0 0, 0 图2 矩阵游戏的“囚徒困境〞 假设一方的分享无条件地被另一方吸取时,游戏双方可能都不愿意无条件地分享资源,矩阵游戏的各小组都想获得更大的利益,导致双方疏离甚至封闭。所以他们宁愿选择“保守,保守〞,不共享资源。 这是竞赛游戏的“困境〞所在,而通过实验并分析学习者最优策略的选择, 在提交的最优策略的算法程序中,绝大多数学生是将罗伯布的TFT策略算法加以修改,其中有一最正确算法,主要内容为:在起初的四个轮回中使用TFT策略,随后应用以下方法,假设有连续两个轮回对方选C我方选D,那么继续选D;假设连续两个回合双方均选C,那么继续使用TFT策略;假设最后一个回合对方选D,那么我也选D,假设非,那么保持当前选择。 在课程结束后对41名学生学习兴趣与结果的调查反响中得知,学生相当支持基于博弈的竞赛学习方式,但对于与其他组员的互动,多数学生保持中立。如表1所示。 表1 “下载文件竞赛游戏〞学习兴趣反响数据 1分 2分 3分 4分 5分 均分 该竞赛游戏是否有趣 0 3 9 15 17 4.04 竞赛能否促进小组互动 11 9 7 9 6 2.82 竞赛学习模式能否激发学习兴趣 0 2 12 22 8 3.81 该游戏与学习内容是否匹配 0 4 12 8 20 4.00 在学习中是否希望使用博弈 0 2 14 19 9 3.79 〔二〕“竞猜硬币〞 游戏中每个参与者手中有0-3个硬币,共N个参与者,每人有权藏0-3个硬币,因此当每个人都藏完,即被隐藏的硬币就有0-3xN个。此时,第一个选手报出他认为的隐藏硬币个数,依次下去,每个玩家报的数字不得和上一个玩家相同。裁判说其中某选手的报数为正确答案时,该选手离开游戏,直到剩下一个选手为止,游戏结束。 该算法课主要训练学生应用统计学方法编写程序。胜利的玩家运用大数定律,这些“有规律的随机事件〞在大量重复出现的条件下,往往呈现几乎必然的统计特性,在试验不变的条件下,重复试验屡次,随机事件的频率近似于它的概率[8]。所有的正确结果呈正态分布,而最可能的值是位于最小值与和最大值之间。 如表2,在对40名学生学习兴趣与结果的调查反响中得知,学生相当支持基于博弈的竞赛学习方式,且较前一次实验课比,学生之间的交互有所增强,因为每一轮游戏都有多名学生共同参与,而非两人之间的博弈。 表2“竞猜硬币〞学习兴趣反响数据 1分 2分 3分 4分 5分 均分 该竞赛游戏是否有趣 0 5 7 7 21 4.10 竞赛能否促进小组互动 2 1 28 5 4 3.15 竞赛学习模式能否激发学习兴趣 0 6 15 5 14 3.67 该游戏与学习内容是否匹配 0 5 3 13 19 4.15 在学习中是否希望使用博弈 0 4 12 9 15 3.87 〔三〕竞赛游戏的评价综述 在对上述两节实验课的调查中,影响学生是否选择竞赛学习模式完成程序学习的几个维度: x竞赛学习模式能否加强知识的掌握; x竞赛学习是否会给学生带来压力; x设计的竞赛游戏是否有趣; x通过竞赛进行学习能否不断激起学习的兴趣; x学习的过程中参加竞赛能否提高彼此的竞争力; x能否在竞赛学习中促进彼此合作,增强人际关系; x在竞赛的过程中能否培养学生的奉献精神; x学习中是否需要不断思考,引发新的学习创新; 对两个实验样本平均结果的进行比照分析显示,如表3,调查问题2的普适性最低,不同的样本对该项调查的反响意见不集中。结合学生考虑参与竞赛游戏的学习动机,发现这些动机能让学生学到更多的〔包括专业知识以外〕知识。 表3样本调查比照表 下载文件竞赛游戏 竞猜硬币 差值 百分比 问题1 4.04 4.10 0.06 1.2 问题2 2.82 3.15 0.33 6.6 问题3 3.81 3.67 0.14 2.8 问题4 4.00 4.15 0.15 3.0 问题5 3.79 3.87 0.18 3.6 通过测试,并比照上一个月学生学习程序设计的学习结果,竞赛学习模式下学生对知识的掌握情况较好,如表4所示,基于竞赛学习,学生完成任务情况普遍超过90%,但这并不意味着竞赛学习比其他任何学习策略好,它作为一种学习技术来激发学生的学习兴趣,在合作、竞

此文档下载收益归作者所有

下载文档
收起
展开