前沿

  • 人工智能赋能教育评价改革与创新

    郑勤华;

    <正>2024年全国教育大会的召开与2025年初《教育强国建设规划纲要(2024—2035年)》的颁布实施,为深化教育领域综合改革提供了纲领性指引。其中,深化教育评价改革,“树立科学的教育评价导向”被置于核心位置,凸显构建支撑“人才自主培养质量全面提高、拔尖创新人才不断涌现”的新型评价体系,已成为教育强国建设的战略支点。在此背景下,以人工智能为代表的数字技术,为破解评价难题、提升评价的科学性、专业性与客观性开辟了新赛道。

    2025年05期 v.71;No.333 589-590页 [查看摘要][在线阅读][下载 1093K]
    [下载次数:2680 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ]

智能测评

  • 大语言模型在无锚题等值中的应用:以阅读素养测评为例

    杜君磊;郑勤华;宋义深;

    在实际的教育测评中,针对同一能力的不同测评通常不会使用相同的题目。现有方案在实现无锚题场景下的测评分数等值时,存在依赖额外题目信息或实施成本高昂等问题。本研究提出了一种基于大语言模型的低成本且无需额外题目信息的无锚题等值方案。其主要原理是利用大语言模型在待等值测评之间构建连接组,从而实现等值。本研究以两份小学阅读理解题为例,分别选取GPT3.5、GPT4.0和讯飞星火3.5构建连接组,从提示词工程(zero-shot、one-shot和few-shot)和连接组样本数(500和1 000)两个方面对比其在等值上的成效。研究结果显示,GPT4.0在大样本连接组的one-shot和few-shot场景下表现良好,表明以大语言模型智能体作为无锚题连接组的设计方案是可行的。

    2025年05期 v.71;No.333 591-598页 [查看摘要][在线阅读][下载 912K]
    [下载次数:934 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 联合文本和视频信息的学生身体素质自动测评模型构建

    周炫余;肖天星;王紫璇;郑勤华;吴莲华;张思敏;

    身体素质作为综合素养的重要组成部分,对其精准测评有助于推动教育评价改革。传统的身体素质测评方法大多依赖于人工经验,存在测评结果滞后、难以大规模应用等问题。针对上述问题,提出一种联合文本和视频信息的学生身体素质自动测评模型。首先该模型通过文献分析法、专家打分法确立身体素质内涵与指标维度;其次为解决开放域环境下测评环境复杂和主体混淆等问题,提出一种双向特征增强的运动主体检测方法,通过文本特征消除视频信息特征歧义,精准推理测评主体区域序列;最后基于动作识别网络过滤测评主体区域无效帧序列获得有效帧序列,分析其骨骼点变化情况,计算身体素质可计算行为,获得身体素质测评分数。在自构建的身体素质自动测评数据集上测试表明,联合文本和视频信息的学生身体素质自动测评模型处理1 min视频为2.6 s,平均准确率为91.22%;将该测评模型应用于280万学生的身体素质测评,表现出较好的准确性和鲁棒性。

    2025年05期 v.71;No.333 599-608页 [查看摘要][在线阅读][下载 1088K]
    [下载次数:678 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:5 ]
  • 面向师范生的思政育人能力数字化评价方法

    杨楷芳;肖哲;王子浩;公衍超;吕张号;

    师范生的思政育人能力的有效评估是保障基础教育课程思政改革质量的关键内容。针对面向师范生思政育人能力指标体系缺乏、数字化、智能化评价方法不足、数字化评价平台缺失的问题,本文首先构建了面向师范生的思政育人能力评价指标体系,设计了对应的思政育人能力测评问卷;其次,构建了师范生思政育人能力数字化评价平台,针对测评结果分别构建BERTTextCNN级联特征增强网络(BERT-CFEN)和思政育人能力解析教育智能体,进而提出双通道思政育人能力评估模型,实现师范生思政育人能力的量化评估。在构建的思政育人能力测评数据集(AIPEA)上的测试表明,本文方法对育人元素识别F1为95.45%。最后,构建了用于师范生思政育人能力数字化评价及可视化分析的数字化平台,并将该评价方法和平台应用于三个不同年级的师范生进行思政育人能力测评,验证了所提方法在师范生思政育人能力评价方面的有效性。

    2025年05期 v.71;No.333 609-620页 [查看摘要][在线阅读][下载 1338K]
    [下载次数:628 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ]
  • 融合行为与情感分析的课堂学习投入智能评估

    徐亚萍;李艳燕;郭威彤;唐夕人;单玉刚;李红慧;

    高效且准确地评估课堂学习投入是动态追踪学习进程和提升教学质量的关键。然而,现有研究面临分析维度单一与模型泛化能力不足等问题。为应对这些挑战,本研究以深度学习技术为核心,提出了一种融合行为和情感分析的课堂学习投入智能评估方法。该方法涵盖数据集构建、深度学习模型训练、模型评估、模型应用及统计分析等全流程。研究结果表明,所训练的深度学习模型在行为与情感分析任务中展现了优异的准确性与鲁棒性。通过对某班级课堂实录视频的案例分析,本研究从个体与班级整体层面进一步揭示了课堂学习投入的动态演变过程,验证了该方法在实际教学中的有效性与可行性。

    2025年05期 v.71;No.333 621-633页 [查看摘要][在线阅读][下载 1623K]
    [下载次数:1581 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:3 ]

智能分析技术

  • 基于平滑性无监督领域自适应的开放世界目标检测

    黄正翔;李书玮;齐恺;蔡杰超;徐锲;卢笑;吴成中;王耀南;

    开放世界目标检测(Open World Object Detection, OWOD)旨在检测环境中的未见目标,是智慧教育领域中诸多问题的上游任务。现有的方法通过选择前K个置信度最高的前景进行预测,直接将在已知类别上训练的检测器泛化到检测其他的未知前景目标上。然而这种方法使检测器偏向检测已知类别,难以识别全部未知目标。对此,提出了一种基于平滑性无监督领域自适应的开放世界目标检测方法。首先,利用两阶段目标检测Faster-RCNN为每一张图像生成候选区域,将目标得分高与目标得分极低的候选区域作为源域,将剩余候选区域作为目标域。然后,采用平滑性无监督领域自适应方法,学习前后景分类器,该方法通过引入平滑域对抗训练过程,能有效地提高域对抗方法在分类任务中的性能,实现对已知和未知类别的前景目标无偏向预测。在MS-COCO数据集以及自行构建的化学实验器材检测数据集上进行模型性能的评估实验。结果表明,相比于直接选择置信度最高的预测,本文提出的方法能更好地平衡已知和未知目标类别的检测,提高检测器的整体性能。

    2025年05期 v.71;No.333 634-642页 [查看摘要][在线阅读][下载 1184K]
    [下载次数:359 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ]
  • 数据驱动的教师言语行为识别新方法

    马苗;康璐;李雨桐;崔家郡;

    准确识别和分析教师言语行为是课堂教学智能评价的重要手段,也是建立教师数字画像的客观依据,然而现有研究多忽视了教师的口头禅、不规范语言、甚至语言暴力等不当行为,为此本文将这类不当行为引入至教师言语行为分析,针对其样本量少、隐蔽性强的特点,提出一种基于双流图卷积网络自适应融合模型的教师言语行为智能识别新方法。该方法首先在弗兰德斯互动分析系统基础上引入教师不当言语,建立教师课堂言语行为编码规则;然后构建双流图卷积网络自适应融合模型实现教师言语行为识别,即利用图卷积网络与图注意网络提取教师言语的全局特征与局部特征,引入自适应特征融合策略实现二者的深度融合,采用文本自训练方法减少语义误差。在作者构建的教师言语行为专用数据集上进行了实验,实验结果表明,所提方法能准确且有效地检测不当言语行为,可将其用于课堂教学过程的督导及教师职业素养的提升。

    2025年05期 v.71;No.333 643-651页 [查看摘要][在线阅读][下载 1121K]
    [下载次数:120 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ]
  • 基于褶纹基元关系感知的高效面部表情识别方法

    刘婷婷;王敏红;邓李茜;周启云;刘海;杨兵;

    面部表情识别(Facial Expression Recognition,FER)是计算机视觉领域的重要研究方向,但在教育场景的实际应用中仍面临诸多挑战,如遮挡、光照变化和头部姿态干扰等问题。本文定义了褶纹基元和褶纹基元关系;采用褶纹基元刻画面部局部区域因肌肉形变引发的方向性纹理特征,利用褶纹基元关系刻画其几何关联;指出褶纹基元具有高斯亲和、类间共享和类内不变特征。在此基础上,提出一种基于褶纹基元感知的高效面部表情识别模型P~2FER(Pleated Primitive for Facial Expression Recognition)。在该模型中,设计了高斯亲和褶纹基元提取模块,用于捕获面部表情特征的多样性。通过引入高斯亲和褶纹基元,模型能够学习更具区分性的特征,增强特征空间的多样性,从而对不同类别表情的分类起到关键作用。为进一步增强模型对不同表情特征的建模能力,本文提出褶纹基元线索感知模块。该模块通过构建正负样本对,结合类关系设计了一种新颖的损失函数,实现类间共享褶纹基元与类内不变褶纹基元的协同挖掘,借助于不同类别间褶纹基元关联关系建模。该模块显著提升了模型对表情的识别能力。在RAF-DB和FERPlus数据集上的实验表明,本文模型在多项指标上均优于现有方法,性能提升显著。实验结果验证了高斯亲和褶纹基元提取模块与褶纹基元线索感知模块的有效性,表明用褶纹基元关系建模可增强模型的泛化能力。

    2025年05期 v.71;No.333 652-666页 [查看摘要][在线阅读][下载 1909K]
    [下载次数:332 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ]
  • 基于BERT和BiGRU的数字产业岗位实体识别与人才画像

    杨彦武;翟盼雨;金颖;

    构建了一个面向数字产业的实体识别与人才画像(BERT-BiGRU-Attention-CRF)模型。该模型融合了BERT和BiGRU两种表征学习方法,根据句子的上下文语义进行文本表达,并采用多头注意力加强关键语义信息,然后利用条件随机场(CRF)方法对文本进行分类,识别岗位的人才需求。抓取国内三大主流网站上数字产业相关岗位的最新招聘信息进行分析,结果表明,BERT-BiGRU-Attention-CRF模型在Precision、Recall和F1指标上的表现均显著优于基线模型。根据岗位与需求之间的关系,采用BERT-BiGRU-Attention-CRF模型构建数字产业人才知识图谱与岗位人才画像,通过分析数字产业人才知识图谱中各岗位所连接的节点得到不同岗位对人才需求的共同与差异之处。

    2025年05期 v.71;No.333 667-679页 [查看摘要][在线阅读][下载 1188K]
    [下载次数:1458 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:4 ]
  • 基于大小语言模型协同的评教文本方面级情感分析模型

    王紫璇;卢笑;周炫余;吴向文;刘林;张思敏;

    利用方面级情感分析方法对学生评教文本进行分析,对于促进教学质量的提升具有重要意义。现有的方面级情感四元组抽取方法主要包括基于判别式的方法和基于生成式的方法,然而基于判别式的方法未充分考虑方面级情感元素之间的关联语义,基于生成式的方法过于依赖模板质量,在理解隐式情感方面仍有改进的空间。针对上述问题,提出一种基于大小语言模型协同的评教文本方面级情感分析模型,该模型通过基于大语言模型的推理策略对评价文本进行深层次的语义理解和隐式情感推理,将模糊情感明晰化,以增强模型对于隐式情感的识别能力;接着设计了基于小模型的双层交互策略,通过浅层次和深层次交互充分捕捉上下文信息,实现评教文本中隐式情感的细粒度分析。实验结果表明,在Laptop、Restaurant公共数据集以及自构建的教学评价数据集中,该模型相较于最优对比模型的F1分别提高了0.24、0.60和1.05个百分点。此外,通过一系列消融实验和对比实验进一步验证了该方法的有效性。

    2025年05期 v.71;No.333 680-689页 [查看摘要][在线阅读][下载 1027K]
    [下载次数:1000 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ]

生成式人工智能应用

  • 基于查询扩展和强化学习的大语言模型个性化答疑方法

    张士伟;周嘉诚;洪亮;沈明轩;熊福成;杜烨;

    近年来,大语言模型凭借海量的参数化知识和强大的自然语言处理能力,为个性化答疑提供了新的技术手段。然而现有方法仍面临若干问题,包括无法深度挖掘学生个性化需求、生成回答的针对性不足,以及缺少可靠背景知识导致的回答准确性受限。为此,本文提出一种基于查询扩展和强化学习的大语言模型个性化答疑方法。首先,根据教学图谱对原始提问进行扩展,融入学生和课程的个性化信息;其次,设计基于学生背景识别任务的强化学习算法,通过反馈机制引导模型更好地对齐学生特点;最后,结合检索增强生成框架从教学知识库中动态提取参考资料,进一步提升回答的准确性和可靠性。在MOOCCubeX数据集的实验表明,相较于基线方法中最好的对比方法,本文方法在知识背景、学习风格、学习进度和兴趣导向等个性化维度匹配度上分别提高了0.210、0.156、0.222和0.168,回答准确率提升0.086 1。

    2025年05期 v.71;No.333 690-701页 [查看摘要][在线阅读][下载 1064K]
    [下载次数:513 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ]
  • 基于知识增强大语言模型的小学科学测试题生成方法

    刘明;吴忠明;王家壹;李向前;廖剑;刘礼;

    智能测试题生成是科学教育数字化转型的重要环节,其核心目标是利用人工智能技术基于教材内容和知识点自动生成高质量测试题。当前研究表明大语言模型在智能测试题生成方面具有较好的效果,但依然需要应对专业知识不足的挑战。为此,提出一种知识图谱引导大语言模型生成科学测试题方法,以提升大语言模型对科学概念及其相互关系的理解能力,从而优化测试题生成质量。本研究首先在科学教育专家指导下,基于小学科学教材构建结构化知识点库和细粒度学科知识图谱;其次,依据教育用户选择的知识点,在知识图谱库中检索最相关的子图;最后,将知识图谱子图、知识点及学段信息以提示语的方式注入大语言模型,以生成多项选择题、填空题和简答题。实验评估表明,基于图结构的1-hop知识图谱的注入大语言模型,生成试题的接受度为95.4%,在学科适应性、试题多样性和质量控制方面均优于已有的方法(接受度为87.0%),但在题目难度控制上仍有待提升。

    2025年05期 v.71;No.333 702-711页 [查看摘要][在线阅读][下载 1168K]
    [下载次数:744 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ]
  • 生成式人工智能赋能综合素质评价:应用场景与面临的挑战

    闵小晶;胡雪梦;王娟;

    随着数字化转型的推进,生成式人工智能(Gen AI)为教育评价范式革新提供了新的技术路径。本文深入探讨了Gen AI技术赋能综合素质评价的逻辑机理、应用场景、面临的挑战及应对策略。通过对Gen AI赋能教育评价相关案例的分析,将应用场景归纳为评价内容多维整合、评价结果动态适配、评价方式融合创新、评价主体协同参与。同时指出,其应用也面临评价目标偏离、评价主体能力不足、评价内容偏颇以及伦理与隐私风险等问题。提出了价值校正、主体增值、内容精控和安全保障等策略,以促进Gen AI技术与综合素质评价的深度融合,推动教育评价体系的持续优化与创新发展,助力新时代高素质人才的培养。

    2025年05期 v.71;No.333 712-720页 [查看摘要][在线阅读][下载 1007K]
    [下载次数:4551 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ]

知识结构建模

  • 面向知识结构化的最近发展区建模

    骈扬;余胜泉;

    维果茨基的最近发展区理论在实际应用中面临着评估方法主观性强、评估任务单一且难以推广、评估结果欠缺清晰的教育可解释性等问题。针对上述问题,以新课标强调的知识结构化思想为指导,借助人工智能、教育测量等技术,构建了面向知识结构化的学习者最近发展区模型,能够支持最近发展区的测评、计算、可视化、教学改进等多个关键教育业务环节,实现对学习者认知发展状态及潜能的清晰表征与有效评估。基于所构建的模型开发了支撑系统并开展了应用效果检验,研究结果表明,面向知识结构化的最近发展区模型及其支撑系统能够有效提升教学精准化程度,促进学习者的认知发展,推动教学过程向数据驱动的科学决策和精准改进转变。

    2025年05期 v.71;No.333 721-734页 [查看摘要][在线阅读][下载 1332K]
    [下载次数:1246 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ]
  • 基于知识种群的网络化知识演化分析

    王怀波;武义蒙;李冀红;

    从知识生态学宏观尺度出发,旨在探索互联网知识社区中知识演化规律,为互联网时代知识发展及教育实践提供支撑。构建了知识种群演化理论模型,引入了“凝聚度”指标,结合知识单元分布密度与语义关联性,设计了种群强度计算及家族树演化方法。以cMOOC“互联网+教育:理论与实践的对话”中“消费驱动的教育供给侧改革”主题内容为数据基础,从种群规模、强度及家族树变化多维度分析知识种群演化特征与规律。研究发现,知识演化是非线性、循环往复的过程,知识种群发展经历形成、发展、稳定、衰退阶段,各阶段知识种群规模、强度等呈现不同变化特点,还存在知识种群的相互兼容、新种群生成等现象。本文为互联网教育实践提供量化指标与操作方法,对在线教育组织实施和未来发展提供有价值的参考。

    2025年05期 v.71;No.333 735-746页 [查看摘要][在线阅读][下载 1338K]
    [下载次数:275 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ]
  • 数智赋能大学生综合素质评价的价值定位、模型构建与实施路径

    余亮;候梦瑶;

    数智技术的发展和应用为教育评价变革带来新动能。从评价主体的多元参与、评价过程的感知融合和评价结果的精准分析三个方面探讨数智赋能大学生综合素质评价的价值定位。以三元空间理论为基础,构建基于“人-机-事-物-场”的大学生综合素质评价模型。在此基础上,探讨数智赋能大学生综合素质评价的实施路径,从物理层、数据层、分析层、服务层和交互层构建大学生综合素质评价的实施架构,并从初期、中期和远期三个阶段探讨综合素质评价的实施路线,以期为数智赋能大学生综合素质评价实践提供参考。

    2025年05期 v.71;No.333 747-760页 [查看摘要][在线阅读][下载 1245K]
    [下载次数:2707 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ]

  • 深化人工智能技术应用 赋能学生综合发展科学评价

    陈丽;郑勤华;吴砥;嵩天;龙军;周炫余;

    <正>随着人工智能技术的快速发展,教育信息化已迈入新时代。从生成式大模型到教育大数据分析与挖掘,人工智能正不断渗透教育领域的各个层面,为人才培养的信息化、智能化提供了强有力的技术支撑。在此背景下,学生综合素质评价作为完善人才培养与选拔机制的重要环节,成为新时代基础教育改革的关键任务。如何借助人工智能的感知、连接、计算与处置能力,实现综合素质评价的科学性、客观性与可解释性,从而更好地发挥测评的导向作用,成为学界关注的重大议题。

    2025年05期 v.71;No.333 585-586页 [查看摘要][在线阅读][下载 197K]
    [下载次数:169 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ]
  • 下载本期数据