乐于分享
好东西不私藏

多模态生成式AI驱动的图形化编程辅助工具

多模态生成式AI驱动的图形化编程辅助工具

《MindScratch: A Visual Programming Support Tool for Classroom Learning Based on Multimodal Generative AI》发表于International Journal of Human-Computer Interaction期刊,这项研究开发了一个多模态生成式人工智能支持的图形化编程辅助工具。

1. 研究背景与挑战

  • 编程教育是K-12教育的重要组成部分,被广泛认为是培养学生计算思维 (Computational Thinking, CT) 的有效途径 

  • 然而,教师在教学中面临一个困境:如何在死板的知识传授与高参与度的项目式学习之间取得平衡 

  • 当前的编程辅助工具(如CodeToon, Visual StoryCoder等)在课堂应用中存在不足,难以反映课堂教学目标、缺乏可控的引导流程,且较难为学生提供及时的个性化反馈 

为明确现有工具的局限性,研究者进行了形成性研究,得出以下对比结果:

2. MindScratch 系统设计

为了解决上述挑战,研究团队开发了 MindScratch,这是一个由多模态生成式人工智能 (GAI) 驱动的视觉编程辅助工具 。该工具旨在平衡结构化的课堂活动与自由编程创作 

3. 核心技术模块

MindScratch 的后端依托于大语言模型 (LLM) 和多模态生成模型:

  • 分阶段对话流程:系统通过项目规划、材料创建、代码实现三个阶段引导学生 。

  • 多模态资产生成:利用Stable Diffusion进行文本/草图到图像的生成,并利用基于扩散模型的文本到音频模型生成音效,从而满足学生的个性化表达需求 。

  • 支架式代码助手:系统微调了GPT-3.5模型,不直接给出完整代码,而是提供逐步的逻辑建议和代码块 。

4. 实验设计与评估指标
研究采用被试内实验设计,招募了24名五年级学生,分别使用原版Scratch和MindScratch完成两个主题式编程任务 
5. 研究结果
RQ1 (学习目标达成度):使用MindScratch时,全部24名学生都成功完成了教师设定的任务和学习目标;而使用Scratch时仅有13名学生达成 
RQ2 (代码质量与CT技能):MindScratch组的Dr.Scratch总分显著高于基线组(14.17 vs. 9.96),表明其将学生的代码水平从“基础”提升到了“精通”级别 
RQ3 (创造力支持):学生在MindScratch组的思维导图节点平均数 (52.45) 远超基线 (35) 。创造力支持指数 (CSI) 显示 MindScratch 在所有六个维度上得分均更高 
RQ4 (教师视角):受访的6名教育工作者总体上对MindScratch印象积极,认为它能减轻教师负担并引导学生将想法具象化 。但也提出了一些担忧,如对大模型产生幻觉的风险担忧,以及希望能增加教师端的学生监控仪表板等