什么是好的课程-一点思考
在帮老师审核《编译原理》课程AI生成视频的录音和讲稿是否对应,有几点感慨。本科以来,我没有思考什么是好的课程(大概是高中之前好的讲课方式习惯了,所以很多时候我很奇怪为什么大家都觉得某些课很烂),这里写下一点思考。
初中时代的课程
初中时代,实际上是我交互最多的时候,尤其是在数学课上。对于一个证明,王mj和另外一个老师(忘记名字了,朱??)会在纸上写详细过程,然后问大家一些过程是否正确,同学们也会有相应的回复。老师也会提出一些问题,底下的同学也会回答。这种积极的互动方式大概在之后的阶段都没有出现了。
高中时代的课程
我是乡镇读的初中,所以不知道城市(虽然我读的高中所在的也只能算一个小县城了)里面的同学是怎么上课的。也许是初中的上课体验过于特殊,所以在数学课上当朱jh老师提问的时候,我很惊讶大家居然都是沉默,没有反应和回复。水哥和春哥的互动还是很多的。
大学时代的课程
PPT reader的重灾区以及缺失的attention。
不同于高中的课程,大学课程更多使用了一块大的幕布和PPT展示。虽然有激光笔的帮助,但是激光笔晃来晃去实在是很难让人集中注意力。在黑板上写字确实会效率比较低,人手的范围也不够大,但是真是这种慢速给了人接受的时间和集中注意力的时间。人的注意力是有限的(attention is all you need),所以更少的指示抖动(即人手抖动相比于激光笔抖动)实际上在帮助学习者更好学习理解新的观点和内容。
此外,大学也是静态PPT的重灾区,很多时候,只是展示了一些静态的知识点和一些静态的关系,却缺失了动态的生成过程。可以说这是一种抽象,但是人要理解抽象必须从具象入手,即不同对象之间的关系是怎么建立的。这就需要动态的一些演示。而动态演示最简便的方式也就是人在黑板上写字画画。slides可以展示动态效果,但这受限于工具(只要是工具,就一定有其局限性,这点在 如何记笔记 中也有提到),包括人需要掌握这些工具,人需要检查效果是否符合预期。此外在USTC这个重视科研但对教育激励政策很少的条件下,大多数教授更倾向于减少在PPT上的投入,所以也就出现了PPT reader的情况。人都是有精力限制的,在当前环境下,受到各种限制(包括这次AI生成视频)以及科研成果的要求,很难做到兼顾。
AI生成教学视频的“噱头”
这里终于可以谈到AI生成教学视频的“噱头”了。到底是不是噱头呢?我觉得更多是被绑着走了。
首先为什么会有AI生成教学视频这一件事情?因为AI很火。啊,AI可以自动化好多东西。但是现状呢?因为各种基础设施的不完备,AI还没有办法做到完全自动化。所以需要alignment,需要对齐人们的需求。那再问:为什么需要生成教学视频?因为其他欠发达地区的同学要看。这是非常合理的。但是现状是什么呢?这些教学视频真的可以帮助他们吗?我想不完全是的。
这些生成的视频现状是什么呢?有一个PPT展示,有一个AI虚拟人按照稿子念,同时加一些重复的手势。
按照前面几节提及的内容,这里存在的问题是什么呢?
- attention取决于slides的动态演示
- AI虚拟人只会无情念稿,无法互动,无法根据反馈实时调整(当然这也是网课固有的缺点,但是更多的问题在于生成的东西本身不会基于反馈做调整,而网课则可能会根据反馈进行调整)
- 稿子毕竟是写好的,可能会存在书面语的情况(当然也不排除有人语音转文字了,那为啥不直接语音录制全部内容呢)
当然AI视频也有优点,例如更少的瑕疵(这是因为本身的准确率和human alignment)和可回放(这当然是所有网课的优点)。但是人从自然学习的过程本来不就是从不确定性中抽取确定性的过程吗?AI生成的视频是没有瑕疵了,但是代价呢?人缺少了focus的能力,这在 AI的其他噱头 也会提及。瑕疵对于学习来说是负样本,提出是好事,可以让人更快接受正样本,避免负样本干扰。但坏处是:世界本来就是一个噪声世界,如果在学习过程中,无法接受一些轻量的负样本干扰,那在真实场景下会是什么情况呢?(暴论预警)人类的本质是复读机,LLM也不例外。如果人类过拟合了,抗噪能力或者说减噪能力下降了,那谁来做减噪呢,谁来make the machine focus呢?如果哪一天machine自己会focus并有自由探索能力,那确实就共同富裕了(期望那时候世界不要掌握在坏人手里,分权制衡会发挥作用)。
回到这个话题。有以上的那么一些问题,我们还需要审核教学视频吗?需要,当标注员就标注员吧,也算一些贡献(估计还包含上级领导的KPI指标,以及成为AI视频生成的垫脚石)。如果有更多的人可以因为这个视频而受益,对世界产生了一些积极影响,那也是挺好的。
头歌教学平台
说到头歌,至晚21年(可能最早是19年),老师就开始采用头歌平台了。然而头歌平台的坏处是什么?它封装了所有配置环境的过程,对于教学团队的支持也不是那么友好,不像github和gitlab一样开放API。这会导致很多原本可以自动化的东西无法自动化,比如自动拉取所有同学的仓库,自动为同学发邮件等。开放一定的接口才能形成生态,而不是自己一个公司闷头搞。很多时候客户比公司还急,客户甚至还有能力在接口基础上实现一套自己的东西。生态不是由一家公司创建的,而是公司提供好的平台,提供好的接口,在稳定的接口之上形成生态。
OpenAI提供了openai的接口,形成了LLM应用开放的标准,MCP协议提供了不同软件和LLM交互的协议,形成了事实的标准。再往前看一点,计算机的ISA何尝不是标准呢?ARM指令集还有授权,没有授权不能使用。RISC-V为什么是好东西,因为开源,大家都可以用。deepseek为什么是好东西,因为开源,大家都可以用。
AI的其他噱头
AI的其他噱头包括用AI读文献等(我日常接触到的东西就这些,所有也只能讲这些东西了,还需要更多场景)。对于个人来说,用LLM提纲领是好事,但人不应该提升自己的能力去focus吗?99.99%可用指标的0.01%不可用时间真的不重要吗?