6月是高考季。每年到这个时候,关于考试的话题都会热起来。孩子们在考高考,成年人其实也没有真正离开考场。各种资格证考试、职业技能考试、教师类考试,也在不断提醒我们:考试并不是学生时代才有的事。
这也让我开始思考,为什么要考试?考试这种形式为什么会存在?
如果只是为了判断一个人到底会不会,最理想的方式当然是一对一慢慢问、慢慢聊、慢慢观察。可是现实里,社会要考察的往往不是一个人,而是一批人。学校要录取学生,机构要发证书,行业要设置门槛,都需要在有限时间里完成判断。考试之所以存在,就是因为它解决了一个很现实的问题:人多,时间有限,资源有限。
所以考试本身并不是错的。它像一把尺子,虽然不完美,也量不出人的全部,但它确实可以在短时间内完成大规模筛选。比起完全靠熟人推荐、关系介绍,考试至少给了普通人一个相对公开的机会。
但是到了AI时代,考试的内容和形式都应该发生变化了。过去很多考试,主要考记忆、背诵和刷题熟练度。这个定义是什么?这个流程分几步?这个知识点怎么解释?在过去,这些当然有意义,因为知识不容易获得,一个人能记住很多东西,本身就是一种能力。
可是现在不一样了。很多知识已经变得唾手可得。一个概念、一个流程、一个案例,搜索一下,问一下AI,很快就能得到。如果考试还主要考“你背住了没有”,就显得不够了。
当然,这不是说记忆完全不重要。人脑子里还是要有基本框架,不然AI给你答案,你也判断不了。只是考试的重心应该变了。AI时代更应该考的,是一个人能不能提出问题、判断信息、调用工具,并把这些东西转化成自己的方案。
所以我在想,未来的考试也许不再只是大家坐在考场里答同一张卷子,而是试卷本身变成智能体。
这个智能体不只是出题,它还可以像一个考官一样,和考生对话。它可以根据考生的回答继续追问,也可以根据不同人的水平调整问题。这样一来,考试既保留了大规模考核的效率,又不再完全牺牲个性化。
比如对外汉语教师考试,过去可能会问:“什么是把字句?”但智能体考试可以给你一个真实情境:一个外国学生总是不会用“把”字句,你怎么教?你回答之后,它继续追问:如果学生还是不懂呢?如果他的中文水平很低呢?如果这是线上课,PPT突然打不开呢?
这样一问,一个人是不是真会教,就比单纯背定义更容易显露出来。
其他考试也可以这样。技术类考试,可以让考生面对一个模拟故障,看他怎么排查。服务类考试,可以设置一个真实客户场景,看他怎么沟通。需要实操的考试,还可以结合摄像头、语音、上传操作过程,让考生进行仿真练习甚至实物展示。
这时候,智能体就有点像孙悟空的分身。一个真人考官不可能同时考很多人,但智能体可以同时面对大量考生,还能进行个性化追问。真人考官则可以负责制定标准、抽查复核和处理关键判断。
我觉得这可能是AI时代考试的新方向。考试不会消失,因为社会仍然需要在短时间内判断很多人。但考试可以从“背答案”走向“看能力”,从“统一试卷”走向“智能体考官”,从“考你记住什么”走向“考你能不能把事情做出来”。
未来真正好的考试,不应该只是把人分成通过和不通过。它也应该让一个人的能力,在更接近真实世界的问题里显露出来。
AI时代不是不要考试,而是考试终于有机会从一张冷冰冰的试卷,变成一个更真实、更灵活、更个性化的能力显露现场。