ChatGPT - 横看成岭侧成峰

定义

ChatGPT 是什么?
ChatGPT是由OpenAI开发的一个人工智能聊天机器人程序,由 OpenAI 公司于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。

ChatGPT以对话方式进行交互,可以用于包括自动文本生成、自动问答、自动摘要等在内的多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本,在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。

这是 ChatGPT 自己的介绍:

注:自我介绍不错,但是 “转移学习”, 应该翻译为 “迁移学习” 才精准。

ChatGPT 背后的技术是 OpenAI 公司的 GPT 大型语言模型框架,OpenAI 也得到了微软公司的大力投资,ChatGPT 是这样回答 “你怎么分析微软公司持续投资 OpenAI 公司?” 这个问题的:

嗯,chatGPT 最后一句话没有讲完,它也没有解释。

网上流传了 chatGPT 能做的各种事情,我们的博主也写了不少博客: https://blog.csdn.net/nav/advanced-technology/chatgpt

它可以生成各种内容,可以回答不少技术问题,大家对它的态度刚开始是好奇,惊艳,随后就有不同的反应,特别是在问答,教育领域 –


限制、禁止 chatGPT

英文 IT 界最大的问答平台 StackOverflow 禁止在它的平台上使用 ChatGPT 生成的内容。 主要原因是ChatGPT 生成的回答 看起来非常高质量,非常容易生成,但是准确度低。这会导致很多用户大量生产此类内容,对平台和想得到正确答案的用户都是有害的。

这是 StackOverflow 官网的解释截屏:

一个用户 (Alex Poole)的评论得到了很多赞:(我翻译成中文)
不管 AI 生成的答案正确与否,“StackOverflow是一个面向专业程序员和热心编程爱好者的问答网站" 这句话同时适用于 【提问】 和【回答】的部分。在我看来,那些只是将提问粘贴到 AI 那里,然后把 AI 的回答再复制回来的人, 不算是专业程序员,也不算是热心编程爱好者。也许这些人对 AI 的回答进行了检查和测试,如果他们真的能够验证这是一个好的正确答案,他们应该能够自己写出来。这并不一定意味着互联网上没有(或不会有)人工智能提供服务的地方,但它并不属于 StackOverflow。

下面是我用 deepl.com 服务得到的翻译:

美国的一些学校也禁止学生使用学校的网络连到 ChatGPT,主要原因是:“虽然该工具可能能够提供快速和简单的问题答案,但它并不能培养批判性思维和解决问题的能力,而这些能力对学术和终身成功至关重要” (报道链接) 但是,学校防止不了学生用其他方式连到 ChatGPT,这样, 自己有手机流量的,就能用,没有手机流量的,就不能用。 或者是,某个地区的学生,可以通过某种方式上网的少部分学生,就能得到这种服务,这是否造成了一种不公平呢?


出错了怎么办?

在大约 10 年前,我在研究院的同事就开发了一个 AI 的写作助手,你输入上一句, 写作助手就会根据上下文建议下一句,当时的 AI 技术和数据量还是比较初级,所以它的一些建议看起来很幼稚可笑。这个研究项目在小范围演示后,就停下来了, 十年后,大不一样了,这是我刚才随手给 ChatBot 出的题目:


如果 ChatBot 聊天聊出问题了怎么办? 这也是实际发生的情况。 我试着和她聊 “在犯罪的边缘试探” 的笑话,ChatGPT 倒是很冷静:

2016 年,微软就发布过一个有感情的聊天机器人 – Tay,但是 16 小时之后,就把她下线了。因为她在和用户聊天的过程中,从用户那里学到了很多骂人、歧视、以及其他恶劣的行为。 这个聊天机器人有 “自觉” 和 “良心” 么,知道自己的言语会伤害别人么? 要找机会直接问她。

从我有限的测试来看, ChatGPT (他背后的高人) 很明智地吸取了前人的教训,给自己画了一些红线,不敢越雷池半步。


共存

ChatGPT 能快速地给出看起来很有信心的答案,学生拷贝就好了,这是作弊么? 也有老师说,这就像 20 年前 Google 出现的时候一样,当时也有老师不让学生从 Google 上直接找答案,后来怎么样了呢?

打不过你,就加入你好了。

这其实反映了 人工智能 (简单或复杂的算法) 辅助人类工作的一个趋势。 下面是一些例子:

  • Word 编辑器的文字拼写自动纠错功能(这算作弊么)?以及后续不断提高的语法建议功能,Excel 的自动数据自动填充、计算功能, PowerPoint 的 “幻灯片自动排版” 功能
  • 以前初学者翻译文章,要一个词一个词地查纸板的字典,后来,有网络上的词典,便携式的电子词典,手机 app,现在,很多的翻译工具能翻译整段话,而且效果不错,就像本文上面用的 deepl.com 的例子。
  • 代码编辑器中的 IntelliSence 自动完成变量名和函数名的功能,自动生成函数API 的注释,演化到最近的自动生成测试用例,自动完成函数功能,等。
  • wolframalpha.com 网站的自动解题并列出步骤画出优美的图形…
  • 艺术创造中的美颜,AI 作画等。
  • 更不用说在股市交易中的 AI 算法的作用 …

这些进步,在当时都引起一些争议,现在看来,都好像是挺自然的了。

当然,AI 从解决单个离散的任务,发展到可以完成一整套考试,这是极大的飞跃 – 最近世界著名的沃顿商学院的教授 Christian Terwiesch 让 ChatGPT 做课程的期末试卷,AI 居然得了大约是 B 或者 B- 的分数。 考虑到 AI 的发展速度,我们不难想象不久的将来, AI 在 MBA 课程中碾压人类,就像 AlphaGO 碾压人类围棋手那样… 那么,上 MBA 学院的价值是增加了还是减少了呢?

在我们软件工程师的面试中, 我们经常要考察基本的算法,例如快速排序,红黑树,等,如果一个候选人说, 这些算法都有 API 和别人经过考验的算法库,我只管调用就好了! 你作为面试官,你怎么办呢? 我们在考试和面试中,经常要考察这个人的 “技能”, 那么,会用 ChatGPT,算是一个有价值的技能么? 技能的反面是什么呢?


鼓励使用 ChatGPT

打不过你,就加入你好了,而且还要充分利用这个工具。 我今天看到这个 npr.org 的报道,有老师要求所有学生都用 ChatGPT 来做作业, 他认为,在讨论和创意阶段,这个工具还是很不错的。

这位老师说,他对于 AI 工具对于教学的影响,又激动,又焦虑,但是,还是要跟上时代啊!

著名数学家陶哲轩设想,考试也许应该走向 “open books, open AI” 的模式 – 又开卷,又允许允许 AI 工具。 在这种情况下,我们的试卷应该怎么设计,才能区分出学生的 好/中/差 呢?


分清楚 【参考】还是 【作弊】

在一些人抱怨 ChatGPT 导致作弊的时候,他们可能忘了,作弊是人类有史以来就有的行为,现在也不例外,可以搜索一下 “论文代写” 或者是 “毕业设计 源码” – 搜索这些东西的人,收集资料呢,还是直接拿现成的方案去当作自己的作品呢? 这就不得而知了。

这个 BBC的报道 也提到肯尼亚的大型作业代写的服务。 一旦开始了作弊,大家就从 “学术道德” 的高地上走下来了,随之而来的是各种环节的作弊行为:

  • 这些代写作业的人,都是在肯尼亚一带的非洲同胞,但是他们都头像都是白人
  • 这些代写作业的账户上面的五星好评,也是假的,这也有一个假账号和假评价的交易市场
  • 这给了顾客(欧美的学生)一种印象,是 “高水平的西方人在替我写文章,老子的钱花得值”!

从报道中的数据可以推导出,一个一周工作七天的代写文章者,可以挣到相当于当地成年人的平均工资。 这对于很多接受了高等教育但是在当地找不到工作的年轻人来说,这是一个很不错的出路。

当然,人们也开发了各种检测作弊的工具,对于 ChatGPT,也有检测工具出现了 GPTZero!

如果所有人都能用上 ChatGPT,而且,检测 ChatGPT 的技术也在提高,那么,对肯尼亚一带的人肉论文代写行业,有什么影响呢? 我们能训练 ChatGPT 去检测作弊行为么?


AI 贵有自知之明

ChatGPT 是怎么看自己产生的内容被学生使用的呢? 请看它的直接回答:

理论上,ChatGPT 属于哪个层次的 AI 呢? 如果低层次的 AI 都这么厉害了,高级的 AI 出现后,我们怎么办呢?

(图片来自:汪军教授的演讲)

当然,人和 AI 在各个领域的较量才刚刚开始,魔高一尺,道高一丈,双方的较量的过程和结果是合作,共存,融合,还是对抗?最终谁能胜出?让我们 拭目以待 (说到拭目以待,说不定有人正在做机器眼睛接入人脑的实验咧)!


后续 … 更大的余波

最近有些作者把 ChatGPT 也列为自己文章的合作者,并发表了学术论文,这引起了很多专家的担忧和争论,在写完博客正文后,我在网上还看到了这样的报道: 卫报的报道 和其他网友的说明:https://weibo.com/1924545467/MqwNKgeKw
核心决定是:

主要科学期刊出版商决定禁止将 ChatGPT 列为署名作者,但是允许真人的作者在论文准备阶段使用 ChatGPT 等工具,只要说明使用的情况即可。

ChatGPT 在全球的教育界也引起了持续的争论。 根据这个文章收集的信息,我们可以看到:

关于英语教育 在拥有12年教龄的旧金山高中英语教师赫尔曼看来,ChatGPT能瞬间完成主要文本类型的写作,这颠覆了英语教学的基本功能,英语教育的地位也岌岌可危。美国企业研究所的高级研究员庞迪西奥却认为,赫尔曼的观点只代表了部分知识精英,而知识精英推崇的各种思维训练,都必须建立在相当的知识储备上。由于多数学生的知识和语言能力尚未达到基础水平,写作训练依然必不可少。庞迪西奥还讽刺了当前对ChatGPT的过度推崇:“与其说创造内容,不如说ChatGPT更擅长通过编造和修辞,来弥补谈话的空白;这个软件在模仿人类胡说八道方面,能力着实出色。”

关于 技术与人文之辩 加拿大作家马奇认为,相比科技的突飞猛进,人文学者长期醉心于宏大叙事的建构与批判,反而忽视语言、历史、伦理、政治等方面的现实问题。而ChatGPT等新技术越来越擅长完成论文等 “文科工作”,人文和技术的差距将继续拉大。然而,福布斯专栏作家里姆认为,不能过分夸大ChatGPT对论文乃至人文教育的影响——就论文写作而言,最重要的是学生不断思考和尝试创作的过程。人文学者应学会驾驭新技术,并教会学生熟练运用这些工具。

南方科技大学的于仕琪老师也在微博上分享了自己的感受:

人类学习数学有很长时间了,如果用卖日杂货物算钱这个场景,大致经历了 在地上写写画画 - 石板上写写画画 - 算筹 - 部分人的心算 - 珠算 - 计算器 - 集成到其他工具中 现在你去买东西,就是不断拿货物扫码,然后你也扫自己的wx/支付宝付钱,都不用算如何找零。 但是,青少年要学习算术么? 要! 为什么? 因为数学是一个理解世界,锻炼大脑分析能力的工具,没有这个能力,人类就不能进行其他的更高层的 思考、尝试、创作 的过程,所以,我们在享受越来越便利的计算成果的同时,还是要从基本的算术学起。

编程语言,软件工程也是同理。ChatGPT 给我们提供了方便的工具,让我们更快地就能看到很多解题的方法,很多初步的结果,但是我们自己的大脑还是要经历漫长的学习过程才能在编程和软件工程的领域实现 思考、尝试、创作的过程, IT 专业的老师面临的挑战,就是在日新月异的工具进步中,如何能持续打造这样一个训练的环境, 让学生可以 思考、尝试、创作

参考文章:
教学的核心:构建一个自然的, 有批判精神的, 学习的环境

本文链接:https://my.lmcjl.com/post/6546.html

展开阅读全文

4 评论

留下您的评论.