ChatGPT 的一些思考

最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开始,就已经能够理解较多的上下文信息并给出符合上下文的回复,但是给人的震撼并不如这次 3.5/4.0 版本来的多。就我个人而言,最直接的比较震撼的是更加灵活的代码生成,小说续写改写等等,而且都是从自然语言习惯进行交流的,不用相对来说比较专业的术语或者提问方式就可以实现流畅的沟通。

这次 ChatGPT 的火爆让我重新回顾了下近些年来 AI 究竟在生活当中从哪些方面融入了我们的日常。就我个人而言,能够明显感受到或者了解到的 AI 实际应用的场景有下面几个:

  • 实时字幕/实时翻译;
  • 手机拍照(人像模式);
  • 图像文字提取
  • AI 绘画和人脸替换;

实时字幕的应用有几个细分,比如说双方交流的实时字幕生成,并不包含翻译部分,是把对方的话用对方的语言来实时生成字幕进行显示,特别适用于听力不好但是阅读能力比较好的人使用。典型的产品有WIN11 的全局实时字幕,小米手机的小米闻声实时字幕,当然还有其它的一些 APP,不过感觉一些专门做词典之类的软件反而并不如一些视频会议软件或者小米闻声做得好,讯飞也是做得比较好的。这种的典型应用场景就是春晚或者什么直播节目也可以进行实时字幕的生成,以及不同地区方言到统一官方语言的转换,还有就是需要进行语音实时转录文字,这个文字工作者应该会比较需要。还有一些细分就是同声传译,也就是除了识别对方说的话之外还额外帮你翻译出来转换到自己想用的语言上面去,这个准确度已经比以前提升了非常多了,这个极大的方便了不同国家不同语言口音的人交流,出国游的时候就不用担心会遇到无论如何也搞不懂说什么的状况。

手机拍照这个对于 AI 的应用也是愈来愈广泛,我就说一个比较典型的能够有明显感知的应用,比如说人像模式的拍照或者视频录制,需要进行背景虚化,以前的背景虚化搞得都是非常不准确的,该虚的地方没有虚好,该实的地方没有实,总之就是突出一个不稳定。而以小米为例,小米12s 系列就已经表现出了比较令人满意的背景虚化效果了,大部分情况下都可以得到令人满意的虚化效果。

还有就是图像文字提取,也就是古早时候的 OCR 技术实现的的升级版,比较明显的就是微信的图像文字提取,可以直接把图像当做文本文件进行选择、复制、剪切,十分方便。还有就是用于改作业、做作业的图像识别,直接可以识别出来文字和图形化的题目,并给出解析,这个也是非常能体现生产力的地方,当然还有很多其它的应用我就没过多涉及了,总之都是生产力提升的体现。

AI 绘画也是 AIGC 的一个比较令人震惊的应用,而且从目前来看,AI 绘画已经可以做到添加一些 AI 自己的艺术理解进去,有些情况下的画作已经比人类还要优秀了。最令我震惊的是最近的写实风 AI 图像生成,虽然一直被吐槽 AI 还是无法理解人类的手是什么个存在,但是通过一定的训练之后已经可以画出一些超写实的画作了,基本上乍一看看不出来真假。还有一部分是建模的应用,虽然不清楚具体的实现是不是基于传统 CV 还是改良后的 AI,但是我感觉纯传统 CV 应该做不到那么真实的模拟。而人脸替换则肯定是基于 AI 的实现了,这个在很多的短视频里面、电影里面都有体现了,已经达到相当的实用程度,不在是笨拙的纯玩具的级别。

而最近的 ChatGPT bing 版,我看好多时候回答已经体现出了一些独立人格的迹象,虽然它不一定是真的独立人格,但是给人的感觉已经非常接近了,对我来说已经有点恐怖谷效应了,属于非常接近但是还总是有一点不对劲的感觉。这次的版本更新给人一种强烈的危机感,毕竟离线训练版的就已经可以达到代码生成,超强的语义理解和交流,这些完全可以在不断的训练之中进化达到更强的程度。试想一下 ChatGPT 的接口引入到游戏产业,游戏里面的 NPC 可以产生完全符合现实中自然人类的对话和行为,这将创造一个极度真实的自由世界,只需要赋予每个 NPC 不同的 AI 人格,加之接口数据的指令化标准化就可以做到。

感觉下一次的社会层面技术大升级如初升红日,在远远的海岸线上已经绰约可见了。想象中的下一轮升级是属于 AI+机器人的,也就是把强 AI 录入到不同功用的机器人内生操作系统里面,由 AI 去控制完成一些自然语言指令,工业上或许要更加特殊化一些,但是生活和一些工业门类则可以做到完全使用自然语言去控制 AI+机器人实现真正的实用化的 AI 助手。而「流浪地球2」里面的机器人技术和 550 系列我感觉可能真的已经在不远的将来了,现在能想到的最可能的组合,AI+波士顿动力的机器人/机器狗,经过后续的接口对接和迭代或许可以在有生之年带来一场全新的技术革命,当然技术对于人类社会的冲击也许不可忽视,但是这是另外一个话题了。

目前已经可以看到端倪的,可以被少量或者大量替代的岗位我自己理解可能会有:程序员(UI 设计、互联网等比较标准化软件化的领域);效果调试(自动控制、Tuning);文字工作者(绘画、有一定格式要求的文章写手);语言工作者(翻译、同传);律师(一些民事领域的纠纷处理);服务类型岗位(流程处理、程式化的内容处理);会计(流程报表);司机等等。当然这些不会是完全替代,但是绝对会相当程度上解放其生产力,使得需要的工作岗位大量减少,只保留少部分中低端岗位和高端岗位,剩下的会被全部替代。

面对 AI 的的冲击,也许从个人来讲除了为此感到谨慎兴奋和享受其带来的便利之外,也该更多的去思考下对个人带来的影响。毫无疑问个人生产力会得到更大的解放,个人未来可能不需要再花大量的时间在一些日常家务、无效或者说无必要的人际交往等上面,更多把精力用于自己喜欢的事情和创造力上面去。但是也应警惕自己的可替代性,在向 AI 时代进化的过程初期和中期,肯定会牺牲掉一大部分人从而完成整个的过渡。我个人想到的不可替代的工作类型有:程序员(与硬件绑定较多的、高端理论发明、架构创造);医生(需要进行外科手术的);律师(刑事律师、经济领域、高端领域)等等。我想要特别说明的是教师,无论何种教师,教学工作内容简单与否,我想都是绝对不可替代的,即使 AI 的教学技术或许可以超过人类,但是学生家长是绝对不允许学生处在一个独立的学习环境的,客观条件上来讲义务教育阶段的学生也是绝对不可能适应独立学习环境的,初期学习是一个需要通过人际交往来实现的行为,脱离了人与人之间的交流,从目前的人类构造来讲,义务教育不太可能实现其预定的目标。

AI 的时代或许很快就会到来,个人虽不一定要深度参与其中,但是保持一定的敏感性还是很有必要的。

本文链接:https://my.lmcjl.com/post/997.html

展开阅读全文

4 评论

留下您的评论.