AIGC是什么
AIGC - AI Generated Content (AI生成内容),对应我们的过去的主要是 UGC(User Generated Content)和 PGC(Professional user Generated Content)。
AIGC就是说所有输出内容是通过AI机器人来生成产出相关内容,主要区别是过去主要是普通用户和某一领域专业用户(人)生产内容,AIGC主要是依赖于人工智能(非人类)生成内容,这个就是AIGC的核心意思。
(版权认定:UGC和PGC是有版权概念的,版权归属于负责生成内容的人,AIGC目前美国法规认为是没有版权概念的,就是内容不属于调用的人,也不属于这个AI机器,所以没有版权归属这件事。)
AIGC可以生成什么内容
目前AIGC主要可以生成文本内容和图片内容(目前视频生成有一些产品,但是没有文本和图片生成这么成熟),所以我们主要集中在文本和图片的AIGC的介绍。
AIGC在文本内容方面,主要可以通过 Q&A (提问回答)得形式进行互动,能够按照人类想要的“提问”生产输出符合人类预期的内容。
一般我们可以把AI当做一个全知全能的“高级人类”,以“文本AIGC”来抡,你可以向它提出问题(Prompt),然后它做出相应回答。所有提问和回答都可以涉及到方方面面,包括不限于 百科知识/创意文案/小说剧本/代码编程/翻译转换/论文编写/教育教学/指导建议/聊天陪伴 等等等等场景不一而足,场景都需要你去想,可以理解它是一个拥有全地球知识的“百晓生”,什么都可以问它或者跟它交流。
比如我们用大名鼎鼎的 ChatGPT 来进行提问:
对于“图片AIGC”来说,你可能脑子里有无数创意,但是自己不会绘画,无法把脑子里的Idea变成实实在在的图片,那么,“图片AIGC”能够帮助你按照你脑子想要的东西,你告诉它,然后它能够帮助你通过图片绘画的形式给你画出来,让你一下子把自己的“创意”变成了图片现实。
比如我们用非常好用的“图片AIGC” 工具 Midjourney 来画画:
主流AIGC产品
目前AIGC主要是生成文字和图片,目前全球主流比较靠谱的AIGC产品主要是在国外。
文字AIGC产品
OpenAI ChatGPT/GPT-4: http://chat.openai.com
Google Bard:https://bard.google.com
Microsoft NewBing:必应
Baidu ERNIE Bot(文心一言):文心一言
Github Copilot:GitHub Copilot · Your AI pair programmer · GitHub
图片AIGC产品
Midjourney:Midjourney
Stable diffusion:Stable Diffusion Online
OpenAI DALL.E:DALL·E
百度文心一格:文心一格 - AI艺术和创意辅助平台
视频AIGC产品
D-ID:D-ID Creative Reality Studio
Glia:GliaStudio | 用人工智能视频化你所有的故事
其中,比较靠谱的产品主要是 ChatGPT/GPT-4 和 Midjourney 两个产品是比较成熟可靠的。
文本AIGC产品的介绍
Bard 是Google开发的一个文本对话机器人,是建立在一个大型语言模型基础上的。它可以利用来自网络的信息提供比较新鲜高质量的回答,比如说,Bard可用来比较两部电影,还能根据冰箱里的食物安排午餐吃什么。按照Google官方说法,Bard采用5000亿个参数进行训练,因为是邀请制,还没有完整体验Bard的功能,按照相关信息看,Bard比较容易翻车。
ChatGPT/GPT-4 是OpenAI公司开发的对话机器人,ChatGPT是基于GPT-3.5上面的1750亿个参数进行训练的大语言模型,GPT-4是 ChatGPT 的升级版本,官方没有公开具体训练参数数量,但是肯定比 GPT-3.5要更多,传闻训练参数数量在 1750亿~100万亿之间,从数据来看是非常巨大的。
NewBing 是微软公司开发的在浏览器和Bing搜索引擎中集成的一个对话机器人,它整个底层模型主要是依赖于微软投资的OpenAI公司开发的 ChatGPT/GPT-4 模型为主,基本可以认为是 ChatGPT/GPT-4 在Bing中的另外一个展现版本。
ERNIE Bot(文心一言) 是百度开发的一个大语言模型,ERNIE是一个独立的语言模型(传闻是基于BERT模型进行升级的产品),目前迭代到了3.0版本,具备有千亿参数训练而成,可以支持文字AIGC和图片AIGC。
Github Copilot 是微软控股的 Github 公司开发的一个编程辅助AI工具,使用 GitHub Copilot 可以在软件开发工程中,通过机器学习算法来生成部分代码,可以 在程序编辑器中获得整行代码或整个函数的代码建议,可以通过提供半自动完成的建议来帮助编写代码,提高了代码编写的效率和精确度。训练数据应该是整个 Github 平台上面托管的所有开源代码。
图像AIGC产品介绍
图像AIGC产品目前主流的主要有 DALL·E, Stable Diffusion 和 Midjourney等,文心一言也有对应产品,不过目前从网络风评来看会稍微效果有一定提升空间。
DALL-E 2 是OpenAI公司的产品,使用数以百万计的图片数据进行训练,其输出结果更加成熟,非常适合企业使用。当有两个以上的人物出现时,DALL-E 2产生的图像要比Midjourney或Stable Diffusion好得多。
Midjourney 是一个小众的工作室生成,是一个以其艺术风格闻名的工具。Midjourney使用其Discord机器人来发送以及接收对AI服务器的请求,几乎所有的事情都发生在Discord上。由此产生的图像很少看起来像照片,它似乎更像一幅画。
Stable Diffusion 是一个开源的模型,人人都可以使用。它对当代艺术图像有比较好的理解,可以产生充满细节的艺术作品。然而它需要对复杂的prompt进行解释。Stable Diffusion比较适合生成复杂的、有创意的插图。但在创作一般的图像时就显得存在些许不足。
(看三者的大概区别,以为“生成花合雪景结合的图片”查看区别)
目前比较常见容易使用的主要是 Midjourney ,总体效果还是比较不错的。
AIGC使用前置性问题关注
对于所有AIGC产品来说,能够很好的学会 Prompt (提问/提示/描述问题需求)是非常重要的一件事,如果一个好的 Prompt 能够事半功倍,让AIGC机器人快速理解你的意图,然后顺利给出你想要的答案。
AIGC的准确性问题
文本类AIGC不能保证答案100%准确,它只会输出它认为最相关最可能得结果,所以使用的时候需要自己对结果进行检查交叉校验,防止出现不一定准确的结果错误引导。
(我们看ChatGPT一个回答错误的范例,实际答案是ABD)
所以对于结果最好是自己熟悉的领域,能够适当有基本对生成结果判断的能力。
AIGC中Prompt的语言选择问题
文本AIGC来说,比如ChatGPT,中文给它提问(Prompt)会获得不错的结果,因为它针对中文的训练语料采集的不错,所以相关结果还算不错,英文提问(Prompt)结果会更好。
对于图片AIGC来说,无论是国外的AIGC产品还是百度文心一言,如果使用中文的情况,可能会与你想要的结果会相差非常的大。
比如我想要图片AIGC帮我生成一个小女孩和小猫在一起的图片,我们看中英文不同 Prompt 生成的结果区别:
所以,如果是在图片AIGC的场景中,尽量采用英文进行描述,可以把中文翻译成为英文的Prompt 后然后进行提交生成。当然,如果真的要用好AIGC工具,生成优秀的Prompt是非常重要的事情,需要持续学习,所以需要在实践中增长编写Prompt的能力。
本文链接:https://my.lmcjl.com/post/3922.html
4 评论