什么是Stable Diffusion?Stable Diffusion AI绘画初学者终极指南!


前言

2023年被称为AI元年,因为在这一年,AI技术已经全面提升到了能够产生实际应用的层面。不管是文本生成技术ChatGPT、图像生成技术Midjourney,都是在今年彻底大爆发,不仅引爆互联网,还我们见识到了人工智能巨大的潜能,甚至有很多人认为这是第三次工业革命的开端!

今年3月份,发布于2022年11月30日发布的ChatGPT突然爆火,让OpenAI这个公司声名鹊起,同时也让我们见识到了AI提升生产力的巨大潜力:文档与写作、知识查找与总结、数据分析报告、编程技术支持等方面都可以利用ChatGPT大幅度提升工作效率。

随后在2023年3月16日,Midjourney公司发布了基于文本生成图像的Midjourney V5版本模型,相较于之前版本,V5版在画质、细节、风格方面大幅度的提升,代表作有《太空歌剧院》(美国科罗拉多州博览会艺术比赛冠军作品)、《时尚教皇》系列、《川普入狱》系列等等,因其过于真实,震撼了无数网友,让Midjourney成功出圈。


ChatGPT与Midjourney的成功,让人们看到了AICG(生成式人工智能)时代的到来。正如上文所述,短期来看,AIGC改变了基础的生产力工具,中期来看会改变社会的生产关系,长期来看促使整个社会生产力发生质的突破!

从以往的经验来看,每一次革命性技术的诞生,都伴随着财富大洗牌,例如互联网的诞生催生了谷歌、百度,电商的兴起也诞生了亚马逊、阿里巴巴。随着人工智能时代的到来,作为普通人,这可能是我们在这个时代难得一遇的能够触及到的风口。借用雷军一句话:站在风口上,猪也能飞起来。这个比喻告诉我们,只要抓住了整体的机遇,同样可以取得成功。

事实上,这半年以来,已经有部分人通过ChatGPT技术实现了变现,这其中的途径很多,其中包括:ChatGPT账号注册与出售、ChatGPT付费教程、ChatGPT聊天公众号、聊天网站等方法。

我们可以发现,变现途径一般都是蹭ChatGPT热度和利用信息差,真正利用ChatGPT生产出实际应用进行变现的产品少之又少,这其中的原因主要是ChatGPT API的付费机制所限,还有ChatGPT本身内容过于宽泛,让企业难以创建个性化、针对性的智能应用,也是限制ChatGPT产品价值的原因之一。

时间来到2023年7月份,ChatGPT的风头渐渐过去,Midjourney也由于付费订阅的限制,热度也不及以往。但随着Stable Diffusion的开源推出,大大降低了AI绘画的创作门槛,我们每个人都可以在本地电脑上部署Stable Diffusion并免费创建AI图像。因此,很多人都嗅到了其中的商机,并开始探索其中的变现模式。

在这风口,大部分人都不清楚AI绘画的真正价值,也有很多人虽然意识到了AI绘画的巨大潜力,但苦恼于不知道如何入局。在接下来的篇幅中,我将为AI绘画新人提供一份初学者指南,带你了解AI绘画真正的价值以及变现渠道。

什么是AI生成图像?

AI图像生成指的是AI根据用户输入的文字在几秒到几十秒内自动生成原始图像的系统。

目前比较知名的AI生成图像的平台有“ Midjourney”和“Stable Diffusion”,它们的诞生彻底颠覆了图像设计界的生产力,并因此受到人们的关注。

对于那些无法自己创建图像的用户和每月付费从图像素材网站下载高质量图像的用户来说,图像生成人工智能往往被视为一个很大的优势。我有。然而,它被认为对创作图像和绘画的创作者以及拍摄风景和人物的摄影师构成威胁,并将对未来的数字创意产生重大影响。

此外,关于图像生成AI创作的图像,AI插画师“mimic”在提供服务仅一天后就被迫停止服务,围绕图像生成AI的版权问题也成为热门话题。 。基本上,图像生成AI所创建的图像的版权属于“生成图像的用户”,因此对于作为图像创作来源的插图的创作者来说,已经成为一种情况网络上大量创作,已经威胁到了创作者的领域。

AI有因创作者的批评而被迫停止服务的图像生成AI,例如插图制作者“mimic”,以及像本次推出的“Stable Diffusion”这样的开源AI。在世界范围内广泛传播的图像生成人工智能。虽然只是现阶段的考虑,但认为两者的区别在于“安装的训练好的AI模型的差异”和“图像生成AI读取的数据的差异”。事实上,广泛使用的Stable Diffusion和Midjourney都是使用文本(提示)生成图像,并且由于从用户输入的字符串生成广泛图像的性质,因此在上面指出了“模仿”可以说已经避免了版权问题。
而且不仅是Stable Diffusion,许多图像生成AI都以“输入字符串越长”和“单词数量越多”来生成更接近用户图像的图像。在这种情况下,出现了一种名为“提示工程”的工作,专门制作和研究“让图像生成AI创建高质量图像的提示(咒语)”,每天都会出现各种类型的图像。 。

什么是Stable Diffusion?

这次介绍的图像生成AI是“Stable Diffusion”。Stable Diffusion是一款图像生成AI,配备了“预先训练的AI模型(Diffusion Model)”,可根据“输入文本”生成图像。您可以通过输入以英文单词分隔的单词来创建各种图像,比如一座高楼林立的城市。

Stable Diffusion创建的图像是由系统中安装的称为“潜在扩散模型”的算法生成的。由于用户使用安装了潜在扩散模型作为训练模型的系统,因此他们只需通过文本输入操作即可执行各种任务,而无需了解算法或在 Google Colaboratory 等环境中编写程序代码,就可以生成图像。

用户执行的基本操作是“只需在提供Stable Diffusion的每个界面中输入文本”。每个界面都有除文本之外的详细自定义选项,但图像生成大部分依赖于“输入文本(提示)”。因此,“擅长写英文的用户”很可能能够生成更准确、高质量的图像,而Stable Diffusion将能够生成接近他们想象的图像。

Stable Diffusion简单使用

我们可以有多种方法体验Stable Diffusion AI绘画,比如你可以:

另外,我们也可以使用Stability AI 在 Google Colaboratory 提供的Demo进行了解。

本文链接:https://my.lmcjl.com/post/11576.html

展开阅读全文

4 评论

留下您的评论.