别再说AI画画是缝合了——白话AI作画原理(适用于没有数学 ...

论坛 期权论坛 期权     
期权匿名问答   2022-11-9 22:05   5723   20
文章内容:

  • AI将止步于何处?
  • AI是怎么学习的?
  • AI是怎么知道画什么的?
  • AI是怎么画画的?
  • AI是怎么从一幅模糊的图越画越好直到画出一张artbook级别的作品的?
  • 为什么AI会画出邪神?(negative prompt否定提示的意义)
  • 不同种类的绘图AI
  • AI作画到底是不是缝合?
  • AI有没有创造力——AI的运行原理的简单阐明
  • 一些问题
先自我介绍?笔者为人工智能领域工作者,还是个好久不产文的作者。文中若有理论性错误请各位人工智能界大佬们不吝赐教。
1-5节偏技术,如果对人工智能是怎么实现的没有太大兴趣的读者可以直接跳到6节开始阅读。
最近AI作画大火,笔者在各大平台都能或多或少看到有人在谈论AI作画,有人抵制,也有不少人玩的不亦乐乎。AI作画这个东西大家都知道,但是是怎样一回事呢,跟小编一起来看看吧......咳咳,差点变成营销号......不过这篇文章的确是笔者要作为一个人工智能研究者,从不是数学和统计学的角度,来进行一个科的普,里面可能会涉及到少量公式什么的不过更多我想用生动形象的例子来解释:AI是如何学习画画,AI是如何画画,AI是如何越画越好,AI是如何知道画什么的......嗯......这大概是这篇文章的大纲。先开篇点明观点,现在AI作画商用纯纯吃相难看!


绪论:(整篇文章如果没有耐心或者时间看可以看看加粗的部分?或者看看后面一半也行)
首先,我想我需要介绍一下AI是个啥?简单来说,人工智能 (AI) 是指可模仿人类智能来执行任务,并基于收集的信息对自身进行迭代式改进的系统和机器。AI 具有多种形式。例如:
聊天机器人使用 AI 更快速高效地理解客户问题并提供更有效的回答
智能助手使用 AI 来解析大型自由文本数据集中的关键信息,从而改善调度
推荐引擎可以根据用户的观看习惯自动推荐电视节目(摘自什么是人工智能 (AI)?| Oracle 中国)
QQ小冰就是个很好的例子,还有语音转文字,也包括你经常点进美女的视频然后视频平台疯狂给你推美女的技术,这些都写在大忙人AI的“工作合同”上。
再来看看AI和人类学习本质的区别?



在人工智能领域很常用的一种结构神经网络中的神经元模型



人类的神经

区别其实并不大,二者学习的原理十分相似。
不过这样一说好像还是不能太理解AI是啥?没关系,请看下面的一个例子:
假设有这样一个电脑程序rin,它的目标是猜出你心中想的一个数,现在你默念3,因为没有任何已知条件,所有rin随机地猜了一个数,5。
这个时候你微微一笑,轻语道:“猜大了”。
rin面露尴尬,眼神飘忽,沉默了好久才憋出一个字,“4?”
你觉得面前这个电脑程序似乎还挺有意思,便又对它展开了攻势。
“还是大了哟~还有两次机会呢。”
rin似乎紧张起来了,嘴皮在微微颤抖。
“上两次都只减小了1,这次干脆减小2吧,对,一定是这样。”
于是rin给出了它的第三次答案——2。
你噗呲一声笑了出来,rin的脑子却开始有点宕机了,你盯着电脑程序的眼睛:“猜小了。”
虽然rin此时已经知道答案,但声音是如此的不自信,“......3?”
你拍桌大笑,感叹到这个电脑程序有多有意思。
......
这样的一个能根据自己给出的答案被肯定与否调整策略的电脑程序就是一个很基础的AI,刚开始它根据输入给出的输出可能是完全随机的,但是当你说出这个输出结果是正确的还是错误的那一刻起,AI就在朝着正确答案一步一步前进,最终你肯定了AI的答案,AI在此处的工作也就结束了。
这样读者应该是对AI有个初步了解了。但是这跟画画有什么联系呢,我的评论是别急,再等我聊聊“AI普遍是预测器”这样的一个理论。
但是啥是预测器啊?预测器简单来说就是以收集到的客观事实为根据,对你的输入给出一个成功率最大的结果......好像有点难懂,同样,看下面一个例子(算是对一个浅显道理的阐述):
你每天回家都有一段路需要步行,但是一共有三条路程差不多的路。
第一天你走了左边的那条路,但是因为路面湿滑摔了一跤,你心想可能是今天倒霉。
因为你有选择困难症,第二天你又走了左边那条路,然后又摔了一跤,你咬牙切齿,骂了两句。
第三天你不信邪,觉得不能连着三天摔跤吧,还是选了左边那条路,但是果不其然,摔了个狗吃屎,你如此发誓:“我再走这条路我就是沙比。”
因此你第四天换了中间这条路,没有摔跤。
第五天你同样走了中间这条路,但是摔了,你心想虽然摔了跤,但是前一天没摔,明天再试试。
但是第六天你又摔了个狗吃屎,因此你换了右边的那条路。
结果你再也没摔过跤。
当你给同样要走这段路的人提起这件事的时候,我想这个人会很顺其自然地直接选择右边那条路走。
那么在这个例子中,你扮演的就是客观事实,下一个要走这段路的人就是AI,AI分析了走左边那条路不摔跤的概率是0,走中间那条路是1/3,而走右边那条路是100%也就是1。当你问AI“我走哪条路才能不摔跤呢?”AI理所应当会回答右边。
这就是预测器。根据:
(1)对你的输入——“我走哪条路才能不摔跤呢?”,
(2)客观事实——一个人走某一条路摔跤的概率,
(3)做出最有可能被你接受的结果——告诉你走右边,然后你走了100次就摔了一次,还是因为有人推你。
预测器能干啥呢?


在基本上所有能总结出一定规律的任务中,它能根据输入给出一个大部分人能接受的结果,具体的表现就是下围棋,因为围棋有具体的规则,而且甚至有定式,别人用A战术你用B战术最有可能胜利,AI学习了上万场棋局,在你下第一步棋的时候它就有一堆应对方式了,这个时候它可能会随机地选一种下法,然后根据你下的每一步棋调整战术;再比如你某一天点开了一个美女,第二天你会发现你的首页充满了美女视频,但同时也会有美妆视频,以及穿搭的视频,甚至还有R18的东西,这是因为AI分析了上万人,他们在看美女视频的同时也会看美妆和穿搭,以及R18,所以AI就自动认为你也是其中一员——这就是视频网站推荐的原理,分析看这个视频的人还喜欢什么,用上面的AI思维方式就是根据:
(1)对于你的输入——你点开的某个视频,
(2)客观事实——大部分点开这个视频的人还会看什么,
(3)做出最有可能被你接受的结果——推荐一些相关的内容,然后你刷了一晚上视频第二天早八迟到了。
总的来说,AI是一类总结规律的计算机程序,它需要大量客观事实(几百都有点少,几十甚至个位数根本学不明白)来总结规律,根据你的特定输入给出最有可能被你接受的结果,它的工作范围是任意能够总结出一定规律的任务,规律越明显越死它表现得越好(这就是AI为什么能拿围棋冠军但是画手脚很难看),而且它针对的目标是大部分人(AI作画为什么是流水线画风留着后面阐述),如果你很有个性那么AI更可能难以满足你的要求。
那么到这里我想读者应该对AI有了个初步了理解了,接下来我们深入一点。
1.AI将止步于何处?
AI理论上最终能代替任何职业的人,只是因为难度不同才有先后而已。
人类所有行为获取都是在这种行为是有规律可寻的基础上进行的(读者可以自己试着举出反例,我是举不出来),而AI本质是什么,是规律总结计算机程序。你知道开发学习了上万棋谱最终战胜人类棋手AI的团队之后干了什么吗,开发了个没学任何棋谱就能轻松干碎初代的AI。所以AI理论上是完成人类能完成的所有事情的,包括拥有感情之类的所谓人类特有的东西。

2.AI是怎么学习的?
其实这儿一点在预测器的部分已经具体阐述过了,AI学习的流程就是根据带有结果和输入的客观事实,分析出每种输入最有可能对应哪种结果并输出,从而写出一本行动纲要以供日后参考,这个过程一般是由程序员完成,所以用户并没有参与到这一过程中。其中“根据带有结果和输入的客观事实,分析出每种输入最有可能对应哪种结果并输出,并写出一本行动纲要”,就是AI的学习过程,而当AI学习完毕,也就是写完了一本针对各种情况的行动纲要时,它就可以被部署了——用白话来说就是供用户进行使用了,输点关键词让AI给你画画。
那么它是怎么学习别人的画呢?首先一位程序员新风拿到了一张作品,他用眼睛看出这张图上面是一个穿着裙子的女孩站在草地上,之后新风用girl,standing on grass,dress标记了这张作品——对于其他作品也做如上处理,之后他便得到了一个包括了上万张图片的数据包,然后把这个数据包喂给了AI。AI思维如下,根据:
(1)你的输入——(日本校园制服)japanese school uniform
(2)客观事实——大部分被打了uniform标签的作品都画了制服,制服的特点是可能有蝴蝶结,下装一般穿短裙,一般是水手服等等
(3)做出最有可能被你接受的结果——画了一张穿水手服,提着单肩包,穿着小皮鞋和长筒袜的美少女。
我们也可以再进一步跟随AI深挖它是怎么知道水手服的样式。根据:
(1)上一层输入——水手服
(2)客观事实——大部分水手服都是蓝色白色
(3)做出最有可能被你接受的结果——画了蓝色领边白色打底红色蝴蝶结的水手服
我们再一步深挖AI是怎么学习水手服具体是怎么画的,比如轮廓是怎样,袖口长啥样,根据
(1)上一层输入——蓝色领边白色打底红色蝴蝶结的水手服
(2)客观事实——大部分蓝色领边白色打底红色蝴蝶结的水手服在整张图里的A位置的像素点颜色为RGB表示的(12,70,9)(数字乱填的,这是啥颜色我也不知道),B位置有个像素点,以此类推。(在此补充一下计算机图像学的知识,计算机是如何显示一张图片的呢,那就是设定每一个像素点的RBG值,就像是那些老旧的广告灯牌,设定每个灯泡的颜色来组成“洗剪吹”的字样)
(3)做出最有可能被你接受的结果——即你得到的结果
在经过多次深挖后,AI觉得它的行动纲要写得差不多了,它的学习也就停止了,这个时候它得到的是一本如上一步步深入到底层的行动纲要,当接受你的输入后,它会一步步查到底,直到行到纲要告诉它这个像素点该画什么颜色。行动纲要看起来可能会像这样


没错,最基础的AI在一幅1080x1080的图片上要对这1080x1080个像素每个进行一次处理,也就是一共1080x1080次处理!这就是为什么要跑AI的电脑性能不能太差,而且你的电脑在跑AI的时候风扇会像个直升机一样呼呼转!
为啥AI要像这样学习?人工智能其实可以归于仿生学,它的学习方式是在研究了人类学习方式后,用计算机的方式来进行表达的,具体的就不展开讨论了,涉及到专业知识,只需要知道AI的学习方式是简化的人类学习方式就行了!我们共用的是一套类似的学习方式!数据库里的作品也是学习完后就不会再用的了,也就是说之后AI画画是彻底与作品无关了!不然你想跑个AI还得下载那上万张图片?那也太离谱了!


3.AI是怎么知道画什么的
这个其实部分涉及到自然语言处理,这是AI研究另一大领域,此处不展开讨论,我们只拿novelai讨论如girl,black hair,smile,uniform这样的输入。
先简单介绍一下novelai:novelai可以将文字描述的场景或者是上传图片的图片内容,经过AI合成后形成新的绘画内容展示出来,你的输入是形如school uniform,girl,black hair,smile,uniform这样你想要的元素和glasses girl,missing fingers,missing legs这样你不想要的元素或者bug,输出是一张与关键词有关的图片。
现在我们来理解AI是怎么知道画什么的:
首先假如你的输入是school uniform,girl,black hair,smile,uniform(你不想要的关键词此处不讨论,在后面会详解),那么AI首先会把这几个词拆开并记住,然后到它的行动纲要中查找对应解决方法,也就是学习得到的


但是如果你给的词有冲突,比如水手服,渔网袜,但是你又给了高中生,小皮鞋这样的关键词,那么AI此时的内心如下:
“哎我去这人有问题吧,水手服是清纯的象征,渔网袜走的性感,这俩能放一起?”
如果遇见懂变通的AI:
“哦你后面还加了更多跟水手服有关的关键词啊,那我就当你渔网袜打错了吧。”
于是你得到的是穿着黑丝和水手服的女高中生
如果遇见固执的AI:
“唉你开心就好,画出来怪也别怪我,谁叫我行动纲领里面没写呢。”
于是你真的得到了穿着渔网袜和水手服的女高中生,但是上身水手服,下身渔网袜黑高跟鞋。(哎,那这不就是缝合吗?别急,后面会讲区别)
如果遇见中庸的AI:
“你这又要清纯又要性感好难办啊,但是结合起来又很怪,看你水手服的关键词较多就给你画3张水手服女高中生,2张性感御姐吧”
于是你得到了3张没有渔网袜和性感元素的水手服女高中生和2张性感的制服御姐。


AI决定到底要画什么的时候,就像是人在看着菜单选披萨一样,你可以选烤肠披萨也可以选夏威夷披萨,或者是来个双拼,只不过AI选披萨具有一定的随机性,不像人一样能想想昨天吃了啥,只是例如某款披萨有优惠可能会影响AI的选择——AI局限于菜单上有啥。
这是对于由词条生成图画的AI既用词条又用参考图的AI同理,只是在已知条件加上AI从图中看出的东西,如果图过于模糊,AI可能就只会取颜色当已知条件了。
哎但是,不是听说放在前面的词优先级较高,AI咋取舍的?哦~这个就像是你去玩抽奖游戏,商家告诉你一种玩法100%中奖但是最高奖品是1块钱,但是另一种玩法只有30%的概率中奖但是最高奖品是一百万,你肯定会选第二种玩法吧。
4.AI是怎么画画的(3.4.可作为一节阅读)
好了,现在我们的AI画手rin酱决定好画什么了,但是要怎么下笔呢?其实方法跟决定画什么基本一致,只是把输入从你给的词变成了它决定要画的东西,也就是水手服,然后查查行动纲领,一直深入直到纲领上写着把某某像素点画成白色,而我们的rin酱也像这样做了。处理完所有的像素点,rin酱得意地放下了画笔,我们得到了一幅画。


5.AI是怎么从一幅模糊的图越画越好直到画出一张artbook级别的作品的?
再进入这一节之前,我希望读者可以花一点时间看完以下这个视频来直观地了解AI是怎么作图的:https://b23.tv/nvZXTtN?share_medium=android&share_source=qq&bbid=XY94A669E079D51594D53CBCFFBA99A72CF36&ts=1665548088798



前几次STEP生成的图片

如果你已经观看了此视频你或许会很疑惑,“我去,它是怎么从一幅模糊图画变成成稿的?”
就好比一个画家随机在纸上泼墨,然后再从这个墨迹联想自由发散,只是AI在做这个事情的时候可以有很多种方式,比如从一张白纸开始想象,或者从某张图开始联想(img2img就是如此),或者说就像例子一样随机泼墨(感谢评论区大佬 @星沉 提供此例子)
同时另一种模型的GAN的生成模式更像是如下的例子(它是曾经最好的生成模式,但是diffusion model也就是novelai和上面那个例子使用的模型可能成为新星)
那么接下来我引用一个例子:
  绘画AI其实是由一个名为生成器和一个名为判别器的部分组成。
生成器的目标是尽可能地生成以假乱真的图片,让判别器以为这是真的图片;判别器的目标是将生成器生成的图片和真实世界的图片区分开。可以看出这二者的目标相反,在训练过程中相互对抗,这也是它被称为生成对抗网络的原因。
  上面的描述可能有点抽象,让我们用收藏齐白石作品(齐白石作品如下图所示)的书画收藏家和假画贩子的例子来说明。假画贩子相当于是生成器,他们希望能够模仿大师真迹伪造出以假乱真的假画,骗过收藏家,从而卖出高价;书画收藏家则希望将赝品和真迹区分开,让真迹流传于世。齐白石画虾可以说是画坛一绝,历来为世人所追捧。
  在这个例子中,一开始假画贩子和书画收藏家都是新手,他们对真迹和赝品的概念都很模糊。假画贩子仿造出来的假画几乎都是随机涂鸦,而书画收藏家的鉴定能力很差,有不少赝品被他当成真迹,也有许多真迹被当成赝品。
首先,书画收藏家收集了一大堆市面上的赝品和齐白石大师的真迹,仔细研究对比,初步学习了画中虾的结构,明白画中的生物形状弯曲,并且有一对类似钳子的“螯足”,对于不符合这个条件的假画全部过滤掉。当收藏家用这个标准到市场上进行鉴定,假画基本无法骗过收藏家,假画贩子损失惨重。但是假画贩子自己仿造的赝品中,还是有一些蒙骗过关,这些蒙骗过关的赝品中都有弯曲的形状,并且有一对类似钳子的“螯足”。于是假画贩子开始修改仿造的手法,在仿造的作品中加入弯曲的形状和一对类似钳子的“螯足”。除了这些特点,其他地方例如颜色、线条都是随机画的。
  当假画贩子把这些画拿到市面上去卖时,很容易就骗过了收藏家,因为画中有一只弯曲的生物,生物前面有一对类似钳子的东西,符合收藏家认定的真迹的标准,所以收藏家就把它当成真迹买回来。随机时间的推移,收藏家买回来越来越多的假画,损失惨重,于是他又闭门研究赝品和真迹之间的区别,经过反复比较对比,他发现齐白石画虾的真迹中除了有弯曲的形状、虾的触须蔓长,通身作半透明状,并且画的虾的细节十分丰富,虾的每一节之间均呈白色状。
  收藏家学成之后,重新出山,而假画贩子的仿造技法没有提升,所制造出来的赝品被收藏家轻松识破。于是假画贩子也开始尝试不同的画虾手法,大多都是徒劳无功,不过在众多尝试之中,还是有一些赝品骗过了收藏家的眼睛。假画贩子发现这些仿制的赝品触须蔓长,通身作半透明状,并且画的虾的细节十分丰富,如下所示。于是假画贩子开始大量仿造这种画,并拿到市面上销售,许多都成功地骗过了收藏家。
  收藏家再度损失惨重,被迫关门研究齐白石的真迹和赝品之间的区别,学习齐白石真迹的特点,提升自己的鉴定能力。就这样,通过收藏家和假画贩子之间的博弈,收藏家从零开始慢慢提升了自己对真迹和赝品的鉴别能力,而假画贩子也不断地提高自己仿造齐白石真迹的水平。收藏家利用假画贩子提供的赝品,作为和真迹的对比,对齐白石画虾真迹有了更好的鉴赏能力;而假画贩子也不断尝试,提升仿造水平,提升仿造假画的质量,即使最后制造出来的仍属于赝品,但是和真迹相比也很接近了。收藏家和假画贩子二者之间互相博弈对抗,同时又不断促使着对方学习进步,达到共同提升的目的。
引用原文链接:https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/114877206
这就是绘图AI,我想现在读者应该理解了为什么AI能从一幅模糊不清的图迭代出一张成稿。
6.为什么AI会画出邪神?(negative prompt的意义)
AI作图时有可能会出现缺胳膊少腿的情况,甚至一只手有6根手指,这不经让我们怀疑这不会是个人工智障吧。
但是出现这种情况是有原因的,如下阐述:
当你要求AI画出水手服女高中生的时候,你没有给定具体的姿势,所以在AI的眼中,画站着坐着成功的概率是一样的,假设都是50%,那么AI一想,我画一个又是站着又是坐着的,那成功的概率不就是100%?你也没说不行对吧,嘿我可真聪明。于是我们得到了一幅四条腿美少女的画。所以现在我想读者对negative prompt的意义应该是理解了,negative prompt(负面关键词)的作用就是告诉AI我不想要多出的手脚,我也不想正常手脚没了。



错误地生成了肢体

7.不同种类的绘图AI
笔者这几天玩novelai玩得可high了,游戏都不打了(毕竟占着显存,还想跑3A?),同时我也遇见了各种形式的novelai,有要下载9g压缩包的本地版,有直接部署在服务器上手机电脑都可以直接点开链接用的,还有连跑都不用自己电脑跑的colob(显卡用别人的不香吗!),还有qq群里的bot,只能说形式虽然不一样但是基本上都是一个东西。



Novelai本地版界面(你novelai有资本家,我们有黑客,源码给你偷了开源你气不气)

其实市面上还有很多有趣的绘图AI:
DeepFaceDrawing:通过计图(Jittor)实现, 用手绘生成肖像。堪称“灵魂画手”!
seeprettyface:定制符合你喜好的人脸,每次得到的人脸都是独一无二。可以换脸、生成虚拟数字人说话视频等
http://deepart.io:一张普通图片转换其他风格图片,成为数字艺术家。
AI Gahaku:AI程序生成的线条图挺不错的。
Ebsynth:支持将真人视频转换为各种手绘特效动画的软件,简单而强大的功能。
DeepArt:滤镜类AI应用程序,可以将一张普通图片转换其他风格图片。
instapainting:可以将照片处理成油画和水彩的风格,效果很棒。
Chimera Painter: 专门画怪兽的AI应用程序。
GauGAN Beta:专门画风景的AI应用程序。
原文链接:https://www.zhihu.com/question/265740439/answer/2268013074
还有根据输入图画进行向外的内容扩充的AI(比如你这图512x512,处理后变成1080x1080,注意还不是增加清晰度,原图的部分没变,而是AI向外画了更多与原图相关的内容),将两张图特征融合生成新图的AI,以及各种功能各异的绘图AI。



绘图AI

8.AI作画到底是不是缝合?
不是,对于AI来说缝合比自己画难多了。
我觉得上面那个链接的视频里展示了挺多区别了,而且认真看完上面7节内容的读者应该也能看出AI作画跟缝合还是有挺大区别的,这一节主要思考一下如何写出一个缝合的算法(白话,放心)。
与从0开始画一幅作品不同的是,缝合AI要学习的是各个部分的相关性,如何把一部分完整地剪切下来,同时处理拼接处使其平滑。
那么我们现在从程序员处理图像开始:
新风现在拿到了一些作品,他要给这些作品打上标签,现在是第一张图——穿着短裤短袜和运动鞋的运动系少女,新风打上了第一个标签运动系少女,但是第二个标签难住他了,他打上了短袜的标签,但是现在面临的问题是这整张图只有部分是短袜,而缝合AI的要求之一就是把相关部分完整地剪切下来,于是新风只把图中短袜的部分给标记了,但是画长裤的时候怎么办,短裤可以让短袜的上面部分露出来可长裤会遮住一部分,那么我们就还要要求AI会裁剪......
是不是发现缝合AI反而变复杂了,而事实的确是这样,所以我开发一个会缝合的AI可能还不如开发一个会画画的AI。


9.AI有没有创造力?(其中简单地说明了AI的运行原理)
首先明确,AI是可以有创造力的。
我们思考一下,现在市面上的绘图AI是为了解决什么问题而开发出的?是为了快速且低价地提供大量满足甲方需求的图片,或者是为画师提供灵感。明确这一点之后我们再回过头来想想,为了满足这样的需求AI需要有创造力吗?答案是否定的。我不认为会有一家动画公司或者游戏公司给画师提的要求会是“提供一幅具有艺术美感的图片”,而更像给AI绘图提供的关键词——白色头发,红色眼睛,穿着夹克,运动系......
那么AI能有创造力吗?AI能有自己独特而的画风吗?这是如何实现的?
前两个问题的答案是肯定的,至于如何实现,我们可以类比AI学习画画的过程:
(1)刚开始AI画的东西都是随机的,它并不知道要画什么,但是你会告诉它画的好还是差
(2)经过大量试错,AI偶然生成了一张你觉得看起来还算有线条轮廓的图,但是画的什么你也看不出来,但是你告诉AI这张稍微好点
(3)AI分析这张“稍微好点”的图片,总结特点,按照总结的特点继续试错
(4)重复1-3
这样经过大量试错,AI画出了一张看得出来是人的图片,再经过大量试错,AI画出了一张有独特画风的原画级别的作品,并且形成了自己特有的画画方式和画风。
在这个过程中,我们甚至能加入随机的干扰,比如让这个AI是色盲,让那个AI不能使用红色,这样我们就得到了不同画风的AI,而且是从0开始,没有学习任何人。
总结一下,目前所有的绘图AI都不是为了创造艺术作品而被开发出的,他们的开发目的是快速提供大量满足具体要求的产品创造艺术的AI不是不能被开发出来,只是现阶段没有商业必要
10.一些问题
我看现在各大社交平台上面支持AI作画的和抵制的真的吵得不可开交啊,笔者认为这是信息不对等造成的,人工智能工程师觉得被说他们的AI是电子裁缝是一种侮辱,画手觉得这是一种威胁也是一种侵权行为,资本家只想着怎么降低成本,普通人可能就只想着我把野兽先辈丢进去会出来什么......
笔者只在这里丢出问题以及个人分析,不过答案我认为就算我分析了也会有反对的,但是这一部分其实是激起多方思考,之后才能达成共识
(可能会让人血压升高,但是本意是要解决问题啊,毕竟我们人工智能领域的工作者更希望的是自己开发的东西被更多人承认和使用啊)
是否需要对AI快速抢占市场而担心失业?
援引b站某视频评论区的一段话:“短期来看,能让好的画师地位更高,差的画师没饭吃,这样对于大部分人来说可以更廉价的获得不那么好的画,甚至有望去降低动画成本。是好事
但是长远来看,一个好的画师的画技也是一点一点进步的,必然会经历技术差的这一阶段,也就是会很久都吃不上饭。而这会导致新人不敢入行,进而导致无法产生新的顶级画师。是坏事,是急切需要解决的问题”
AI作画给哪些人提供了便利?
一些需要流水线作品的公司,如动画公司和游戏公司,一些没有能力画画但是想参与到一些二次元活动的人,想要人物设定图和插图但是没有经济能力约稿的作者,大部分画师(毕竟线稿变上色了的成稿,打几个关键词就能帮着设计场景动作的工具还是挺好用的),等等。
AI作画的双刃剑?
万恶的资本家一直在寻找快速且低成本的解决方案,而AI作画的确在一定程度上让他们得逞了。AI作画的确是会淘汰掉一部分中底层画手,特别是没什么自己画风的画手,同时缩小整个行业的体量,增大失业率,同时由于一些人丢掉了工作加入了其他行业,其他行业竞争也会更加激烈。
但是同时AI作画提高了作画的效率,也就是说游戏的开发会更快,动画的制作也会变快,画师在相同时间内能完成的稿子数量也会增加(当然一张作品的价格也可能会往下降,所以是好是坏难以讨论),而且能让底层和中层的作者以及其他需要流水线作品的人和有自己独特画风的画师收益(AI学习需要大量样本所以有自己个性的大大和太太根本不用担心...除非你是肝帝画同一个姿势的人画了几百张)所以短期来看我们只能持观望态度,没必要盲目抵制和盲目吹捧
AI作画涉及侵权吗?
这个问题我不讨论,版权保护一直是一个问题,而且没有是非正确与否(比如笔者曾经见过的一个问题:“如果一个国人盗版开发出了英特尔芯片,他会被嘉奖还是蹲大牢?”),所以笔者的态度是,版权保护固然重要,但是并没有必要过分钻牛角尖,有时更关注自己的用户体验可能会更开心。
普通人使用AI作画应该被批评吗?
首先我们应该达成一个共识——资本家才是应该被批评的对象。
程序员开发出这个AI本意绝对不会是消灭中底层画师,我们更希望的是让这个世界发展的脚步更快,为人们包括自己带来更好的生活质量,程序员我想应该不是被批评的对象。
普通人使用AI作画我想更多的是为自己带来乐子吧,把室友的脸丢到参考图那里看看会是怎么样,或者是参加一些原本只有会画画或者有财力的人才能参加的活动,也应该不是被批评的对象。
对于个别愿意使用AI作画的画师,他们只是更快接受了这一项技术而已,毕竟AI作画会对绘画行业带来怎样的影响不是这几个月这几年就能看得出来的,我想他们也不应该成为被批评的对象。
要我说谁最应该被攻击的话,那一定是资本家。现在年轻人为啥会躺平,还不是我创造的一切价值最终都成为了资本家的玛莎拉蒂上的一颗螺丝呗。年轻人躺平,资本不满足,不够他们收割,于是变本加厉,当赚够钱之后就溜了,享受漂亮国的“香甜空气”。在整个AI作画风波中,程序员和画师都是受伤的对象。程序员不开发出点东西没有饭吃,画师没有稿子画也没有饭吃,于是资本想到一个绝妙的主意,把多方矛盾点燃,自己拍了拍屁股数钱去了,转移矛盾这招对于资本来说是惯招了。
技术不应该被批评,这是时代的进步,开发算法的人不应该被批评,他们是推动时代进步的工匠,普通人也不该被批评,世间从来就不是非黑即白,擦亮双眼,团结力量,我们要把铁拳砸到资本头上!
最后放上我的一个画师朋友给我看的一张图,经此事可谓士别三日刮目相看,她应该是属于绘圈最先能接受AI作画的一批人吧(也许抢占了先机?)





是我了(xwx)

文末感谢程序员新风和人工智能rin酱,请祝他们幸福!
分享到 :
0 人收藏

20 个回复

倒序浏览
2#
期权匿名回答  16级独孤 | 2022-11-9 22:06:49 发帖IP地址来自 北京
看得出有写文的功底,无人但是好文[赞]
3#
期权匿名回答  16级独孤 | 2022-11-9 22:06:59 发帖IP地址来自 中国
写的很好   算是明白了一点  感谢
4#
期权匿名回答  16级独孤 | 2022-11-9 22:07:41 发帖IP地址来自 北京
谢谢你,我是美术生
5#
期权匿名回答  16级独孤 | 2022-11-9 22:08:38 发帖IP地址来自 北京邮电大学
我觉得你和其他写ai绘画底层逻辑的答主有很多观点完全相反,比如ai是否有创造力,一个计算机人工智能专业的答主说ai就是像素级别使输出的画作接近于他学习模型中的风格,所以无法拥有创造力[思考][思考]
6#
期权匿名回答  16级独孤 | 2022-11-9 22:09:06 发帖IP地址来自 北京
这样,我们假设AI的训练集中只有红色的玫瑰,现在你让AI画一朵玫瑰出来,它为了近可能接近模型肯定会画成红色花瓣绿色花茎,这就是没有创造力的情况。但是如果我们加入随机的干扰,比如我们在程序中加入“你不能使用红色”这一限制条件,那么AI画出的玫瑰可能是白色,可能是粉色,甚至可能是五颜六色,这个时候我们能不能说AI有创造力呢?它已经跳出了模型的限制。虽然你可能说它的创造力源于随机性,但我们人类的创造力其实也是源于我们自身的经历,抽象到数学意义上就是随机变量。
再比如例子中的围棋AI,它刚开始只知道随机地在棋盘上落子,但是最后经过迭代进化出了自己的棋风,这我认为也是创造力的表现。(如果有兴趣可以去查查alphastar,这个AI在与人类的对战中甚至进化出了不同的“性格”)
7#
期权匿名回答  16级独孤 | 2022-11-9 22:09:55 发帖IP地址来自 中国
更进一步的来讲,当AI发现画出金色玫瑰的时的反响比其他颜色好时,如果这个AI能够根据反响调整策略的话,它或许以后都会把玫瑰画成金色了,甚至你把限制条件去掉它也会画成金色(因为大众对红色玫瑰的喜爱程度积分会是0,远低于金色)。这个时候在我看来其实就可以说它形成了独特的风格。当然我觉得这方面见仁见智。
8#
期权匿名回答  16级独孤 | 2022-11-9 22:10:49 发帖IP地址来自 北京
你在说啥呢? ai没创造力。你去看看AI的画,像没创造力吗?没创造力大家会害怕他吗?AI有创造力是一个不需要讨论的继承事实了好吗。
9#
期权匿名回答  16级独孤 | 2022-11-9 22:11:30 发帖IP地址来自 北京
现在ai绘画发展势头这么猛,那大概多久ai能发展到精准的表达画面呢?,比如甲方要求一张图里要人物的位置,姿势,表情,角度,透视,物体的光影,位置角度等等非常具体的表达,等等都完全按照甲方的预期效果去完成ai绘图,很想知道大概什么时候能到这种地步,会不会在明年内就到达这种程度的可控性呢[思考](计算机人工智能完全小白的文科生非常想知道这个问题[蹲])
10#
期权匿名回答  16级独孤 | 2022-11-9 22:12:30 发帖IP地址来自 北京
人类也是必须要摄入不同的知识和图像才能组合创造新东西、画出不同画,想象力越来越强,和ai何其相似。只是人类要收集几十年才能拥有的图像知识储备,ai几个月就能学习和输出。从这个角度看,想象力和创造性反倒才是ai的优势。
11#
期权匿名回答  16级独孤 | 2022-11-9 22:13:01 发帖IP地址来自 中国
分析的很多。但是不可忽视的社会问题就是言绘画本身是一个需要数年学习的专业技术,且对于大多从业者而言基本等于全部的最佳学习时期。[思考][思考][思考]从这点来看ai还真是可怕呢。而且答主也只敢说短期,可是学习成本说不定就比这个短期长了。[思考]
12#
期权匿名回答  16级独孤 | 2022-11-9 22:13:22 发帖IP地址来自 云南
追求具体的时间节点毫无意义。这些光影,位置,姿势,完全可以靠人的简笔画实现。然后ai补全。或者直接就是更详细的定义就好
13#
期权匿名回答  16级独孤 | 2022-11-9 22:13:35 发帖IP地址来自 广东广州
主要原因其实还是现在AI发展得太快了,以前总是受限于算力,但是现在随着40系显卡已经面世了,AI的计算能力得到进一步提升,如果真的等到40系显卡普及的时候,AI又会发展成哪样谁也不好说,所以就目前来讲只能就短期情况来讨论了。[思考]
14#
期权匿名回答  16级独孤 | 2022-11-9 22:13:55 发帖IP地址来自 北京联合大学
这个真不好说,影响因素太多了,但是提升自己的能力绝对是不会错的应对的最佳方式
15#
期权匿名回答  16级独孤 | 2022-11-9 22:14:10 发帖IP地址来自 湖北
但是现在这些都不能达到呀,我想用ai绘出一张我心里已经有的图,,描述出来不能达到预期效果,看见很多玩主二次元ai模型的人他们把自己的设计稿扔给ai,出来的设计和他们的设计不会完全一样[捂脸],就是说如果可以发展到不需要专业的画师去改的地步就好了,
16#
期权匿名回答  16级独孤 | 2022-11-9 22:14:23 发帖IP地址来自 北京西城
好吧[捂脸],但是总感觉ai隔几个月就会发展成完全不需要人工修改的地步就能直接商用了[捂脸]
17#
期权匿名回答  16级独孤 | 2022-11-9 22:14:53 发帖IP地址来自 北京
额你这里一边放的 diffusion 的运行过程,一边写的 gan 的原理,是否不太合适[捂脸]
18#
期权匿名回答  16级独孤 | 2022-11-9 22:15:41 发帖IP地址来自 湖南长沙
我不是学ai,能解释下这两个有什么区别吗[蹲]
19#
期权匿名回答  16级独孤 | 2022-11-9 22:16:32 发帖IP地址来自 中国
作者描述的那种生成器和判别器的模式叫做 GAN,是过去很长一段时间内生成模型中的最好模式,但是最近的突破是来自与其他的范式,diffusion model,原理大概是通过一步步很小的变化将图片变成纯噪声,学会这个逆过程,机器就可以将噪声生成为新的图片了。其实无论哪种方式讲的都不是很准确,有点凭感觉的意思,要真正理解还是得从统计的角度出发。
20#
期权匿名回答  16级独孤 | 2022-11-9 22:17:05 发帖IP地址来自 北京
毕竟这篇文章的技术性部分是写给没有专业基础只想了解一下AI的人,我是想加入更多内容才把这俩揉一篇文章里的,有些专业知识也是做了简化的,有些出入也请海涵_(:з」∠)_
21#
期权匿名回答  16级独孤 | 2022-11-9 22:17:24 发帖IP地址来自 中国
谢谢老哥[赞]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:400157
帖子:80032
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP