摘要:
近来人工智能(AI)在图像生成领域出现的显著进展,引起了社会各界的广泛关注,一时间围绕其展开的争论不绝于耳。这些争论背后隐含着社会群体对AI大举介入艺术创作领域的抵触与焦虑,其指向的主要问题有两点:其一是AI生成物的艺术性何在;其二是AI会给艺术领域带来哪些变化和影响。针对这些问题,本文首先回溯AI生成艺术的发展脉络,探讨其存在合理性;其次对当下AI生成艺术的原理做出了说明,并针对其利弊做客观讨论;最后展望AI生成艺术的发展前景,有助于读者对其加深认识与理解。
关键词: 人工智能;生成艺术;AI算法自古以来,艺术作为人表达自我与叙述思想的一种方式,在人类文化中有着举足轻重的地位。而随着近年来人工智能(下文统称AI)的发展,人们一直在探索其在各个领域应用的可能性,其中就包括艺术领域。
那么,AI与艺术之间如何关联?我们对艺术的观念又是否会随着新的现象而改变?带着这些疑问,笔者结合AI生成艺术的过往历史与当下现状来进行讨论。
一、AI生成艺术简史
AI与艺术间的渊源最早可以追溯到20世纪50至60年代。彼时AI的探索尚处萌芽阶段,工程师与艺术家通过在计算机和绘图仪等设备上运行某种基本算法或系统编程来生成简单的图案和形状,这便是计算机图形学的开端。例如,德国数学家和科学家弗里德·纳克(Frieder Nake)在1967年创建了一个名为“矩阵乘法”(Matrix Multiplications)的图像作品集。纳克制作了一个被数字填充的正方形矩阵,其中的每个数字都被指定为一个具有特定形状和颜色的视觉符号,这些数字依次与自己相乘得到新矩阵,最后根据矩阵的值将这些符号放置在光栅中。纳克在这一时期的工作中经常使用随机数进行生成,而他的乘法过程也被认为是自动化的。
由计算机产生的这些早期图像成果的首要特征,即生产过程的高度自动化。它们最终呈现的是被转化为可视的图像数字运行的过程,人的主观因素在这一过程中失去介入余地,图像结果均由计算机和算法系统自身生成,换言之,算法系统是其存在的根基。这种自动的、不可控的、脱离于人的视觉效果生产流程,背离了传统美学的表达与接受范式,它独立于人与自然的传统二分,诞生于机器和数字游戏,它的存在拓宽了人对艺术创作方式的理解。基于自动化算法和系统的生成艺术概念由此出现,同时,不断追求算法自动化与智能化的AI在艺术领域也与之天然耦合在一起。
20世纪70至80年代,AI生成艺术开始在计算机辅助设计中得到更广泛的应用,各种设计软件在计算机上生产更复杂和逼真的图像成为可能。例如,艺术家哈罗德·科恩(Harold Cohen)于1973年开发的AARON算法,通过此算法,计算机能以类似手绘的不规则笔触绘制图像。起初,科恩开发AARON的编程是为了绘制特定的对象,但他后来发现自己设置的一些指令经由算法演绎竟生成了意想不到的视觉形式。于是,AARON算法创作了一系列抽象绘画,甚至到了90年代,它逐渐生成了更复杂的艺术形象,包括岩石、植物和人类的肖像。
20世纪90年代,AI生成的艺术不再局限于视觉效果的表现,艺术家们开始运用AI算法生成音乐并创作新的诗歌形式;同时,AI生成艺术的算法也开始被编入机器人的程序来创作绘画和雕塑。如今,AI生成艺术被用于各个领域,包括广告、影像、建筑、游戏、时尚设计等。
二、AI在艺术创作中的工作原理
时下AI用于艺术创作的方式多种多样。在视觉艺术领域,AI算法可以在一组参数的基础上生成图像或视频,或者通过组合和改变现有视觉素材来创建新图像,而这些算法都建立在AI的神经网络(Neural Networks)之上。神经网络算法不仅可以针对特定艺术家的风格进行模仿,还可以对特定艺术类型进行相似性再现,其中具有代表性的算法模型为神经风格迁移(Neural Style Transfer,简称NST)和生成对抗性网络(Generative Adversarial Networks,简称GAN)。
当使用深度神经网络进行视觉生成,将一个作品的风格转换到另一个作品上的方法称为神经风格迁移(NST)。NST的核心理念在于通过一个捕获图像纹理信息的特征空间来获取图像的风格表示。神经网络中各层信息滤波器的响应构成了特征空间的基础,空间内包含了不同滤波器响应在特征映射间的相关性,通过包含多层的特征相关性,最终获得输入图像稳定的多尺度特征纹理表示。此外,经过实验发现,在卷积神经网络(Convolutional Neural Network)中进行风格迁移时,图像内容和风格的表示是可分离的,这意味着这两种表示都可以被独立操纵,以生成具有感知意义的新图像。
与NST不同,生成对抗性网络(GAN)则是通过自主学习现有的艺术风格来生成以假乱真的甚至是超越性的新风格。GAN通常由两个相互竞争的神经网络组成,其中一个输出新图像的深度网络被称为生成器,另一个对生成器输出图像进行分类判断的则被称为鉴别器。在连续的生成练习中,生成器以欺骗鉴别器为目的对原始图像进行模仿,而鉴别器则以识破这些欺骗性模仿为目的进行判断。这种对抗游戏同时训练两个网络,一旦训练循环完成,生成器就可以输出与原始图像几乎无法区分的真实图像,此时将无法靠肉眼分辨出AI与人的创作差异,甚至AI完成的视觉效果更加优秀。
弗里德·纳克在1967年用计算机生成名为《矩阵乘法》的图形
上述两个神经网络AI算法模型分别在2014年和2015年被提出,二者凭借出色的生成效果被广泛运用在各种类型的AI创意生成工具中。近年来,随着技术与经验的累积,新的算法模型也不断被开发与应用,例如DALL·E2与Stable Diffusion,二者可以从自然语言文本提供的文字描述中直接生成相应图像的算法模型相继面世,后者更是直接开源让所有具备代码能力的用户随意开发使用。
随着算法的迭代更新,各种应用场景下的AI生成工具也不断成熟和普及,AI生成艺术迎来了空前繁荣。
三、当下AI生成艺术的优势与短板
如今,技术工具普及下的AI生成作品开始有泛滥的趋势,这一现象标志着AI生成艺术进入了新的历史阶段,即更进一步深入艺术创作领域,并开始对艺术生产流程产生广泛影响。面对这一拐点时刻而产生的焦虑情绪正在艺术界不断放大,对此,笔者认为需要冷静看待AI生成艺术的优缺点,才能更好地认识并接受当下它在艺术和相关领域引发的变化。
在笔者看来,目前AI创作艺术的优势与短板都十分明显。首先,AI生成工具在实际使用中展现的优势来说,AI生成图像或视频的便利性是毋庸置疑的,高度自主化的智能算法使生成过程快速便捷,且一次性可生成大量视觉样本供人选择,极大提升了创作效率。其次,AI算法生成视觉样本的过程和原理弥补了人类创作思维之外的盲区,它生成的视觉效果往往以人意料的角度启发着人的创作灵感。最后,持续对巨量样本数据的深度学习加速AI算法模型迭代更新,它生成的艺术风格亦将不断变化演进,充满可能性。
而说到AI生成艺术的短板,最先被人诟病的一点在于其缺乏人性化。尽管它生成的结果令人惊叹,但其生成过程始终缺乏人类艺术创作包含的情感和动机,因而遭到部分人抵制。其次,AI算法模型的自主学习极度依赖数据样本,而这些数据由网络或具体使用者提供,若在样本来源受限或样本枯竭的情况下,其生成结果将是对样本重复且无趣的衍生。再者,AI算法的高度自动化让人无法在流程中进行细节把控,导致最终生成结果不可控,无法时刻满足创意需求。最后,是伦理与法律问题,现阶段我们还不能定义AI生成作品的版权归属,因为其学习的样本来源尚存争议。近期,诸多艺术家与设计师在未被告知的情况下其作品被投放给AI算法进行模仿学习,且生成的作品又陷入版权争议,从而限制了它们的使用和传播,而参与生成这些作品的一方也会承受相应的道德谴责。到目前为止,几乎所有面向公众的AI生成艺术平台都处于版权真空状态。
综合看来,AI生成艺术在未来仍旧会在算法演进下保持高度发展的势头,但也势必会在版权领域引发更加尖锐的矛盾,这是今后亟待解决的。而关于AI创作艺术性的争论,笔者相信在解决法律和伦理争议后是能被更多人理解与接受的,参考2018年10月以43.2万美元成交的AI生成艺术品《Edmond de Belamy》,以及近期在美国科罗拉多州艺术博览会获得数字艺术组冠军的AI生成作品《Theatre d'Opera Spatial》。这些作品和相关人士并没有在争议中销声匿迹或被否定的声音打倒;相反,它们作为标志性事件释放出了一个明确的信号,即AI不论作为创作主体或是创作工具,其存在和价值正被推动给更多人认识和接受。当AI生成艺术能妥善解决版权争议并大规模投入创意生产领域时,群众和艺术创作者们将学会与之共存,彼时也必将催生出新的艺术形态和价值体系。
结语
当下,AI生成艺术的潜力显著增加,智能算法在不断扩充其学习的范围和应用的边界。同时,AI生成艺术也进入了更广阔的大众视野,并尝试融入社会的生产生活空间,它正在从一个尖端科技或先锋艺术的位置下沉到更广阔的大众文化市场。人们踌躇于变革的到来,同时也在期待它能否带来更多全新的事物。于此,笔者建议以一种客观包容的心态去理智地看待AI生成艺术在当下和未来的图景,AI作为人所开发的工具,不应将其置于与人对立的位置,如何正确认识它、使用它才是我们今后艺术发展的新起点。版权声明:【除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因,或会存在不当使用的情况,如,部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系及时处理,共同维护良好的网络创作环境,联系邮箱:603971995@qq.com】