序
AIGC(Artificial Intelligence Generated Content,生成式人工智能)并不是什么新鲜事物,在20世纪50年代,就有科学家开始了相关研究。经过半个多世纪的技术发展,再加上互联网上海量素材的积累,AIGC最近到达了技术爆发期,也成为人们讨论的热门话题。
类似于历史上的其他技术革命,AIGC也让人恐慌。有人觉得它会让很多人失去工作。而乐观的人会回想起人类从马车时代进入汽车时代,大量的马车夫失去了工作,但同时也产生了一个新的职业:汽车司机。2023年4月1日晚上,笔者约了两位师弟夜谈,其中一位师弟徐涵神秘兮兮地说,AIGC一定会催生一种新的职业:提示词工程师。那天晚上我们聊了很多事情,但当时我并没有考虑到AIGC跟我有什么关系。
4月10日,师弟慈思远的设计社群集创堂举办了一场主题为“Design Tomorrow(明日设计)”的分享活动。在活动中,印隽老师讲解了AIGC的发展趋势和他在这方面的探索。一边聆听印隽老师的分享,我和师弟沈毅老师一边在下面“开小会”。我跟他讨论的是,AIGC生成设计作品,是让设计更大众化了,还是依然保持了精英化的本质?当印隽老师讲解利用AIGC技术生成图像的时候,我们认为AIGC使设计更加大众化了,不会设计的普通人也能利用“文生图”的原理,用AIGC创造出很漂亮的画面;但当印隽老师聊到提示词的精准和艺术性的时候,我和沈毅老师恍然大悟,又一致认为,设计依然保留着精英化的一面。其专业化、精英化无非是从画面的设计制作转移到了对画面的定义中。也就是说,设计师从创意、制作转变成了向AIGC下指令。设计师成了AIGC提示词工程师。
用提示词指挥AI生成画面,本质上就是对画面进行美学定义。美学定义包括三大要素的定义:审美要素定义、风格要素定义和应用方向要素定义。恰巧,笔者20多年的研究工作就聚焦于研究消费者的审美特征,帮助企业进行品牌和产品的美学定义。工业设计领域美学定义的方法论平移到AIGC领域还有效吗?我先带学生做实验。我带领8位同学对绘画、游戏、电影等艺术门类的画面风格进行分类,然后进一步对各个风格的色彩、光线、质感等要素进行分析。打好了这个基础以后,我希望带领职业设计师试验一下这套方法论的有效性。2023年6月16日和17日,我带领7位专业设计师用Midjourney和Stable Diffusion来尝试我们的美学定义方法,印隽老师也全程参与。很幸运,我们的方法论“跑通”了。
看到我在朋友圈的晒图,人民邮电出版社的蒋艳老师鼓励我把这次的研究写成一本书,就是您现在看到的这本书。我带领平面设计师于春雨,用了两个月,把我们的方法论仔仔细细又实践了一遍,制作了本书中所有的作品。在这个过程中,我们对提示词进行了细致的试验。我们从光、材质、艺术流派、插画、游戏、女性美、流行趋势几个方面,对画面风格进行分类,尝试各种提示词的有效性。
本书第一章主要讲解利用AIGC技术生成画面的基本原理。虽然我们尽量写得简单易懂,但还是绕不开一些专业术语和技术描述。希望这部分不会给您带来思想负担,看不懂也没关系,就像开车不懂发动机,也不妨碍您享受驾驶的乐趣。后面的内容则是我们基于对画面风格的分类,利用提示词指挥AIGC工具生成画面的具体方法和案例。本书写作的风格比较平实,注重实验性和实践性。希望我们粗浅的研究能启发您生成更加优美的图片。
本书是我写得最快的一本书。首先感谢徐涵、沈毅两位师弟为我提供了写这本书的灵感和勇气;然后要感谢印隽老师在理论和设计实践方面的引导;感谢早期参与进来的八位学生——徐建华、金安安、魏堃、蒋依林、李朋卉、韦宇棒、蔡文浩、姜宇航,他们协助我搭建了初步的研究框架;感谢于春雨两个月来耐心工作,制作了本书的图片;还要感谢我团队的孔莹、杜文锦和郭聪儿三位老师,她们全程参与了研究和写作的过程,在AIGC领域对我们团队美学定义的能力进行了一次有益的操练。最后还要感谢挚友陈蔚武老师全程辅导本书图像的生成和文字的撰写,帮我们把控住了图文的逻辑和美感。
希望本书能给大家带来一些启发。
傅炯
2024年1月9日