写在前面

  • 我不会 PS,只会 windows 自带的画图板
  • 学 MJ 只有 3 天时间,画了几张图,对我来说完全是惊艳
    • 希望通过这篇文章,让我们一起开始探索

1、离谱村招新了

这几天离谱村的招新活动如火如荼进行着,二维码在文章最后,一个又一个离谱的硅基生物粉墨登场,好不热闹。
为了提高知名度,离谱村委会牵头,用 MJ(midjourney,下面都简称 MJ),Runway 等 AI 工具做了宣传动画片。下面是几张 MJ 做的分镜头。

图片 prompt 作者
image.png This is a movie screenshot of a magical village scene with strange architecture and houses shaped like mushrooms. In the soft morning sunlight, A sign next to it reads “Welcome to Lipu Village”. In the scene, many of the buildings are broken. Movie footage, peculiar architecture, early morning light, clear text on the sign, dynamic megaphone effect, somewhat gray atmosphere, HD quality, natural look –ar 16:9 –v 6.0 –style raw –s 250- 猫叔
image.png Realistic brown bear, anthropomorphic fat brown bear, a brown bear in costume is standing, raising his hand in greeting, wearing a red mushroom hat decorated with many flowers, and carrying a worn travel bag on his back. The expression is happy and surprised. There are many anthropomorphic animals watching nearby. Everyone is looking at the bear with a happy expression. Mushroom-shaped wooden house, panoramic view, lively market in the forest, the background is the forest, and various magical animals. Plants, looking lively, realism, DSLR photography, bright colors, depth of field, natural light –s 500 –v 6.0 –sw 100 –sref https://s.mj.run/Rx3UCIR_fOE :: 2 https://s.mj.run/CyzhU8ezbmY :: 3 https://s.mj.run/tmCbRpoA-00 :: 2 –ar 67:71** - Image #2 xmdesign
image.png cute shark made of light brown wafer cookies, starfish shaped cookies on the ocean floor and in the background, sunny, realistic photo –ar 16:9 –v 6.0 大雷kiki
image.png In the early morning, on the bed, the squirrel, who has been wearing yellow pajamas, is lazily holding his mobile phone. The quilt is white and the sun shines in. National Geographic documentary photography, warm indoor lights at night, medium-long lens, half-length shot –ar 16:9 –c 3 –iw 0.250000 –v 6 躺平的榆树
image.png
In a magical village, at the market, there are 5 animals looking at each other on their mobile phones. The application cannot respond. One of the mobile phones is facing the camera, and the camera can see that it says “Service Unable to Provide”. The five animals are wearing The monkey in a yellow jacket, the hedgehog with a pineapple on his head, the raccoon in a white shirt, the goat in a black trench coat, and the rabbit in a pink skirt all looked lost and shocked. National Geographic documentary photography
, grey blue, warm light, foggy:: 3 minimalist photo of an man in a futuristic suit, mountains, north nature, muted tones, warm light, low contrast, foggy –ar 16:9 –c 14 –iw 0.250000 –v 6
躺平的榆树

那么,这些图是怎么画出来的呢?就是所谓文生图,通过文字描述生成图片。

2、MJ 的几个基本操作

MJ 很长一段时间内,都是依赖一个叫 discord 的“聊天工具“进行操作,简单理解是一个微信群/钉钉群,群里有个机器人,我们@它,给它一段文字,它就会出来一个图片。我们也可以自己创建一个群组(它们叫服务器),把这个机器人拉进来,和它对话进行创作。
image.png

开始创作的时候,就是@机器人,如下
image.png

角色 动作 示例 说明
我们 发消息给它 In front of the Xianyang City Gate, Liu Bang stood on the city wall wearing simple Hanfu and looked into the distance. –ar 16:9 –iw 0.250000 –v 6
MJ 返回一个 4 宫格图片 image.png
我们 想要放大一张图 点击上面的 U 1——4
MJ 给我们发一张大图回来 image.png
小图到大图,也就是质量升级的意思
我们 或者看看其他风格 点击上面的 v 1-4
MJ 返回新的 4 宫格 image.png
我们 以上面的图为基础继续 复制图片链接,后面加 prompt,继续折腾

简单来说,就是这样几个步骤:

  • 告诉MJ我们要什么
  • MJ 给我们 4 个不同风格的小图
  • 放大或者再看其他风格
  • 在这些图片基础继续处理

初学的时候可能会有几个想法

  • 第一次出图感觉还不错
  • 再想改就难了,陷入工具的操作,没那么酷了
  • 这个时候设计师技能就上线了

这种情况,以前除了氪金多练习也没啥好办法,现在不一样了,可以去离谱村进修了。

二维码在文末

如何起步在 https://waytoagi.com 上有大量免费的文档。

image.png

AI 出图我们很快会发现结果并不可控。为此,MJ 官方给出了一个 Prompt 结构。让我们对出图的玄学迷思,拉回到工程现实。

3、结构化 Prompt,又是 Prompt

基础 prompt

image.png
基础 prompt 就是没结构,把问题描述出来就行,非专业人士,弄个 PPT 插图啥的,我们用这个就行了。如果想要图片的尺寸,什么样的风格之类的,就需要多一个限制条件。

稍微有点结构

image.png

可以看得出来,分了 3 个部分,早期有顺序限制,基本也延续下来了。

  • 图片
    • 这个图片的意思是告诉它,我们想要风格和内容大概啥样的。
    • 说人话就是老板也说不清楚,然后给我们丢张对手的图,照着做吧
  • 文本描述
    • 我们希望在图片中呈现的内容
    • 这里的内容直接决定了最后的效果,也就是设计师的功底了吧
  • 参数
    • 图片尺寸,使用哪个模型等

这里官方推荐的”Text Prompt”有几个指导性意见

原则 一般用法 推荐用法 我的理解
慎重用词 大/big tiny/小, huge/大, gigantic/巨, enormous/巨大, immense/无比. 用相对精确的词,收敛范围。和文本生成 prompt 是一个道理
复数词和集体名词 三只猫 它主要想说明复数很不明确
关注你想要的 不要猫 需要 3 只狗 别来烦我了 vs 给我买个冰淇淋
提示长度和细节 mj 可能有 10 个参数,我们说得少它就都用默认参数,说得多,就限制它的发挥了
它也提到,如果我们确定不要什么,可以通过 -no 这个参数,比如说,一个派对上不要蛋糕,一个 logo 不要圆形等等

从这里可以看出来,真正难的地方就在于如何把我们需要的东西描绘清楚,这方面大部分人没经过专业训练。而童子功的设计师们,那就是信手拈来的事了。

现在推荐的结构 (三思老师推荐)

image.png

  • Style风格
    • 目的:提供特定的审美或艺术方向。
    • 包括的细节:首选一种风格或时代。
  • Subject主题
    • 目的:确定图像的重点。
    • 包括的细节:中心主体(如人、物体、动物)的特征,包括外貌、颜色和独特特征。
  • Setting设置
    • 目的:确定主题的环境或背景。
    • 包括的细节:地点(室内、室外、假想)、环境因素(自然、城市)、时间和天气条件。
  • Composition组成:
    • 目的:决定主体和元素的取景和观看方式。
    • 包括的细节:视角(特写、广角、航拍)、角度和具体取景偏好。
  • Lighting 照明:
    • 目的:确定画面的情绪和视觉基调。
    • 包括的细节:灯光类型(明亮、昏暗、自然)、情绪(欢快、神秘)和氛围效果。
  • Addition Info其他信息
    • 目的:增加图像的复杂性和深度。
    • 包括的细节:次要物体、人物、动物及其与主体的互动或相对位置。

MJ 控制出图创意度和风格化

创意度(Creativity)是 Midjourney 中最直接影响结果的参数之一,它决定了生成图像的创新程度。在初始阶段,用户需要掌握如何通过调整创意度来影响图像的独特性和新颖性。较低的创意度设置会生成更为保守、接近现实的图像,而较高的创意度则能激发出更加奇特和未曾见过的视觉作品。

简单理解就是画一个村间小路的狗,很平常。创意度高就是银河里有个结构复制的飞船,里面有只很奇怪的狗

风格化(Stylization)紧随其后,它允许用户指定图像的艺术风格,如模仿某位艺术家的画风或某种视觉风格(例如,水彩画、油画等)。在Midjourney中正确使用风格化关键字能够显著提升作品的艺术表现力。

每次生成图片,虽然都是随机的,MJ 也为这个图带了一个唯一的 id,也就是 seed 值,让我们不会迷失在生成的图片中。

如何学习别人的图片

image.png

通过 describe 一定程度上还原别人的图片,用什么 prompt 写出来的,这只是一个识图的功能。我们可以理解为,它就是用来描述。下面是从离谱村资料中学习到的公式,很显然,这些公式是 GPT 总结出来的。

官方公式中大部分内容都是相对固定有手册可查询,但是区分大家水平的,也是我们新手上手比较难的部分,在我看来是 Subject 部分,所以有了下面公式中的公式

4、为什么我画不好呢,上公式(仅针对上面的 Subject 部分)

4.1、公式 1: 具体物种 + 属性描写 + 装饰描述 + 行为动作

  • 具体物种: 提到特定的动物或生物,比如“棕熊”。
  • 属性描写: 描述生物的特征,如“anthropomorphic fat”(拟人化的胖)。
  • 装饰描述: 给生物添加的装饰,例如“wearing a red mushroom hat decorated with many flowers”(戴着一个装饰有许多花朵的红色蘑菇帽)。
  • 行为动作: 生物正在进行的动作,如“raising his hand in greeting”(举手打招呼)。

【中文示例】: 一只穿着戏服的棕熊站立着,用手致意,头戴着饰有花朵的红色蘑菇帽,背上背着旅行包,表情愉快且惊讶。

【英文翻译】: A brown bear in costume stands, raising its hand in greeting, wearing a red mushroom hat decorated with flowers, and carrying a travel bag, with a happy and surprised expression.

image.png

4.2、物种群体+ 集体情感+共同行为+共享环境

  • 物种群体: 一组动物或生物,比如“多个拟人化动物”。
  • 集体情感: 群体的共同情感,如“happy expression”(快乐的表情)。
  • 共同行为: 群体成员正在进行的行为,如“looking at”(注视着)。
  • 共享环境: 群体所在的环境,例如“lively market in the forest”(森林中热闹的市场)。

【中文示例】: 许多拟人化的动物在森林里的热闹市场附近注视着一只穿着戏服的棕熊,每个人都带着快乐的表情。

【英文翻译】: Many anthropomorphic animals near a lively market in the forest are looking at a brown bear in costume, everyone with a happy expression.
image.png

4.3、特殊物种+非凡特征+独特环境+活动状态

  • 特殊物种: 不常见的或想象中的生物,如“独特的生物”。
  • 非凡特征: 生物的非凡特征,如“cactus paddle ears”(仙人掌形状耳朵)。
  • 独特环境: 生物所处的特殊环境,如“against the backdrop of a white wall”(白墙背景前)。
  • 活动状态: 生物的动态行为,如“jumps up, raising up the two front feet”(跳起来,抬起前两只脚)。

【中文示例】: 一只耳朵像仙人掌片,尾巴圆润如仙人掌的兔子,正在白墙前跳跃并抬起前脚。

【英文翻译】: A rabbit with ears like cactus paddles and a round tail jumps up, raising its front feet in front of a white wall.

4.4、动物群体+ 情绪反应+集体活动+逃离环境

  • 动物群体: 一组特定的动物,如“鸟、刺猬、羊、乌龟和蟹”。
  • 情绪反应: 动物表现出的情绪,如“fearful expressions, sadness, and fear”(恐惧、悲伤和害怕的表情)。
  • 集体活动: 动物共同进行的活动,如“running away in fear”(恐惧中逃跑)。
  • 逃离环境: 动物逃离的场景,比如“in the beautiful forest”(在美丽的森林中)。

【中文示例】: 在美丽的森林中,一只鸟、两只刺猬、三只羊、一只乌龟和一只蟹穿着衣服恐惧地逃跑,表情透露出恐惧、悲伤和惊慌。

【英文翻译】: In the beautiful forest, a bird, two hedgehogs, three sheep, a turtle, and a crab dressed in clothes run away in fear, their expressions revealing fear, sadness, and panic.
image.png

4.5、场景描述+主题揭示+情境氛围+视觉效果

  • 场景描述: 描述所展现的场景,如“magical village scene with strange architecture”(魔幻村庄场景,带有奇特建筑)。
  • 主题揭示: 场景中的特定主题,如“houses shaped like mushrooms”(蘑菇形状的房屋)。
  • 情境氛围: 场景中的氛围,如“soft morning sunlight”(柔和的晨光)。
  • 视觉效果: 视觉上的特殊处理,如“dynamic megaphone effect”(动态喇叭效果)。

【中文示例】: 天空视角,这是一个带有奇特建筑和蘑菇形状房屋的魔幻村庄场景,在柔和的晨光中,一块旁边写着“欢迎来到Lipu村”的标志清晰可见。村庄中许多建筑已破败,带着些许灰暗的氛围,但被晨光中的自然美所包围。

【英文翻译】: A view from the sky reveals a magical village scene with strange architecture and houses shaped like mushrooms. In the soft morning sunlight, a sign reads “Welcome to Lipu Village” clearly. Many of the buildings are in disrepair, contributing to a somewhat gray atmosphere, yet surrounded by the natural beauty in the morning light.

image.png

公式还有很多,它们的价值在于,让我们在起步阶段快速上手,建立感知,想要真正上手,不得不提开源,免费,全球最大的中文 AI 知识库了。

5、离谱村在哪里

离谱村招新