产品经理&设计：hali，腾讯 IEG光子工作室技术大佬：usagi & willbean提示词工程：usagi & hali本文由hali以主观视角撰写

PART1. 由来

不知道大家使用Midjourney（以下简称MJ）的经历是怎么样的，而我遇到的很大的困扰是，脑海里有一个想象，但是其实不知道怎么表达才是合适的。

网上的工具有挺多，比如OPS、冰枫营AI提词器，也看过很多教程和文档，但是会发现有个问题：就算我有了这些工具和教程，我依旧很难在那么多提示词里面挑到一个满意的答案，只能不断不断的测试和试错。

既然已经是AI时代了，为什么在写提示词的时候却不能更聪明一点，而还需要我不断重复操作，不断胡乱的删添繁简，以期望在上百张图里面能撞到大运出来一张令人满意的结果呢？

有一天在用MJ给我干活的时候，突然想到，如果能用GPT给我更多的推荐会是怎么样的？

根据这个想法，就打造了这个AI提示词工具，希望可以帮助到大家更好的使用AI绘画工具！

PART2. 工具

这是一个基于GPT与提示词工程打造的AI绘画提示词推荐工具。

这款工具能力很简单，就是输入你任何想展开想象的内容，我们会通过大语言模型的能力，将你的想象按照不同维度拓展。

它唯一的使命就是：

让想象更多想象

请注意：这个工具不是为了取代你，一键生成完美的提示词，而是帮助你，让你获得更多的想象和描述角度。

体验网址：

https://midjourney.talkgame.ai/

建议使用电脑打开网址，手机版本体验还不是很好，产出的词条还不能完全保证精准度和可用度，可能会有一些页面的BUG和服务器爆炸的问题，如果炸了请第一时间联系我，一起共建～

也因为做了大量的提示词工程，在消耗token上是比较惊人的数量，GPT3.5的API使用费用实在有点招架不住，但我想做的就是让AI普惠，用AI发电，因此也希望大家可以免费白嫖使用到，在每日使用次数上会有限制，每天常规用户只能使用3次，但只需要在交流群里每天获取最新的口令，将获得每3小时15次的使用额度，让大家可以更好使用上这个工具。（交流群的加入请在工具页面上获取）

PART3. 功能

这个工具功能非常简单，就是通过它可以给你更多的灵感和创意，以帮助你去更好的使用MJ。

1.主体细化描述

这个工具会对你给的内容进行分析，发现这个内容的主体，并对这个主体进行详细描述。

例：输入【皮卡丘】，会帮助你快速描述皮卡丘这个主体。

2.风格与艺术联想

这个工具会根据你给的内容，进行风格联想，给你更多的有关风格、艺术家或相关作品的想象，让你在使用MJ的时候可以有更稳定的控制。

例：输入【水下摄影】，它会给你提供全球知名水下摄影艺术家。

3.色彩视角灯光的推荐

这个工具还会对现阶段描述的画面，提供更多的有关画面构成的推荐。

例：输入【玛丽莲梦露】，它会给你提供构图视角和灯光的建议。

4.推荐理由

这个工具也通过大语言模型的能力，将给你解释它推荐这个词条的原因，并判断跟你输入的词相关的匹配度，帮助你判断使用。

例：输入【玛丽莲梦露】，它会给你提供相应的推荐理由。

5.一键复制所有词条

点击tab会将词条储存于底部的临时收藏栏，一键即可复制所有词条，帮助你直接复制到MJ上使用！

以上就是所有功能，未来还会拓展直接自动按照你的选择再生成完整提示词的功能，并会增加更多的参数推荐。

PART4. 实际应用演示

如果我要用MJ画一个龙珠里的孙悟空，我其实不太知道他叫啥英文名，没关系，咱就是说，直接问：

Input：龙珠里的孙悟空叫什么名字

Output：Son Goku

然后开始丰富主体细节，选择合适的词条复制:

Input：龙珠里的孙悟空

Output：Anime, Dragon Balls, Super Saiyan

看看有没有啥更有冲击力的镜头

Input：很近的镜头

Output：Extreme closeup view

再把颜色搞得更夸张一点

Input：色彩超级无敌鲜艳

Output：vibrant colors, Color Field Painting

搞点之前用MJ很好用的玄学词汇：

Input：生物发光色彩

Output：bioluminescent colors

搞点更鲜艳的色彩和背景：

Input：荧光色背景

Output：vibrant neon background, Psychedelic

最后将这些词条组合一下，并增加一些MJ的参数设定：

Anime, Dragon Balls, Son Goku:: 1.5, Super Saiyan, Contrasting Composition, Extreme closeup view, dramatic lighting, vibrant colors, Color Field Painting, bioluminescent colors, vibrant neon background, Psychedelic –ar3:4 –q 2 –s400 –niji 5

这样就完成了这个极具视觉冲击力的超级赛亚人了～

PART5. 产品实现流程

下面我给大家描述一下实现这个工具的整个流程，作为一个不懂代码的设计师，我是如何完成这个网页产品的？

这完全仰仗GPT4给带来的无限可能！

具体开发流程是：

1.产品策划：在ChatGPT上建立MVP提示词工程，试验可行性

2.产品设计：使用Figma做UI和交互

3.产品开发：通过GPT4从0到0.5开发MVP产品

4.跪下请求技术大佬的帮助：这是整个产品开发最重要的步骤

5.提示词工程：不断打磨和优化提示词工程

6.产品上线：也就是现在你们看到的工具的样子

我将一步步给各位展开整个具体的开发流程。

1.产品策划

在第一个阶段，就是试验这个想法的可行性，整体的产品搭建思路就是想通过GPT，我提供一个基础的【输入】，它会把我的输入展开【想象】，并且给我更多的如【风格、艺术家、电影等等】这些我不太能想到的一些词条，然后把它贴回到MJ去生成。

以此为想法我做了第一次个尝试，就是直接用自然语言去测试可行性：

Test1：

第一次他给的答案看起来好像还不错，但是有个问题，这些人经过我丢进MJ上去生成，有好几个艺术家并不能产生效果，很明显GPT推荐的这些艺术家可能并没有被训练到。

Test2：

没想到刚开始就滑铁卢了，我又开始琢磨，是不是GPT推荐的艺术家们在网上的作品数据不够多，又或者是GPT瞎编的呢？于是我又做了一个尝试。

这次的效果比我想象中的好了很多，这里已经大部分的艺术家风格都比较清晰且准确，在mj上也能得到不错的反馈。

Test more：

然后开始用这样的方式，开始不断的测试，尽可能测试到一个更为稳定表述方式。

JSON：

经历一系列的初步调试，开始写出第一个MVP版本的提示词工程，这里使用了吴恩达的提示词工程课程里讲的写提示词的重点方法：编写明确和具体的指令，留给模型足够的思考时间。

因此我让GPT分步骤思考内容，并让他解释推荐的理由，再让它以JSON格式输出，JSON格式将为后续转化到api接口输出时提供巨大的帮助。

结果看起来很不错，不是吗？

2.产品设计

有了这个MVP模型，下一步就是开始搭建整个产品设计框架了。

在整体的界面规划上，其实很大程度借鉴（chaoxi）了一下ChatGPT IOS版本的UI设计。

从GUI到LUI，界面开始往自然语言交互方向演变。

因此界面设计应该足够简洁，并且交互要非常简单直接，要完完全全降低用户的学习和使用成本。

因此在这个产品设计上，就仅仅是从一个输入框开始，出现的词条也是非常清晰地排布在界面上，通过颜色去区分不同的模块。

并且在交互上做了很多小心思，比如悬停出现对该词条的推荐理由，点击就直接将英文词条复制到剪切板。

3.产品开发

有了UI和交互，现在万事俱备只差程序员了。

但是作为内向腼腆社恐的我，得去哪里找程序员大佬来给我干活呢？

于是，为传承中华民族自力更生自强不息的优良传统，我开始–打开B站，开始了第一步：

然后选择了放弃。

我连学啥都不清楚。

我又开始打起了小心思。

大家不是都说GPT4很牛吗，那是不是可以用它真正的写一个能用的代码出来？

光说不练假把式，咱就是说不撞撞南墙又怎么能知道自己头铁不铁呢？

于是开始了学习如何【自然语言编程】：

从B站的一些大佬的视频中学到了一些方法。

Step1:

先找GPT4了解一下如果要做一个网页需要做多少事情。

Step2:

找个最小可行性实验，写一个能输入并且输出的网页。

好的这个肯定没问题，都用不着测试了，毕竟别人可是用GPT直接写pygame的。

Step3:

从这样的框架开始逐步展开，记住使用GPT的核心方法：编写明确和具体的指令，留给模型足够的思考时间。

将GPT给的所有代码复制到TXT文档里，并且修改相应的后缀，就能得到能打开的前端了！

Step4:

然后你就会遇到问题，无法执行啊这是咋回事，直接把错误代码复制回给GPT，看不懂继续追问，原来apikey不能直接粘贴在前端，需要将apikey放在服务器。

这对我来说也太难了吧！！我根本不知道怎么弄啊！

Step5:

GPT告诉我，需要开始用python写一个简易的后端，并且要配置各种奇怪的环境….

到这一步我就实在给我整不会了，我只会把代码贴进TXT文件改后缀这样的操作，要我搭建环境，而且就算有GPT的指导也并不太能搞定，太复杂了真看不懂了 T.T

（此处我的GPT记录丢失了实在找不到了）

总之这个过程非常为难我，要打开什么终端安装python3，还要下载什么pip，听都听不懂的各种东西

4.跪求大佬

终于到了最关键的一步了，实在是搞不懂这一块的我，厚着脸皮请求技术大佬的帮助。

他帮助我搭建了环境，开始迅速提效，技术大佬指导加上GPT4，开发进度史无前例地飞快运转。

在某个周末凌晨4点，这个产品的MVP模型已经完全实现！！

当时的快乐，我无法给大家用语言描述！！！

之后就是开始优化整个画面，实现我的UI界面了！

我也深刻意识到，不是很懂代码现阶段而言还是没办法通过GPT完美地实现，还是需要程序员的帮助。

之后的代码包装美化和接入网络服务器，就交给技术大佬了。

在几个小时的时间里咔咔一顿撸，就此完成了这个整个MVP页面的开发。

果然，术业还是需要专攻的。

5.提示词工程开发

既然把整个MVP页面搞定了，就开始要琢磨，有没有可能把这个产品变得更加有用，结合之前使用MJ的经验，增加更多的功能属性。

我将功能再次拆解细化：

1. 主体细化描述

让GPT思考分析用户输入的内容的主体，并且加以细化描述：

2. 风格与艺术联想

让GPT根据整体用户输入的内容，进行风格和艺术的联想：

3. 构图视角灯光的推荐

通过给予GPT足够的相关MJ数据，让GPT根据用户的输入，进行构图视角灯光的推荐：

6. 产品上线

在某个凌晨，终于把产品整上线了！自己一番体验，丝滑至极，兴奋得双脚离地，差点楼下邻居都要上来打我了！！

PART6. 后记

以上就是整个实现产品的流程，现阶段的产品还是会有很多不完美的地方，但通过这样的一次经历，也让我真正意义上的第一次参与进了这场由AI带来的变革，也是第一次真正地从零到一开发一个小小的AI产品。

甚至自己体验自己开发的工具一番之后，更真切地感受到了AI带来的真正意义上的降本增效，我甚至无法想象再过多几年会发生什么？是不是数字生命真的出现，真正的AGI很快就会到来呢？

对于AI降临派而言，这一切的一切，真的，太酷了！

# 腾讯技术直播 #腾讯工程师分享技术干货：

扫码预约，get开播提醒往期文章：GPT4开放API和Code Interpreter！如何利用它们来提升你的工作效率测评 PS 最新 AI 功能在美宣上的使用基于ChatGPT+Stable Diffusion实现AI绘画基于GPT设计数据产品的一些思考点个关注，下期再见👋

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

PART6. 后记

相关文章

发表回复 取消回复

发表回复取消回复