Foreword
研究一下如何把AI相关的AI设计产品融合到目前的艺术设计的工作流中,对比了一下当前模型生成相关的AI,发现区别还是挺大的
图片生成
Stable Diffusion
https://github.com/AUTOMATIC1111/stable-diffusion-webui
Stable Diffusion是一种图像模型,他背后是Stability AI
Midjounery
https://www.midjourney.com/
模型生成
提示词,猫和老鼠中的老鼠,拿着一个烤串
# Core requirements
Jerry from Tom and Jerry cartoon, holding a barbecue skewer,
# Style details
cartoon style, classic animation, expressive face, cheerful expression,
# Scene elements
detailed food on skewer, grilled meat and vegetables,
# Quality control
high quality, clean lines, vibrant colors, well-lit scene
tripo3d
https://www.tripo3d.ai/
明显AI理解错了对象,选择了Tom,但是模型至少是正确的,能看的,他甚至想给这个动物女性化一个胸部出来,有点搞笑。
生成速度从左到右,最慢的右侧差不多是效果最好的了,先不说语义理解对不对,模型质量非常不错
tripo 3d 还有后处理流程,可以绑定骨骼,还是不错的
Spline
https://app.spline.design/home
Spline更像是一个浏览器级别的3D设计软件,可以做模型、动画、渲染,不过总体上看是比较轻量、低质量的,仅仅适合网页用,本身这种也只有近似的卡通风格才合适,其他的很出戏。
模型生成能力都是需要付费才行,看起来一般,就不深度研究了
SUDOAI
https://www.sudo.ai/
支持图生成模型和文字生成模型
图生模型,好像一张有点困难,生成的也是个平面。
十分简单的模型生成,也会破面或者其他问题,图生模型,需要很好的图,提前扣好图,背景透明,整体模型的样子也比较全面好认
这个能力也太抽象了,可能中文提示词有问题,切换英文试一下
英文也不行,连一个基础的模型能看都做不到
3DFY
https://3dfy.ai/
https://3dfy.tools/dashboard
3DFY的生成速度着实有点慢了,这样的话容错就很低,反复修改成本就很高
- 一天过去了,这个模型还没生成好,放弃了
Alpha3D
https://www.alpha3d.io/
Alpha3D,就非常抽象了,完全不知道在生成什么
额 更简单的提示词,也不行,这生成的非常抽象
Meshy
https://www.meshy.ai/
Meshy也是主要支持三种生成,文生模型、图生模型、材质生成
Meshy的中文提示词是理解的最好的,至少知道我说的是什么了,模型生成以后就可以生成贴图了,他是将这两步拆开进行的
Meshy的成品,还是有一些奇怪的地方,比如手指头生成畸形,烤串也稍微有点问题
英文提示词达到的效果非常像tripo3D,感觉他们的素材库很接近
Genie
https://lumalabs.ai/genie?view=create
Genie是LumaAI的产品,Genie这个理解能力稍微有点挫,整个模型穿插就不说了,这个形态都不对劲,其次也不支持中文提示词
混元3D
https://3d.hunyuan.tencent.com/
腾讯的混元3D
出乎意料,腾讯的3D模型生成竟然意外的好,虽然肯定上了一些风格,但是效果算是这里最好的了,速度也很快。
细节上比如手处理的就比Meshy好很多,可以自动骨骼绑定,还可以在生成以后做一定风格上的调整
Shapen
https://shapen.com/playground
主要是通过图生模型
在生成模型时,对于这种2D画风,生成模型会带着轮廓线,这个轮廓线就造成了破面,这里应该是可以优化一下的
Summary
图片生成的相对来说很成熟了,各种模型都有图片生成
Quote
https://www.ui.cn/detail/586009.html
https://aitools.rdlab.tw/tool-list/21b370197938cf7625e0a5be955ed3ff