AI模型生成对比

Foreword

研究一下如何把AI相关的AI设计产品融合到目前的艺术设计的工作流中，对比了一下当前模型生成相关的AI，发现区别还是挺大的

图片生成

Stable Diffusion

https://github.com/AUTOMATIC1111/stable-diffusion-webui

Stable Diffusion是一种图像模型，他背后是Stability AI

Midjounery

https://www.midjourney.com/

模型生成

提示词，猫和老鼠中的老鼠，拿着一个烤串

# Core requirements
Jerry from Tom and Jerry cartoon, holding a barbecue skewer,
# Style details
cartoon style, classic animation, expressive face, cheerful expression,
# Scene elements
detailed food on skewer, grilled meat and vegetables,
# Quality control
high quality, clean lines, vibrant colors, well-lit scene

tripo3d

https://www.tripo3d.ai/

明显AI理解错了对象，选择了Tom，但是模型至少是正确的，能看的，他甚至想给这个动物女性化一个胸部出来，有点搞笑。

生成速度从左到右，最慢的右侧差不多是效果最好的了，先不说语义理解对不对，模型质量非常不错

tripo 3d 还有后处理流程，可以绑定骨骼，还是不错的

Spline

https://app.spline.design/home

Spline更像是一个浏览器级别的3D设计软件，可以做模型、动画、渲染，不过总体上看是比较轻量、低质量的，仅仅适合网页用，本身这种也只有近似的卡通风格才合适，其他的很出戏。

模型生成能力都是需要付费才行，看起来一般，就不深度研究了

SUDOAI

https://www.sudo.ai/

支持图生成模型和文字生成模型

图生模型，好像一张有点困难，生成的也是个平面。

十分简单的模型生成，也会破面或者其他问题，图生模型，需要很好的图，提前扣好图，背景透明，整体模型的样子也比较全面好认

这个能力也太抽象了，可能中文提示词有问题，切换英文试一下

英文也不行，连一个基础的模型能看都做不到

3DFY

https://3dfy.ai/

https://3dfy.tools/dashboard

3DFY的生成速度着实有点慢了，这样的话容错就很低，反复修改成本就很高

一天过去了，这个模型还没生成好，放弃了

Alpha3D

https://www.alpha3d.io/

Alpha3D，就非常抽象了，完全不知道在生成什么

额更简单的提示词，也不行，这生成的非常抽象

Meshy

https://www.meshy.ai/

Meshy也是主要支持三种生成，文生模型、图生模型、材质生成

Meshy的中文提示词是理解的最好的，至少知道我说的是什么了，模型生成以后就可以生成贴图了，他是将这两步拆开进行的

Meshy的成品，还是有一些奇怪的地方，比如手指头生成畸形，烤串也稍微有点问题

英文提示词达到的效果非常像tripo3D，感觉他们的素材库很接近

Genie

https://lumalabs.ai/genie?view=create

Genie是LumaAI的产品，Genie这个理解能力稍微有点挫，整个模型穿插就不说了，这个形态都不对劲，其次也不支持中文提示词

混元3D

https://3d.hunyuan.tencent.com/

腾讯的混元3D

出乎意料，腾讯的3D模型生成竟然意外的好，虽然肯定上了一些风格，但是效果算是这里最好的了，速度也很快。

细节上比如手处理的就比Meshy好很多，可以自动骨骼绑定，还可以在生成以后做一定风格上的调整

Shapen

https://shapen.com/playground

主要是通过图生模型

在生成模型时，对于这种2D画风，生成模型会带着轮廓线，这个轮廓线就造成了破面，这里应该是可以优化一下的

Summary

图片生成的相对来说很成熟了，各种模型都有图片生成

Quote

https://www.ui.cn/detail/586009.html

https://aitools.rdlab.tw/tool-list/21b370197938cf7625e0a5be955ed3ff

FEATURED TAGS

RaspberryPi 嵌入式 Git 脚本 python LeetCode C++ APM FreeRTOS Markdown Embedded SD Linux Vim Ubuntu Tools STM32 Maya LPWAN Graph Theory Algorithm PathFind OMPL VPS QT Router JS Chrome Tampermonkey API Java Spring MySql Springboot Docker V2ray TTRSS Nintendo Switch Trace Crack BLHeli DSHOT ESC Music C# EasyCon Blog 杂谈 Proxy UAV GuinnessWorldRecords NAS 群晖 ZeroTier Typora Map 旅游 Log JSON Cython Equip Goods Share DMX512 Blender Game AP Network CloudFlare DIY WIFI Camera Diablo Sensor SES QQ Bot Python Vmq Jenkins 米家 ESP32 Software C MT793x NXP CH32 OpenWrt Onion Copilot Cursor Investment ChatGPT SFX Debug RouterOS Mikrotik GitLab Drone OpenAI VS Code 管理 build Kconfig CMake Su7 Ultra Car AI MCP LLM Art 审美

SD、3DFY、Meshy、Genie、Midjounery