lllusterious：想要统治动漫艺术生成的人工智能模型

2025-01-14 币界百科

本站报道：

卓越非凡基于Stable Diffusion XL的文本到图像模型在人工智能艺术社区中已经占据主导地位，以至于最大的人工智能艺术模型中心Civitai不得不创建一个单独的类别来处理其庞大的资源生态系统。

这一切都发生在三个月内。成功背后的秘密？以一种扭曲的方式回归基本。

虽然SD 3.5和Flux等较新的模型依赖于冗长的自然语言描述，小野马AIIllustrious的开发人员采取了不同的方法，利用Danbooru标签帮助他们的模型理解概念，而无需重新发明复杂的字幕系统。

该模型在Danbooru庞大的标记动漫图像库上的训练使其在理解视觉概念方面具有优势。

Danbooru系统中的每个标签都代表特定的元素，如角色特征、服装、姿势或背景，从而可以精确控制生成的图像，而不会在冗长的描述上浪费宝贵的标记。

这些标签已经存在多年，并已成为艺术/动漫爱好者进行图像分类的标准。

当涉及到理解照片的特征时，该模型非常准确和高效。

参与专注于NSFW人工智能内容的服务器的Discord成员Vishnu告诉记者：“这就像有一个艺术家，他完全理解你想要什么，而不必用段落来解释。”解密“你只需要知道正确的标签。”

Illustrious的核心是使用旧的好东西SDXL架构使用复杂的双编码器系统，结合CLIP ViT-L和OpenCLIP ViT-bigG来理解单词并将其与视觉等价物相关联。

该模型能够以令人印象深刻的1536×1536分辨率处理和生成图像，能够扩展到2048×2048甚至3744x3744，而不会造成明显的质量损失。

就上下文而言，最初的SDXL处理全高清分辨率（1024x1024）。

深潜

创造卓越的旅程是有条不紊、深思熟虑的。最初的训练阶段产生了0.1版本，以1024×1024的分辨率处理了7.5M张图像，每批处理192张图像。

该团队仔细平衡了学习率，运行了20个epoch（人工智能研究其100%数据集的过程），以建立坚实的基础。一旦结果足够令人满意，团队就开始增加数据集的大小和用于下一次迭代的分辨率。

在高级训练阶段，卓越真正开始闪耀。1.0版本将数据集扩展到1000万张图像，并将分辨率提升到1536×1536。

尽管他们将批处理大小减少到128，但他们引入了复杂的标签操作策略和寄存器令牌，这些根本性的变化定义了模型的卓越性能。

2.0版本的最后改进阶段更进一步。该团队以相同的高分辨率处理2000万张图像，但批量大小更大，为512张，他们采用了一种多字幕方法，大大提高了文本与图像的对应性。

结果是最好的外富众所周知的发电机，具有良好的微调能力、快速的附着力、美观的外观和高质量的输出。

对于更精通技术的人来说，卓越的开发人员还引入了很多有趣的技术就像“无退出令牌”方法一样，确保在训练过程中永远不会排除特定的令牌；准注册令牌的实现，使模型能够处理未知或奇怪的概念；余弦退火调度器，用于学习率；多级衰减系统和输入扰动噪声增强，将一个简单的人工智能模型变成一个强大的引擎。

如何使用Illustrious

Illustrious不需要任何额外的步骤来运行。

安装过程与任何其他SDXL型号相同。下载检查点并将其放入相应的文件夹中，具体取决于您使用的UI。

Windows和Linux

对于ComfyUI，路由是modelscheckpoints。
对于A1111/Forge，路线是/模型/稳定扩散。
对于Foocus来说，路由也是modelscheckpoint。

MacOS

Mac用户也有类似的路线。然而，一些流行的面向macOS的UI需要额外的步骤。

Draw Things用户必须点击“模型”，转到“自定义”，然后点击“导入模型”
从那里，他们可以输入URL直接下载Illustrious，或者如果他们下载了模型并将其保存在本地驱动器上，则可以单击“导入自定义模型”选择文件。
Diffusion Bee的用户必须点击右上角的汉堡包图标，然后点击“设置”，再点击“添加新模型”，并选择他们本地下载的杰出检查点。

加载模型后，有三件事需要考虑。

不要使用自然语言。记住要依赖Danbooru标签，并坚持旧的SDXL提示风格，以获得更好的结果。
不要使用Pony LoRas。由于模型使用了不同的方法，因此最好使用Illustrious Loras来获得最佳结果。
尽量不要使用最初的Illustrious模型，而是选择一些最受欢迎的曲调。最初的Illustrious模型是一个基础模型，非常适合专注于你想要实现的结果的微调。它与SDXL、Pony或Flux相同。微调往往会产生更好的结果。

可供选择的最佳杰出模特

有许多型号可供选择，都专注于不同的风格、美学和特点。

甚至还有像Noob AI这样的通用模型，它以Illustrious为基础，被精细调音师用来构建模型。

然而，以下是我们针对不同需求的热门图片。这些在快速理解、输出质量和易用性方面表现出色。所有样本均来自Civit AI社区，无版权。

最具变通能力：Mistoon_Anime

链接：Mistoon_Anime-v1.0卓越|卓越检查站|奇维塔

2.5d最佳：平滑混合-卓越-警告！非常面向NSFW

链接：平滑混合-卓越|小马-卓越|卓越检查站|奇维塔

最适合艺术和插图：NTR Mix

链接：NTR MIX |卓越的XL | Noob XL-XIII |卓越的检查站|奇维塔

最适合现实主义：THRILLustious

链接：THRILLustious-v5.0 THRILLed |卓越的检查站|奇维塔

编辑人塞巴斯蒂安·辛克莱以及奎特纳

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系本站删除。

lllusterious：想要统治动漫艺术生成的人工智能模型

深潜

如何使用Illustrious

可供选择的最佳杰出模特

热门

最新文章

TAGS标签

lllusterious：想要统治动漫艺术生成的人工智能模型

深潜

如何使用Illustrious

可供选择的最佳杰出模特

相关推荐

SEC今天会批准Canary基金的Litecoin ETF还是再次延迟？

Meerkat Miniapp在电报上推出，将Game-Fi和Daily Crypto Rewards带入Meme Ecosystem

埃隆·马斯克（Elon Musk）说，人工智能可以替换美国联邦政府工人

NPR和PBS老板发誓要挑战特朗普政府联邦政府削减资金

热门

最新文章

TAGS标签