也可以说浅尝辄止了,真是玩不明白,也很难静下心来去玩明白。
这也许就是上一代(或上上一代)人看我们各种玩转智能手机,而他们自己却不得要领时,那种感觉吧。
好像几年前我还在使用RX580时,就体验过AI绘画的Stable Diffusion,那时候就已经感觉到AI的魅力。这次是在YouTube上偶然刷到爆火的“无审查”AI 视频模型来了!Sulphur 2 本地部署实测:8G 显存也能跑!完全免费开源 | 零度解说,竟然可以随心所欲生成色色的内容,那我的RTX5070真是跃跃欲试了。
教程懒得写,视频里写的也差不多了,结果也懒得写,反正就是效果很好,但也没有特别好。如果想要生成看得过去的视频,就要花大心思,投入很多时间去搞,30岁的我可不像16岁那样有耐心了。
浪费了一下午和一晚上,踩了不少坑,记录一下吧。
Sulphur-2项目地址:https://huggingface.co/SulphurAI/Sulphur-2-base
请务必要看项目介绍,要不然会踩不少坑:
Sulphur 2 An uncensored video generation model based on LTX 2.3 supporting both t2v and i2v natively, as well as all of the other ltx 2.3 formats. Join our Discord Support the next version of the project, even just a few dollars would go a long way: Kofi Get Started: To get started with the model, I recommend downloading either of the dev versions, (fp8mixed or bf16) and downloading the distill lora provided. By the way, I'm aware the workflows contain sulphur_final right now, just use the lora or use the full models, don't use both at the same time. This model contains a prompt enhancer. The easiest way to get started with the prompt enhancer is by using it on lmstudio. The way to accomplish this is by going to your model folder inside lmstudio, then opening it up in your file explorer. Create a folder named "Sulphur", then a folder inside that called "promptenhancer". Inside that folder, place the gguf file and the mmproj file. Once you've done that, you should be able to load the prompt enhancer in lmstudio. There is no system prompt for it, just send the text (and an image) you'd like to be enhanced. *As a note, this readme will contain better setup instructions and how to train on top of the model soon. --- Sulphur 2 基于 LTX 2.3 的无审查视频生成模型,原生支持 t2v 和 i2v,以及所有其他 ltx 2.3 格式。 加入我们的 Discord 请支持项目的下一个版本,哪怕只是几美元也能起到很大的作用:Kofi 入门指南: 要开始使用此模型,我建议下载任一开发版本(fp8mixed 或 bf16),并下载提供的 Distill Lora 文件。另外,我知道目前的工作流程中包含 sulphur_final,请仅使用 Lora 文件或完整模型,不要同时使用两者。 此模型包含一个提示增强器。使用提示增强器最简单的方法是在 LMStudio 中使用它。具体操作方法是:在 LMStudio 中找到模型文件夹,然后在文件资源管理器中打开它。创建一个名为“Sulphur”的文件夹,然后在该文件夹内创建一个名为“promptenhancer”的文件夹。将 gguf 文件和 mmproj 文件放入该文件夹中。完成上述步骤后,您应该能够在 LMStudio 中加载提示增强器。它没有系统提示,只需发送您想要增强的文本(以及一张图片)即可。 *请注意,本自述文件很快将包含更完善的设置说明以及如何在此模型之上进行训练。
1、提示词增强器
零度解说中的提示词增强器部分讲的不对,提示词增强器是要在lmstudio中使用的,它是一个大语言模型,跟Chatgpt很像,你给它几个关键词,它会帮你优化一下,得到一长串的提示词,当然,如果你的逻辑和需求很清晰的话,这个提示词增强器对你来说并没有什么用,就不用花时间花流量去部署这东西了。
2、模型下载
还有,LTX2.3需要下载几个模型,文本编码器(text_encoders)gemma_3_12B_it_fp4_mixed.safetensors,loRA文件(loras)ltx-2.3-22b-distilled-lora-384.safetensors,upscaler文件ltx-2.3-spatial-upsca(latent_upscale_models)ler-x2-1.1.safetensors,好像还有个什么来着,反正这三个下载的很慢,还不如从huggingface上下载(可以用Neat Download Manager之类的多线程下载器),然后放到对应的models文件夹中。
3、工作流
你如果跟着视频走,大概率会使用那个女王和外星人的视频,真是辣眼睛。完全可以使用项目地址中两个i2v(图生视频)的工作流,导入ComfyUI即可。
多的也不说了,反正我也没用多长时间,主要是因为我家虽然是千兆网,但无限mesh组网的效果不大好,我房间的电脑只有300M网速,下这些模型真是太慢了,而且RTX5070的性能其实也不咋地,显存很少,太浪费时间了。
对了,Vultr可以一键部署ComfyUI,如果有兴趣的话使用Vultr吧,英伟达GH200、96GB显存、72核3.1GhzCPU、480GB内存、960GB存储的裸机2美元一小时。
我的推荐地址:https://www.vultr.com/?ref=9718341-9J,你得300,我得35,可以用很久了,当然你如果不想让我得到这么多,可以把ref去了,也无所谓的。
我的vultr设置了限额,没办法开机器,现在提了工单,等限额解除了,再搞个机器试试。




Comments | NOTHING