最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单-kb88凯时官网登录

时间:2023-07-27
阅读:
免费资源网 - https://freexyz.cn/

stable diffusion最强版本,来了!

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

刚刚,sdxl 1.0正式发布,可免费在线试玩。

效果上,无论是以假乱真的写实大片:

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

超现实的熊猫喝啤酒:

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

还是赛博朋克漫画,都非常nice~

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

stability ai表示,sdxl 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强,可生成100万像素的图像(1024 x 1024)。

而且还支持在网页上直接对生成图像进行后期编辑。

(有一股和midjourney、firefly打擂台的味儿了)

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

网友们已经按捺不住上手试玩了~

和基础stable diffusion相比,sdxl 1.0生成结果更加准确和逼真。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

而且官方表示,提示词也能比之前更简单了。

这是因为sdxl 1.0的基础模型参数量达到了35亿,理解能力更强。

对比基础版stable diffusion,参数量只有10亿左右。

由此,sdxl 1.0也成为当前最大规模的开放图像模型之一。官方甚至直接说这就是世界上最好的开放图像模型。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

话不多说,我们来上手体验了~

把马斯克印在青花瓷上

sdxl 1.0在操作上很便捷,直接输入prompt即可,还能从下面勾选风格、尺寸参数等。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

一次生成默认是出4张图,如果不满意还可以点下方“加号”让它继续画。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

官方介绍说,现在让sdxl 1.0生成大作,无需再加入“杰作”这种提示词了。

让它生成一幅日漫风格的图像,画风非常贴合,而且在光影的处理上也更加自然了。

1990s anime low resolution screengrab couple walking away in street at night

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

或者是一幅风景照?也能以假乱真了。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

甚至是让马斯克站在中式庭院里,抬头斜望着天空……

elon musk in an ancient chinese palace

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

或者是把苹果收购了?

在「wwdc」上,他举着全新款iphone向人们展示,身边还围满了记者和粉丝(doge)。

elon musk releasing new iphone at wwdc

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

除了这些老马的洋葱新闻之外,绘画风格的作品效果也不错。

左边的是齐白石水墨风格,而右边是一幅漫画。

左:elon musk delivering a speech, ink painting, qi baishi style右:elon musk comic

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

除了绘画,也可以把老马放进我们的元青花。

elon musk in the shape of yuan dynasty blue and white porcelain

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

上面展示的这些「老马的故事」,用的prompt都比较简单。

但从效果并没有因为提示词简单而拉胯,这也与官方的说法相印证。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

不过我们还是想看看,如果用更加复杂精致的prompt,会是什么样子?

我们找到了midjourney创作的一张老马在苏联担任汽修工人的珍贵照片,重新喂给mj,让它生成个prompt。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

mj生成了下面这样的prompt,我们就用它来测试sdxl:

elon musk(这里mj生成的是a man) standing in a workroom, in the style of industrial hinery aesthetics, deutscher werkbund, uniformly staged images, soviet, light indigo and dark bronze, new american color photography, detailed facial features

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

风格完全符合我们的预期,细节也还不错。

再来一个复杂prompt的图作为收尾,同样是mj根据此前的作品生成后喂给sdxl。

elon musk eating food with chopsticks, in the style of peter coulson, cross-processing/processed, pinhole photography, herb trimpe, james tissot, transavanguardia, spot metering

左边是sdxl的作品,右边是mj的原版,大家可以对比一下。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

提示词同样支持中文,不过似乎会在给出结果中倾向于国风,准确性可能也会受到影响。

比如输入“一只老虎在海边”后,意外给出了一个国风妹子。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

效果大家都已经看到了,那么sdxl生成图片的速度如何呢?

对于免费用户来说,时间主要花费在排队上了,不过也不会等待太久。

在5.5秒的时间内,排队人数从160减少到了99。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

除了生成图像外,sdxl还提供了很多后期编辑功能。

具体来说,包括去除背景、细节处理、画幅扩增等等。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

这些功能是sdxl所在的clipdrop平台上已有的,而sdxl可以一键将生成的图片传入对应模块。

这里我们选择背景消除功能展示一下,可以看出边缘的细节几乎没有什么破绽。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

目前,sdxl的免费使用额度还是比较高的,登录后每个账户每天可生成400张(需要排队)。

月付的价格是9美元每月,年付则相当于7美元(约50元人民币)每月,包含了1500张每天的sdxl额度,且无需排队。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

不过不同区域的价格似乎也有所区别,比如阿根廷的年付价格平摊到每月是742比索(约合19.4元人民币或2.7美元)。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

此外,由于付费版本实际上是clipdrop平台的pro订阅,所以也包含了该平台的其他功能。

除了pro账户,还有api版本可供开发者使用(可以访问stability ai、amazon等平台)。

开放图像模型中的“最大杯”

在最新博客中,stability ai介绍了sdxl 1.0的更多技术细节。

首先,模型在规模和架构上都有了新突破。

它创新性地使用了一个基础模型(base model) 一个细化模型(refiner model)。

二者的参数规模分别为35亿和66亿。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

这也使得sdxl 1.0成为目前规模最大的开放图像模型之一。

stability ai创始人莫斯塔克(emad mostaque)表示,更大规模的参数量能让模型理解更多概念,教会它更深层次的东西。

同时在sdxl 0.9版本还进行了rlhf强化。

这也是为什么现在sdxl 1.0支持短提示词,而且能分清红场(the red square)和一个红色的广场(a red square)。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

在具体合成过程中,第一步,基础模型产生有噪声的latent,然后由细化模型进行去噪。

其中基础模型也可以作为独立模块使用。

这两种模型结合能生成质量更好的图像,且不需要消耗更多计算资源。

官方介绍sdxl 1.0可以运行在8gb vram的消费级gpu上,或者是云端。

除此之外,sdxl 1.0在微调也有了提升,可以生成自定义loras或者checkpoints。

stability ai团队现在也正在构建新一代可用于特定任务的结构、风格和组合控件,其中t2i/controlnet专门用于sdxl。

不过目前这些功能还处于beta测试阶段,后续可以关注官方更新。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

总结来说,文生图都是一个逐渐迭代的过程,sdxl 1.0的目标就是让这个过程更加简单。

莫斯塔克表示,现在只需要5-10张图片,就能快速微调模型。

从用户反馈中也能看到,相较于stable diffusion,sdxl 1.0更能让大家满意。

最强文生图开放模型!超大杯stable diffusion免费来袭:提示词也更简单

实际上,从今年4月以来,stability ai就发布了sdxl最早的测试版。

6月份开始进行内测,前段时间发布了0.9版本,当时就预告了会在7月发布一个开放版本,即最新的1.0版本。目前相关代码权重已经发布在github上。

而且stability ai机器学习负责人表示,相较于sdxl 0.9,1.0版本降低了对算力的需求。

感兴趣的童鞋快去试玩吧~

试玩入口:https://clipdrop.co/stable-diffusion

github:https://github.com/stability-ai/generative-models

参考链接:

[1]https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

[2]https://venturebeat.com/ai/stability-ai-levels-up-image-generation-launch-new-stable-diffusion-base-model/

[3]https://techcrunch.com/2023/07/26/stability-ai-releases-its-latest-image-generating-model-stable-diffusion-xl-1-0/

免费资源网 - https://freexyz.cn/
返回顶部
顶部
网站地图