华为发布图像生成模型PixArt-\Sigma 可直出4K图像第1张插图
  • 首页
  • 每日早报
  • 技术教程
  • 编程语言
    • 网站源码
    • 网页代码
  • 精品软件
    • 手机软件
    • 电脑软件
  • 活动资讯
首页 活动资讯 正文

华为发布图像生成模型PixArt-\Sigma 可直出4K图像

2024-03-09 09:59 活动资讯 阅读 1.25k

3月8日 消息:华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型,该模型采用了 DiT 架构,可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha,PixArt-\Sigma 在图像保真度上有了明显的提升,并改善了与文本提示的一致性。

华为发布图像生成模型PixArt-\Sigma 可直出4K图像第2张插图

PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练,它通过整合更高质量的数据,从”较弱”的基线逐步演变为”较强”的模型,这个过程被称为”弱到强训练”。PixArt-\Sigma 的进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-\Sigma 结合了更高质量的图像数据,配对更精确和详细的图像标题,同时在 DiT 框架内提出了一个新的注意力模块,可以压缩键(Key)和值(Value),显著提高效率,促进超高分辨率图像的生成。

由于这些改进,PixArt-\Sigma 以较小的模型规模(6亿参数)实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。

此外,PixArt-\Sigma 能够生成4K 图像,为创建高分辨率海报和壁纸提供了支持,有效地增强了电影和游戏等行业中高质量视觉内容的制作。

声明:本站所有文章除特别声明外,均采用CC BY-NC-SA 4.0许可协议。转载请注明来自 乐我知!
域名不备案可以吗?
« 上一篇 2024-03-09
03日09日,星期六,在这里每天60秒读懂世界!
下一篇 » 2024-03-09

搜索

最新文章

  • 孤胆枪手用mt管理器来替换货币
    2026-02-15
  • 【分享】美国纽约公共图书馆Top 100英文绘本+音频
    2026-02-15
  • 【手游推荐】忍者之手2(MOD菜单)
    2026-02-15
  • 王铲铲的致富之路
    2026-02-15
  • 【手游推荐】猛鬼大厦:一楼的锁匠v1.3.6大量资源👻
    2026-02-15

热门文章

  • TOP1
    【端游推荐】🔥仁王3v1.03中文全DLC+联机补丁🔥
    6天前 94
  • TOP2
    死馆本体(死に逝く君、館に芽吹く憎悪)
    5天前 59
  • TOP3
    【分享】教程:狼叔抖音带货课程第一期
    6天前 49
  • TOP4
    【分享】50丨AI视频教程丨王平凡·如何用AI搭建本地文件智能检
    7天前 39
  • TOP5
    【分享】课程:2026天晓综合应用能力(A类)系统理论课
    6天前 32

本站部分资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站站长删除。

Copyright © 2018-2025 乐我知 皖ICP备19017711号-2

侵权/投诉/邮箱: 8670468@qq.com

sitemap