当前位置:首页 > 热水器 > 文章正文

国内各大年夜AI产品功能横向比拟及运用建议(2/3):图片生成 \u0026 图片处理篇

编辑:[db:作者] 时间:2024-08-25 02:43:31

2022年OpenAI发布了ChatGPT3.5,标志着以AI大模型为主体的人工智能时期到来。
自此之后,海内各个传统大厂、AI独角兽纷纭了局,各种AI大模型及其对应的产品纷纭如雨后春笋般问世。

国内各大年夜AI产品功能横向比拟及运用建议(2/3):图片生成 \u0026 图片处理篇

在带来行业繁荣的同时,也为普通用户带来了不少选择的困惑。
究竟海内各大AI产品有什么差异?我们该当如何选择?

要比拟各大AI产品,我们可以粗略分为内、外两层,内在是其内核的大模型智能程度,外在是各团队研发的产品功能。
对付大模型,市情上已有不少报告进行测评。
但对付外在产品功能的梳理比拟,似尚未有过多关注。

有感于此,我操持从对“文本天生”、“图片天生 & 图片处理”、“智能体”三个当下AI最为热门的领域入手,梳理目前海内各大AI产品功能的横向比拟。

当然,我的紧张关注点是“有无”,而非“利害”,即我紧张着眼在某一项功能在各大AI产品上是“有”还是“没有”,而不会详细比对该功能的详细表现“好”还是“不好”,因此也不会涉及到功能的详细评分。

我的目标是通过对海内各大AI产品功能横向比拟,为不同利用场景、利用诉求的人群供应产品选择上的建议。

横向比拟采集韶光:2024年8月(目前设想可能每3个月更新比拟一轮,并视情形是否更新利用建议)。
如果有朋友们感兴趣但我没有涵盖的AI产品,或者对付本文的任何批评建议,欢迎在评论区里留言。

本篇是这个系列的第二篇——“图片天生 & 图片处理”篇

一、【比拟产品及项目】

严格来说,“图片天生”和“图片处理”是两个独立的领域。
前者是通过给AI输入笔墨或图片,让AI天生新的图片(即俗称“文生图”、“图生图”);后者是对已有的图片,通过AI能力进行各种调度处理。

但从产品视角来看,二者又有明确的联系,毕竟,AI天生图片后进行处理,是一个很流畅的操作。

并且,从用户视角来看,如果有涉及“图片”的干系事情,那大概率是“图片天生”和“图片处理”都有所涉及。
因此,我们会将二者放在一起进行比拟。

关于“图片天生 & 图片处理”领域的产品比拟,入围标准是:

必须是通用的图片产品,意味着只针对某个特定图片领域(如:海报、漫画、二维码、头像)的产品不在此列。
必须是有独立的AI大模型支配,意味着市情上那些包壳类的AI产品不在此列(比如通过封装Midjourney来供应做事的产品)。
图片天生:有可以设置天生图片详细参数的能力,意味着仅仅是通过对话就能大略天生图片的产品(在前面“文本天生”领域中,我们就有“天生图片”的功能项梳理)不在此列。
图片处理:必须是可以单独上传图片进行处理,意味着仅仅是对天生图片进行处理的产品,只会归入“图片天生”的一部分功能(这一条实际是针对“豆包”进行区分,它的图片处理功能便是只能对其天生的图片进行操作,说实在的有点迷)。

基于以上标准,在“图片天生 & 图片处理”领域的入围产品有:

(注:SD即Stable Diffusion,是一套开源的AI图片天生工具,支持安装多个的生图大模型。

比拟的项目紧张由以下种别组成:

免费利用条件:AI天生图片的打算本钱远高于天生文本,因此各家供应的AI天生图片做事都是“有条件免费”,我们会将各家的详细利用条件梳理出来。
利用勾引:包括功能勾引、Prompt库等内容,反响的是产品的“易上手”程度。
详细参数设置:与“文本天生”不同,“图片天生”的效果受详细的参数设置影响较大。
因此,详细的参数设置能力反响了产品的“可调度性”。
高等功能:如ControlNet、LoRA演习等,反响的是产品在高等功能上的丰富度和深度。
图片处理主流功能:紧张包括图片放大、扩展、叠加、抠图等主流的AI图片处理功能。

二、【完全比拟结果】

基于上述产品和项目,完全横向比拟结果如下:

图片天生:

图片处理:

三、【结果解析】1. 大略单纯利用型:元宝、豆包、可灵AI类型特点:通过输入Prompt进行图片天生,但不具备“设置图片风格(并非提示词,而是指定不同生图大模型)”及其他更高等功能。
适用人群:对付“天生图片”诉求靠近“有图即可”的人群。

2. 类MJ型:江城洛神、通义万相、文心一格类型特点:具备更多的天生图片设置能力,利用习气上类似Midjourney,但不支持诸如ControlNet的高等功能。
适用人群:对付“天生图片”有一定的质量哀求,希望掌握其大体风格走向,但又没有科学上网条件的人群。

3. 类SD型:智影、WHEE+美图设计室、堆友类型特点:具备更多高等功能(如ControlNet、LoRA模型演习),能力及交互界面靠近SD WebUI。
适用人群:对“天生图片”有风雅化调度的诉求,或故意在“天生图片”领域进行深耕的人群。

四、【整体利用建议】

对付“图片天生 & 图片处理”领域,因此其学习广度、深度和难度,都要比“文本天生”要更高。
因此,我会统一推举利用顺序是:先利用“文心一格”,如果有进一步想深入研究,则再切换至“堆友”。

首先不建议利用“大略单纯利用型”的产品。
倒不是说他们能力弗成,紧张是考虑到入门和利用,他们都并非最好选择。
最范例的表示便是关于“风格”的设置。
众所周知,画面“风格”是一张图片最基本的属性。

虽然“大略单纯利用型”的产品也是可以通过在Prompt里面进行风格描述来实现,但是进阶后还是要切换到“选择生图模型”。
因此从一开始上手就该当建立“选择生图模型”来掌握风格的认知。
此外,从易用性来看,也不及可以直接选择风格的产品。

然后便是“类MJ型”的产品,它们在最根本的“文生图”领域都较易上手,既能知足日常须要,又能低门槛上手。
而详细到哪一款产品,则首推“文心一格”,缘故原由无他,便是由于它无论是图片天生还是图片处理,功能都相对完好。

末了便是想进一步深入研究AI天生图片,那必须会走到“学习Stable Diffusion”的阶段,此时推举产品更多则是要考虑其功能是否足够全面。
以此为标准,那么综合功能最完好且免费利用条件大略的“堆友”就成为不二之选了。

五、【附:部分产品特色功能截图】

文心一格将提示词中的部分内容构造化(画面风格、润色词、艺术家)

通义万相环绕电阛阓景打造了干系的特色功能

腾讯智影环绕“视频+图片”打造了一系列功能

WHEE全面的AI生图能力

堆友友好且靠近SD WebUI的操作界面

作者:产品经理崇生,公众年夜众号:崇生的黑板报

本文由 @产品经理崇生 原创发布于大家都是产品经理。
未经作者容许,禁止转载

题图来自 unsplash,基于CC0协议

该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/rsq/85299.html

XML地图 | 自定链接

Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码

声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com