发布日期:2024-08-18 17:52 点击次数:149
本文旨在长远分析国内各大AI产物在“图片生成 & 图片解决”界限的功能对比,匡助用户更好地贯通各产物秉性波多野结衣作品,并作出相宜我方需求的选拔。
2022年OpenAI发布了ChatGPT3.5,标记着以AI大模子为主体的东谈主工智能期间到来。自此之后,国内各个传统大厂、AI独角兽纷繁下场,种种AI大模子过甚对应的产物纷繁如棋布星罗般问世。
在带来行业蕃昌的同期,也为粗拙用户带来了不少选拔的困惑。究竟国内各大AI产物有什么互异?咱们应该何如选拔?
要对比各大AI产物,咱们不错省略分为内、外两层,内在是其内核的大模子智能进度,外皮是各团队研发的产物功能。对于大模子,市面上已有不少叙述进行测评。但对于外皮产物功能的梳理对比,似尚未有过多关爱。
有感于此,我研究从对“文本生成”、“图片生成 & 图片解决”、“智能体”三个当下AI最为热点的界限最先,梳理现在国内各大AI产物功能的横向对比。
天然,我的主要关爱点是“有无”,而非“优劣”,即我主要着眼在某一项功能在各大AI产物上是“有”已经“莫得”,而不会具体比对该功能的具体进展“好”已经“不好”,因此也不会波及到功能的具体评分。
我的指标是通过对国内各大AI产物功能横向对比,为不同使用场景、使用诉求的东谈主群提供产物选拔上的提倡。
横向对比收集本事:2024年8月(现在设念念可能每3个月更新对比一轮,并视情况是否更新使用提倡)。如果有一又友们感好奇赞佩好奇赞佩但我莫得涵盖的AI产物,或者对于本文的任何品评提倡,接待在评述区里留言。
本篇是这个系列的第二篇——“图片生成 & 图片解决”篇
第一篇——文本生成篇见:国内各大AI产物功能横向对等到使用提倡(1/3):文本生成篇
一、【对比产物及花式】严格来说,“图片生成”和“图片解决”是两个寂然的界限。前者是通过给AI输入笔墨或图片,让AI生成新的图片(即俗称“文生图”、“图生图”);后者是对已有的图片,通过AI才智进行种种调遣解决。
但从产物视角来看,二者又有明确的研究,毕竟,AI生成图片后进行解决,爱色电影是一个很指点的操作。
而况,从用户视角来看,如果有波及“图片”的干系责任,那省略率是“图片生成”和“图片解决”都有所波及。因此,咱们会将二者放在沿途进行对比。
对于“图片生成 & 图片解决”界限的产物对比波多野结衣作品,入围轨范是:
av在线 必须是通用的图片产物,意味着只针对某个特定图片界限(如:海报、漫画、二维码、头像)的产物不在此列。 必须是有寂然的AI大模子部署,意味着市面上那些包壳类的AI产物不在此列(比如通过封装Midjourney来提供做事的产物)。 图片生成:有不错配置生成图片具体参数的才智,意味着只是是通过对话就能精真金不怕火生成图片的产物(在前边“文本生成”界限中,咱们就有“生成图片”的功能项梳理)不在此列。 图片解决:必须是不错单独上传图片进行解决,意味着只是是对生成图片进行解决的产物,只会归入“图片生成”的一部分功能(这一条骨子是针对“豆包”进行分散,它的图片解决功能即是只可对其生成的图片进行操作,说竟然的有点迷)。基于以上轨范,在“图片生成 & 图片解决”界限的入围产物有:
(注:SD即Stable Diffusion,是一套开源的AI图片生成用具,解救装置多个的生图大模子。)
对比的花式主要由以下类别构成:
免费使用条目:AI生成图片的筹算资本远高于生成文本,因此各家提供的AI生成图片做事都是“有条目免费”,咱们会将各家的具体使用条目梳理出来。 使用引导:包括功能引导、Prompt库等内容,反馈的是产物的“易上手”进度。 防备参数配置:与“文本生成”不同,“图片生成”的效力受具体的参数配置影响较大。因此,防备的参数配置才智反馈了产物的“可调遣性”。 高档功能:如ControlNet、LoRA考验等,反馈的是产物在高档功能上的丰富度和深度。 图片解决主流功能:主要包括图片放大、延迟、重复、抠图等主流的AI图片解决功能。 二、【齐备对比末端】基于上述产物和花式,齐备横向对比末端如下:
图片生成:
图片解决:
三、【末端解析】 1. 肤浅使用型:元宝、豆包、可灵AI 类型秉性:通过输入Prompt进行图片生成,但不具备“配置图片作风(并非领导词,而是指定不同生图大模子)”过甚他更高档功能。 适用东谈主群:对于“生成图片”诉求接近“有图即可”的东谈主群。 2. 类MJ型:江城洛神、通义万相、文心一格 类型秉性:具备更多的生成图片配置才智,使用风气上相通Midjourney,但不解救诸如ControlNet的高档功能。 适用东谈主群:对于“生成图片”有一定的质料要求,但愿限度其大体作风走向,但又莫得科学上网条目的东谈主群。 3. 类SD型:智影、WHEE+好意思图想象室、堆友 类型秉性:具备更多高档功能(如ControlNet、LoRA模子考验),才智及交互界面接近SD WebUI。 适用东谈主群:对“生成图片”有细巧化调遣的诉求,或专诚在“生成图片”界限进行深耕的东谈主群。 四、【合座使用提倡】对于“图片生成 & 图片解决”界限,因此其学习广度、深度和难度,都要比“文本生成”要更高。因此,我会救助推选使用法例是:先使用“文心一格”,如果有进一步念念长远参议,则再切换至“堆友”。
率先不提倡使用“肤浅使用型”的产物。倒不是说他们才智不可,主如果洽商到初学和使用,他们都并非最佳选拔。最典型的体现即是对于“作风”的配置。家喻户晓,画面“作风”是一张图片最基本的属性。
天然“肤浅使用型”的产物亦然不错通过在Prompt内部进行作风样式来罢了,关联词进阶后已经要切换到“选拔生图模子”。因此从一运转上手就应该斥地“选拔生图模子”来限度作风的证明。此外,从易用性来看,也不足不错径直选拔作风的产物。
然后即是“类MJ型”的产物,它们在最基础的“文生图”界限都较易上手,既能空闲普通需要,又能低门槛上手。而具体到哪一款产物,则首推“文心一格”,原因无他,即是因为它非论是图片生成已经图片解决,功能都相对皆全。
终末即是念念进一步长远参议AI生成图片,那必须会走到“学习Stable Diffusion”的阶段,此时推选产物更多则是要洽商其功能是否弥散全面。以此为轨范,那么轮廓功能最皆全且免费使用条目精真金不怕火的“堆友”就成为不二之选了。
五、【附:部分产物特色功能截图】文心一格将领导词中的部天职容结构化(画面作风、修托辞、艺术家)
通义万相围绕电市场景打造了干系的特色功能
腾讯智影围绕“视频+图片”打造了一系列功能
WHEE全面的AI生图才智
堆友友好且接近SD WebUI的操作界面
作家:产物司理崇生,公众号:崇生的黑板报
本文由 @产物司理崇生 原创发布于东谈主东谈主都是产物司理。未经作家许可,辞让转载
题图来自 unsplash波多野结衣作品,基于CC0公约