各家大厂的“画笔”都使得咋样?俺真实测完阿里跟字节的新活儿,有些话不吐不快

mysmile 5天前 行业资讯 12 0

哎,你别说,这两天一打开科技群,嚯,好家伙,还以为咱国内这帮大厂集体过年放鞭炮抢头香呢。

前脚阿里通义千问那边悄咪咪把那个Qwen-Image-2.0给端了上来,后脚字节跳动的即梦AI立马就把Seedream 5.0 Preview塞进了剪映里。俩家选在同一天发新东西,你说这不是约好了打我脸我都不信-3-6

讲真,作为一个从去年开始就拿AI当免费劳工、薅过不下二十款生图软件羊毛的老油条,我看见那满屏的“1K Token”、“4K超分”、“检索生图”这些高大上词儿,第一反应不是兴奋,是寻思:得,又俩画饼的来了。

结果熬了两宿实测完,对着满文件夹的对比图,我愣是憋出一句:介个味儿,对了。

咱今天不整那些虚头巴脑的参数,就跟你唠唠嗑,聊聊这波中国的AI作画软件到底进化到哪个犄角旮旯了,顺便把那些推广文里绝不会告诉你的翻车细节,一股脑给你抖搂出来。

先说说阿里那个Qwen-Image-2.0。这玩意儿最让我破防的不是它画得多好看,是它居然能读懂人话了!以前咱玩AI画图,就跟抽卡似的,你把Prompt写得跟长篇小说似的,指望它能画出“林冲风雪山神庙”,结果它给你整一个真·豹子头,人脸兽身搁那杵着,气不气人-2

但这回千问2.0是真把“豹子头”这仨字理解成“落难英雄的沧桑感”了。我试了个极端的,让它画唐僧师徒五宫格漫画,700多字的提示词塞进去,换以前那软件早死机了,它居然把唐僧脸上那副“徒弟们别闹了为师很焦虑”的微表情都给抠出来了-5。这种对中文典故、歇后语、名著角色的拿捏,说白了你得真在中文互联网里泡大才能懂,老外那算法再牛,他也不明白为啥“豹子头”不能长豹子脑袋。

但这中国的AI作画软件也有犯轴的时候。我让它给关羽的剧照改城楼错字,原图牌匾写着“当阳”,我想改成“陈留”。它倒是把字给写对了,可那字体的笔锋、牌匾的油漆剥落感,愣是跟原图对不上,像P图新手硬贴上去的-1。你看,这就是它短板——能复刻指令,复刻不了岁月的包浆。

再聊聊字节那个Seedream 5.0。这伙计走的是另一个极端,它主打一个“细节狂魔”。

我在香港那家ezone上看见他们测了个废土风分镜,说生存者被变异犬袭击那场戏,Seedream连人物皮肤上的汗水、轮胎扬起的沙尘颗粒都画出来了,细腻到吓人-7。我自己试的时候也发现,这模默认输出就是2K起步,放大看衣领的毛呢纹理都不糊,简直是逼死强迫症的节奏。

但是,这玩意儿慢啊!同样一张图,Nano Banana Pro十秒出图,它愣是转了快五分钟,我还以为电脑中暑了呢-7。而且字节这版预览版官方自己也认怂,在手册里写着“人物比例可能不合理、AI贴图感较重”-1。这种自己揭短的劲儿,反倒让我觉得挺踏实——总比那些吹得天花乱坠、用起来稀碎的强。

所以你看,现在这两大扛把子其实走岔道了。阿里那款像个严谨的工程师,专治PPT排版、电商详情页、复杂图表这种“班味儿”活儿,恨不得帮你把OKR进度条都画明白-1-6;字节这款更像一个懂流量的设计师,在乎氛围感,在乎光影漂不漂亮,哪怕逻辑有时候掉链子(比如把曹冲称象画得大象都快把船压沉了),但单独拎一张图出来发朋友圈,绝对有人问你滤镜哪儿买的-1-3

说到这里,我必须得插一嘴。咱聊中国的AI作画软件,不能光盯着这些大厂。你知道淘宝上那些卖18块8、号称“永久会员破甲全能版”的生图软件是啥玩意儿不?我年前手贱买了一个,心想就当丢了杯奶茶钱。结果打开一看,好嘛,根本就是Stable Diffusion 1.5的老架构套了个新皮,显存裁剪得妈都不认识,画个“赛博猫咪吃拉面”,猫爪子跟鸡爪似的岔开五根指头-9

但这玩意儿月销还能破万。为啥?因为它就扔在微信里,是个APK,不用你科学上网,不用你绑信用卡。很多四五十岁开淘宝店的老板,或者乡镇搞宣传的大姐,他们压根不知道啥叫MidJourney,他们只知道“这玩意儿能帮我省掉请美工的钱”。你看,中国的AI作画软件不全是拿来冲顶会的,更多时候,它是卷到尘埃里,去填那些连正版软件都懒得看的坑-9

这种“能用”和“好用”之间的鸿沟,才是咱们自己人最真实的痛点。

我有个哥们儿在杭州做跨境电商,他们公司以前拍一套模特图,飞欧洲找外模、租场地、后期修片,一套下来大几万。现在怎么干?直接用千问2.0给白底图换装,把衣服“穿”到素人模特身上,光影融合得严丝合缝,成本直接打骨折-6-10

还有个做漫剧的朋友,以前出一集动态漫画,原画师得画断手,现在先用AI批量出图,再抽卡选能用的,流程从11道砍到4道,成本降了九成-6-10。但他们也骂娘,为啥?因为AI画主角画得贼帅,转到第二集,主角长啥样它全忘了,画风飘得像换了人。这47%的用户都在吐槽的统一性问题,至今还是硬骨头-10

你问我到底推哪款?我跟你港(港,粤语方言口癖),这问题本身就没答案。

你要是个做行政的,明天老板让你赶一份《2026年团建规划》PPT,你连图表都懒得拉——直接上Qwen-Image-2.0,千问那边支持1K token指令,你只管把“巴厘岛、预算、时间轴”往里怼,它连折线图的数值都能给你渲染出来,比你求设计部同事还管用-1-5

但你要是个做自媒体的,今晚就要出一期“赛博年味”封面图,追求那种霓虹灯管字体、国潮炸裂的视觉冲击——那就去即梦薅Seedream的羊毛,目前还是免费体验2K出图,氛围感这块它拿捏得死死的,哪怕把曹冲画成物理学黑洞,反正粉丝也看不出来-1-4

说到底,工具这东西,不伺候干活的人,那叫玩具;伺候得了干活的人,还得伺候得顺手,那才叫生产力。

这波春节档的军备竞赛,最让我欣慰的不是国产模型在Ai Arena排行榜上把谷歌那个Nano Banana Pro挤到了身后-5,而是终于没人再拿“超越国际大厂”当遮羞布了。阿里的人出来接受采访,不说吊打谁谁谁,反而老实承认“信息图里的子图细节还会出错”,字节那边更是直接在预览版页面挂黄条,写着“本版美感可能劣化”-1-3

这种不拧巴的态度,比任何参数升级都来得珍贵。

毕竟,咱这代人用AI画画,不是为了证明机器比人强,而是为了在灵感枯竭的凌晨三点,有个不厌其烦的搭子,能陪你一遍遍试错,直到画出脑海里那个模糊的影子。

哪怕它偶尔把“陈留”写成黑体,哪怕它画的大象差点把船压沉。

那又怎样呢?来日方长呗。

扫描二维码

手机扫一扫添加微信