← 返回文章列表

GPT Image 2 深度实测:当中文排版和直播截图成真,你还能识别 AI 生成的图片吗?

OpenAI 发布新一代图像生成模型 GPT Image 2,中文排版、逻辑推理、UI 界面生成全面突破,AI 绘画下半场从美学输出转向逻辑伪造。

就在昨天,OpenAI 毫无预警地发布了新一代图像生成模型GPT Image 2

在过去 24 小时的疯狂测试中,我发现这款模型彻底杀死了 AI 绘画的过去。它不再只是一个只会画美图的画师,而是一个拥有推理逻辑空间感知完美中文排版能力的怪兽。

当 AI 能够精准复刻中文招牌,甚至能像素级伪造一张带货直播间截图时,我们必须重新审视那个问题:在这个视觉欺骗的时代,你觉得你还能识别 AI 生成的图片吗?

一、终结鬼画符:中文排版的里程碑

长期以来,中文渲染一直是所有 AI 模型(包括 Midjourney 和 DALL-E 3)的噩梦。但 GPT Image 2 彻底扭转了这一局面。

实测提示词: 一张赛博朋克风格的街景照片,雨后的街道倒影着霓虹灯光。正中心是一个巨大的 LED 招牌,上面用工整的中文手写体写着’科技改变世界,AI 塑造未来’。字体要有发光效果,背景要有穿梭的悬浮车,整体氛围是深蓝色和紫色的冷调。

最令人震撼的不是画质,而是文字的稳定性。每一个汉字的笔画都清晰可辨,完全符合中文书写逻辑。霓虹灯的溢色效果与文字边缘完美融合,这标志着 AI 生成海报正式进入了商用免修时代。

二、逻辑推理:它不仅在画,它在想

GPT Image 2 引入了类似 GPT-o1 的推理架构。在生成前,它会先规划画面主体的空间逻辑和物理规律。

实测提示词: 一张极简主义的摄影图。桌子上并排摆放着三个透明玻璃杯:左边的杯子里装满了红色的草莓,中间的杯子是空的,右边的杯子里插着一朵白色的栀子花。光线从左侧照射过来,在墙上留下三个杯子清晰的长投影。

请注意细节:三个杯子的内容物与描述完全一致。更恐怖的是,左侧光源投射出的长投影,其透视关系完全符合物理光学。这种对复杂方位指令的执行力,是前代模型无法企及的。

三、像素级伪造:抖音直播间截图实测

这是目前最具争议、也最火爆的测试。我们尝试让 AI 生成一张社交平台的交互界面。

实测提示词: 一张 9:16 比例的手机屏幕截图,画面是正在进行的抖音直播间。画面中心是炎帝在直播,背景是堆满电子产品的仓库。界面上方有’直播中’标识、在线人数’15.6 万’,左下角不断滚动着中文评论,如’主播真给力’、‘刚下单’。右下角有’购物车’小图标。整个界面充满了真实的 UI 元素和红心点赞动效。

这张图足以让大多数人产生恐怖谷效应。购物车、评论区排版、甚至连上方微小的状态栏图标都符合抖音的 UI 逻辑。如果没有水印,你几乎无法分辨这是一张真实截图还是 AI 生成的。

四、审美上限:抽象色块与光影艺术

除了硬核的逻辑还原,模型在艺术审美上也表现出了极高的高级感。

实测提示词: 一种极其抽象的视觉表现:由流动的几何色块组成的意识流空间。色块像丝绸一样交织,冷暖色调碰撞产生半透明的渐变。构图呈现动态平衡,风格现代且高级。

色彩科学(Color Science)的飞跃式进步。渐变处没有出现任何数码断层,色彩的通透感像极了顶级设计师的手笔,非常适合作为高规格专栏的配图。

结语:真相的黄昏?

测试完 GPT Image 2,作为一名技术从业者,我感到的不仅是兴奋,更多的是警惕。

当文字错误、手指畸形、UI 错位这些曾经的 AI 标签被一个个撕掉后,视觉上的真实已不再是判断真相的标准。GPT Image 2 宣告了 AI 绘画下半场的开始:从美学输出转向逻辑伪造。

那么,回到最初的问题:面对这种级别的生成能力,你真的觉得自己还能识别出 AI 吗?