首页 产业新闻 AI生视频:智谱“清影” VS 生数科技“Vidu”,谁胜出?

AI生视频:智谱“清影” VS 生数科技“Vidu”,谁胜出?

产业新闻 72

    8月19日消息,自OpenAI放出文生视频模型Sora后,国内AI生视频的产品研发脚步也加快了。上一期,我们测试了国内短视频领域的两家头部企业快手和抖音旗下的AI生视频产品“可灵” 和“即梦AI”的效果(详细情况可点击链接)

    这一期,我们将测试国内两家AI创业企业推出的AI生视频产品,一个是智谱AI在7月26日推出的“清影”,另一个是生数科技在7月底推出的“Vidu”。

    目前,智谱“清影”支持文生视频、图生视频,能生成6s时长的视频。免费使用,但是需要排队,如果想要加速,可以付费5元/天或199元/年。

    Vidu同样支持文生视频、图生视频,提供4s和8s两种视频时长选择。目前,用户可以免费生成4秒视频,如果要生成8s视频,则需要付费,9.99美元/月或者95.99美元/月。

    测试条件:

    因此,这一期,我们选择了免费的默认设置下,清影(6s)和Vidu(4s)图生视频和文生视频生成的效果进行比较。

    一、图生视频

    从动物、风景、人物图片来测试比较。

    第一个

    使用一张含有“熊猫”的照片。

    输入提示词要求:熊猫头抬起来,看向我,露出笑容

    看看清影(6s)和Vidu(4s)的生成结果表现。

    点击图片跳转视频

    视频结果比较:

    清影表现不错,熊猫抬头、挥手、微笑动作连贯。不过,熊猫在挥手的时候,手部有较明显失真。不过,有一个惊喜的地方是:原图片中左下角有一个自拍杆连接的手机在对熊猫进行拍摄。在生成视频的时候,清影似乎是试图让手机拍摄的熊猫画面也动起来。

    Vidu这个视频就很尴尬了,除了首帧是原图外,之后视频出现的熊猫太突兀了,而且和原熊猫没有关系。

    这一局PK,站清影(+1分)。

    第二个

    用一张含有上海东方明珠塔的风景图。

    输入提示词要求:东方明珠塔从下往上依次亮起彩灯

    看看清影(6s)和Vidu(4s)的生成结果表现。

    点击图片跳转视频

    视频结果比较:

    清影生成的视频没有显示完整的图片内容,聚焦在局部,这一点受到图生视频最初对竖版图片选择的影响。不过,这也带来东方明珠塔局部更清晰的视频效果,从下往上、依次亮、彩灯这几个元素都有很好展现。清影聚焦局部细节,且背景一致性更稳定,感觉就像东方明珠塔在眼前一点一点亮灯了,真实感更好。

    Vidu完整展示了东方明珠塔及亮灯,不过忽略了“从下往上依次”亮灯的需求,背景中云朵变幻非常快速,感觉像是视频被加了倍速。

    这局PK站清影(+2分)。

    第三个

    用一张含有人物的图。

    输入提示词要求:孩子翻动手中的书,并露出微笑

    看看清影(6s)和Vidu(4s)的生成结果表现。

    点击图片跳转视频

    视频结果比较:

    清影生成视频中,书、人物手、挥动胳膊都有明显失真。

    Vidu生成视频中,小孩举起书翻动、仰头等动作,整体更连贯自然。

    这局PK站Vidu(+1分)。

    二、文生视频

    第一个: 采用Sora经典视频的提示词,让清影和Vidu各自生成视频。

    输入提示词:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

    看看清影(6s)和Vidu(4s)的生成结果表现。

    点击图片跳转视频

    视频结果比较:

    清影生成的视频,前2s人物走动姿态还略显生硬,后续更自然。背景街道景物、远方及周围人的高度与主人公相比更为协调。

    Vidu这个视频中,主人公特别突兀,其身高与周边路过和远方的人相比明显高出,显得格格不入。另外,背景街道景色过于模糊。

    这局PK站清影(+3分)

    第二个:

    输入提示词文本:在桂林山水间,一位侠女乘坐竹筏前行,她穿着红色的长裙,手拿黑色的佩剑,注视着远方,阳光洒在水面,波光粼粼,有白云从山顶飘过。

    看看清影(6s)和Vidu(4s)的生成结果表现。

    点击图片跳转视频

    视频结果比较:

    清影对桂林山水、竹筏、红色长裙、阳光洒在水面,波光粼粼等都有不错的呈现。问题还是出在手拿黑色的佩剑上,有明显失真。

    Vidu对竹筏理解有误,侠女乘坐的更像是小船,而且视频画面整体较为模糊。

    这局PK,从清晰度上还是站清影(+4分)。

    最后,总结一下:

    这5局,Vidu生成的4s 视频大小在200K左右,清影生成的6s视频大小均超过2M。虽然Vidu号称生成的视频“分辨率最高达1080P”,但是就目前生成的视频来看,在清晰度上清影明显要更优。

    从上面5五局PK来看,清影4局胜出Vidu。

    大家觉得哪个更好呢?