ag百家乐怎么杀猪 腾讯、阿里、阶跃星辰入局, 视频生成模子掀翻开源潮
发布日期:2025-01-29 23:15 点击次数:173
大模子开源潮从文本模子推广到了视频生成鸿沟。2月25日ag百家乐怎么杀猪,阿里巴巴开源了万相2.1视频生成模子,3月6日,腾讯开源图生视频模子,阶跃星辰也决策在本月开源图生视频模子。
据腾讯先容,新开源的图生视频模子总参数目130亿,适用于写实视频制作、动漫变装制作生成等,开源骨子包含权重、推理代码和LoRA侦探代码。用户上传一张图片,并节略描画但愿画面怎样通顺、镜头怎样疗养,就能生成5秒短视频。用户也不错输入翰墨或音频,让图片中的东谈主物对口型讲话或唱歌。
腾讯展示的视频生成案例包括爱因斯坦吃苹果、梵高喝红酒、机械马往来、臆造东谈主物念急口令等。从演示视频看,视频中的主体通顺较为瓦解,对口型也比较简直。

2月,阿里开源的万相2.1视频生成模子则有14B(B为10亿)和1.3B两个参数规格,万相2.1的特色包括赞成无穷长1080P视频的高效编解码,以及初次结束汉文翰墨视频生成遵守。
就视频生成的锻练度和开源的作用,腾讯混元多模态生成本事细腻东谈主凯撒前年12月收受第一财经等媒体采访时暗示,视频生成开源生态不是很成自得,最大的问题是开源的视频生成底模(基座模子)与闭源差距太大。视频生成所需算力、数据滥用量和图像生成比较是数目级的差距,业内不念念把我方花大老本作念出来的模子开源出来。而在这种闭门觅句的情况下,好多东谈主没灵验到最佳的模子,真人ag百家乐混元于是在前年12月开源了文生视频模子。
此外,也有业内东谈主士告诉记者,视频生成模子的本事旅途未统共明晰,行业还在摸索。在本事打磨阶段,开源也能鼓动行业跨越。
记者寄望到,跟着近期多家大模子厂商鼓动开源,在智商较隆起的视频生成大模子中,开源模子已占有一隅之地。记者在视频生成模子评测体系VBench榜单看到,万相2.1模子现在列该榜单第一,总分86.22%,特等闭源的Sora。除此除外,排行前20的模子中还有另外6款模子标注为开源模子。腾讯前年12月推出的HunyuanVideo位列第12位,智谱旗下的CogVideoX1.5-5B位列第15位,这两款均是开源模子。而在该榜单第20名至第50名中,开源模子的数目则远超闭源模子。

图像生成模子行为图生视频模子的基础,记者还从香港大学管制学院获悉,该学院本日发布了《东谈主工智能模子图像生成智商概括评测评释》。在新图像生成骨子质地(包括图文一致性、好意思感等维度)方面ag百家乐怎么杀猪,字节即梦AI位列第一,在该榜单前20名内,包括DALL-E3、Hunyuan-DiT在内的多个模子是开源模子。