腾讯混元发布视频生成大模型,并宣布开源
12月3日,腾讯混元大模型公布最新进展:正式上线视频生成能力。“用户只需要输入一段描述,即可生成视频,”腾讯混元相关负责人透露,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。
腾讯混元生成视频大模型可以实现超写实画质、生成高度符合提示词的视频画面,画面流畅不易变形。比如,在冲浪、跳舞等大幅度运动画面的生成中,腾讯混元可以生成非常流畅、合理的运动镜头,物体不易出现变形;光影反射基本符合物理规律,在镜面或者照镜子场景中,可以做到镜面内外动作一致。同时,模型还可以实现在画面主角保持不变的情况下自动切镜头
混元的领先能力主要源于其技术创新。其基于跟Sora类似的DiT架构,并在架构设计上进行多多处升级。
腾讯混元视频生成模型画面具备高质感,可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。
目前,腾讯宣布开源该视频生成大模型已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力,加速行业创新步伐。
从年初以来,腾讯混元系列模型的开源速度不断加快。此前,腾讯混元已经开源了旗下文生文、文生图和3D生成大模型。至此,腾讯混元系列大模型已实现全面开源。
腾讯 新浪科技公众号“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
相关新闻拓展阅读
热门文章
- 绿色账单|攀枝花中心医院以智能化改造推动绿色节能发展
2024-10-18 03:57 - 京东京造Z5 Soft人体工学电脑椅 坐感升级只要355元
2024-10-18 03:45 - 中国智能网联汽车重塑全球行业格局 更需筑牢本土根基
2024-10-19 03:50 - 库克秀刀法!苹果新款iPad mini搭载残血版A17 Pro:GPU核心被砍
2024-10-16 03:38 - iQOO 13联合BOE定制2K Q10珠峰屏, 将成“2024屏幕新巅峰”
2024-10-17 03:50 - 李书福:吉利星座在轨卫星达到 30 颗,可实现 24 小时全球 90% 区域覆盖
2024-10-18 03:43
推荐阅读