硅谷竞速:Meta版Sora震撼发布,OpenAI以AGI交互系统迎战
硅谷竞速:Meta版Sora震撼发布,OpenAI以AGI交互系统迎战
北京时间10月4日,硅谷两大巨头Meta和OpenAI在AI领域再次展开激烈竞争,各自推出了令人瞩目的新产品,为AI行业的发展注入了新的活力。
Meta在此次竞赛中亮出了其全新的AI模型——Movie Gen。这款模型由视频生成(Movie Gen Video)和音频生成(Movie Gen Audio)两个部分组成,能够无缝生产出完整的多媒体内容,实现从图像、视觉到听觉的全方位覆盖。Meta表示,Movie Gen是“迄今最先进的媒体基础模型”。具体来看,Movie Gen Video是一个30B参数的Transformer模型,可以从单个文本提示生成16秒、每秒16帧的高清视频。同时发布的Movie Gen Audio则能够生成与视频同步的高保真音频,最长可达45秒。Meta的CEO马克·扎克伯格在社交平台为Movie Gen站台,展示了其将静态照片转化为动态健身视频的能力,场景幽默且充满科幻感。
除了视频和音频生成,Movie Gen还具备强大的视频编辑功能,可以执行添加、删除或替换元素,背景替换、样式更改等全局修改。这一功能使得Movie Gen成为一体化的AI媒体工具,极大地提升了视频制作的效率和效果。Meta透露,该模型在1亿个视频和10亿张图像上进行了预训练,而音频生成模型则使用了约100万小时的音频数据。此外,Meta还开源了多个基准测试数据集,为后续研究者提供了权威的评测工具。
与此同时,OpenAI也推出了其最新的产品——交互界面canvas。这是一种使用ChatGPT写作和编程的新方式,也是ChatGPT发布以来的重大视觉界面升级。用户可以与ChatGPT一起协作完成写作和编码项目,整个过程可考、可视,不再局限于简单的聊天。Canvas是一个内置于ChatGPT的文档和代码编辑器,用户可以在一个界面内完成从构思到成文的全过程,实现与AI的无缝协作,从而大大提升工作效率。OpenAI的CEO萨姆·奥特曼表示,这暗示着ChatGPT不仅仅是一个聊天机器人,而是要打造AI时代的操作系统。
OpenAI在此次竞赛中不仅展示了其强大的AI交互能力,还宣布完成了新一轮66亿美元的融资,投后估值达到1570亿美元(约合人民币1.1万亿元)。本轮融资由风投巨头Thrive Capital领投,微软、软银集团、英伟达等巨头纷纷跟投。这标志着OpenAI从“明星独角兽”公司过渡到了不折不扣的人工智能巨头。
在AI行业的这场竞速中,Meta和OpenAI的激烈竞争无疑推动了技术的快速发展。随着两大巨头不断推出新产品和新技术,AI行业的创新活力得到了极大的激发。可以预见的是,在未来一段时间里,科技巨头们将继续推陈出新,既包括有革命性意义的新产品、新技术,也有不断掀起小高潮的持续性上新。
对于AI行业的未来发展,业内人士持积极态度。他们认为,随着技术的不断进步和应用场景的不断拓展,AI将在各个领域发挥越来越重要的作用。无论是传统产业的智能化升级,还是新兴业态的创新发展,都离不开AI的支撑。同时,随着国际合作的不断深化,中国AI企业有望在全球市场中发挥更加重要的作用。
总的来说,硅谷的这场AI竞速不仅展示了巨头们的强大实力,也为AI行业的未来发展注入了新的动力。我们有理由相信,在不久的将来,AI将改变我们的生活方式,推动全球经济结构的变革,为人类社会的发展带来更加美好的未来。
(图片来源网络)