Midjourney公司计划在未来几个月推出“文本转视频”模型,通过在1月开始培训视频模型,强调其自然发展和在生成视频领域引入竞争动态,同时V6更新提升画质和用户体验。
4. 机器人将加速发展。Optimus将取得巨大进步,许多其他机器人公司也将发布更新。
Articul8的首席执行官将是之前在英特尔数据中心和人工智能组担任副总裁兼总经理的Arun Subramaniyan。Articul8团队的其余成员也将包括前英特尔员工,而英特尔将保留该公司的未透露的股份。
LLaVA在视觉聊天和推理问答方面表现出接近GPT-4水平的能力。在视觉聊天方面,LLaVA的表现相对于GPT-4的评分达到了85%,在推理问答方面更是达到了92.53%的超过GPT-4的新SoTA。LLaVA在回答问题时,能够全面而有逻辑地生成回答,并且可以以JSON格式输出。
这个项目的开源意味着更多的开发者和研究人员可以使用这项技术,为其添加新的功能或者进行改进。DreamTalk的开源将为语音合成技术的发展带来新的动力。