通过GPT-4和DELL-3的结合,使用ChatGPT模拟庞贝古城火山爆发时的历史情景,并展示了多模态人工智能的强大功能。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
更多跨行业的知名创作者站出来反对未经创作者同意而训练的AI生成模型。
获得原始大脑数据后,研究人员就可以用大语言模型等对其进行解码,提取重要的视觉、文本信息。所以,获取大脑活动数据是翻译、重构人类想法、思维画面的关键基础。
科学家们,在用AI做出尝试