“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
6. AI Agent变得更好。Agent不仅会成为主流并在现实世界中找到用例,而且还会开始表现出类似人类的行为。我们将在植物学、市场营销、游戏理论等领域使用Agent来帮助我们预测人类行为。
2. 📉 泄露引发社交媒体批评,涉及超过16,000名艺术家,引发版权诉讼。
1️⃣ GitHub Copilot 🚁
Paint3D 利用两阶段纹理生成框架,首先通过预训练2D图像生成模型获取输入的引导信息,然后在UV纹理空间上训练无光照扩散模型,生成无光照纹理,提升3D模型纹理生成效果。