光影焕像(Lightillusions)是一家专注于空间智能技术,结合 3D 视觉、图形学和生成模型技术,致力于打造创新的 3D 基础模型公司。公司由谭平教授领导,谭教授曾担任阿里巴巴达摩院实验室负责人,目前是香港科技大学的教授,同时担任冯诺伊曼人工智能研究室副院长,并是香港科技大学与比亚迪联合实验室的主任。
区别于二维模型,三维模型单个模型的大小可达几 GB,尤其是点云数据等复杂模型。当数据量达到 PB 级别时,管理与存储成为巨大的挑战。经过尝试 NFS、GlusterFS 等方案后,我们最终选择了 JuiceFS,成功搭建了一个统一的存储平台,为多个场景服务,并支持跨平台访问,包括 Windows 和 Linux 系统。该平台目前已管理上亿文件,数据处理速度提升了 200%~250%,还实现了高效的存储扩容,同时运维管理得到了极大简化,使得团队能够更专注于核心任务的推进。
01 3D-AIGC 存储需求
我们的研究主要集中在感知和生成两个方向。在三维领域,任务的复杂性与图像和文本处理有本质区别,这对我们的 AI 模型、算法以及基础设施建设都提出了更高的要求。
我们通过一个 3D 数据处理流程,来展示三维数据处理的复杂性。下图左侧是一个三维模型,包含纹理(左上角的折射纹理)和几何信息(右下角的几何结构)。首先,我们生成渲染图像。每个模型还附带文本标签,描述其内容、几何特征和纹理特征,这些标签与每个模型紧密相关。此外,我们还处理几何数据,如采样点以及从数据预处理过程中得到的必要数值(如 3DS、SDF 等)。需要注意的是,三维模型的文件格式非常多样,图片格式也各不相同。