RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling

Abstract

Score Distillation Sampling (SDS) has emerged as an effective technique forleveraging 2D diffusion priors for tasks such as text-to-3D generation. Whilepowerful, SDS struggles with achieving fine-grained alignment to user intent.To overcome this, we introduce RewardSDS, a novel approach that weights noisesamples based on alignment scores from a reward model, producing a weighted SDSloss. This loss prioritizes gradients from noise samples that yield alignedhigh-reward output. Our approach is broadly applicable and can extend SDS-basedmethods. In particular, we demonstrate its applicability to Variational ScoreDistillation (VSD) by introducing RewardVSD. We evaluate RewardSDS andRewardVSD on text-to-image, 2D editing, and text-to-3D generation tasks,showing significant improvements over SDS and VSD on a diverse set of metricsmeasuring generation quality and alignment to desired reward models, enablingstate-of-the-art performance. Project page is available at https://itaychachy.github.io/reward-sds/.

Quick Read (beta)

loading the full paper ...