Confundir el datapoint (e.g. una imagen) con la distribución de datos (e.g. toda la distribución de posibles imágenes cuquis que podrían existir) es lo que podría llevar al engaño de que estas IAs copian los datos de entrenamiento. O dicho de otro modo: que plagian.
Data Points vs Distributions: Understanding AI Training Plagiarism
By
–