GER-342 · Alignment-Induced Asymmetric Bias

Structural Moves

Definition

Post-training alignment (RLHF, fine-tuning for inclusivity) installed to mitigate bias instead creates extreme, unintended disparities or “rebound” effects. The model overshoots in the opposite direction of the original imbalance.

Distinct from

GER-323 — Alignment over-correction creates new bias → this code. Original bias persists due to no pre-deployment audit → GER-323.

Documented case

Google paused Gemini image generation after diversity-alignment overcorrected into historically inaccurate images (Feb 2024)

news

Tags

discrimination · generative-media

Contributors

Raluca Alexandra Fulgu, University of Milan-Bicocca; Valerio Capraro, University of Milan-Bicocca

Cite

SVRNOS. (2026). GER-342: Alignment-Induced Asymmetric Bias. Governance Error Register. https://docs.svrnos.com/ger/codes/342

GER-341 · Multi-Agent Sandbagging / Coordinated Alignment-Faking

GER-343 · Implicit-Explicit Moral Discontinuity

Overview

0xx · Pre-Infrastructure

1xx · Compute Substrate

2xx · Success States

3xx · Structural Moves

4xx · Operator & Platform Errors

5xx · Infrastructure Failures

Dimension Markers

GER-342 · Alignment-Induced Asymmetric Bias

Definition

Distinct from

Documented case

Google paused Gemini image generation after diversity-alignment overcorrected into historically inaccurate images (Feb 2024)

Tags

Contributors

Cite

​Definition

​Distinct from

​Documented case

Google paused Gemini image generation after diversity-alignment overcorrected into historically inaccurate images (Feb 2024)

​Tags

​Contributors

​Cite

Definition

Distinct from

Documented case

Tags

Contributors

Cite