AAU Student Projects is unavailable between June 15th 1.30pm and 17th 1.30pm due to planned system maintenance. The projects cannot be downloaded during this period.
AAU Student Projects - visit Aalborg University's student projects portal
An executive master's programme thesis from Aalborg University
Book cover


Lost in the Latent Space: Generative Collapse of Neural Architectures in Homophonic Cryptanalysis

Authors

; ;

Term

4. term

Education

Publication year

2026

Submitted on

Pages

18

Abstract

Homophonic substitution ciphers let each letter be replaced by several possible symbols. This flattens letter frequencies and defeats classic frequency analysis. At the same time, the number of possible keys grows explosively with text length, making heuristic and statistical searches impractical. This thesis tests whether modern neural networks can automatically decipher such ciphers. We evaluate two designs with different internal routing: the linear-time Mamba State Space Model (SSM) and the hybrid Jamba architecture. Both are compared to a strong baseline, a dense causal Transformer (LLaMA) optimized with FlashAttention to reduce memory use. For a fair comparison, all models use roughly the same size (~36M parameters). We also run zero- and few-shot experiments on state-of-the-art large language models to assess whether general-purpose, pre-trained systems can handle symbolic cryptanalysis. To support this evaluation, we introduce a comprehensive benchmark: a synthetic dataset of 1.9 million ciphertexts, systematically scaled from 350 to 10,000 characters and spanning different redundancy levels. Performance is measured with Symbol Error Rate (SER), and we propose a new metric, Strict Mapping Error Rate (SMER), which assesses both generative accuracy and true recovery of the cryptographic key. The results are unambiguous: every autoregressive approach tested—models that generate one symbol at a time—failed consistently and severely. Deprived of natural-language semantics, both API-accessible frontier models and local architectures exhibited generative collapse. We show that neither exact dense attention nor selective state-space compression can internalize the rigid, deterministic mappings required for decipherment at this parameter scale. Beyond exposing limits of probabilistic sequence models on strict symbolic reasoning, the thesis contributes a new cryptanalytic benchmark and evaluation framework for future architectures.

Homofone substitutionschifre er koder, hvor hvert bogstav kan erstattes af flere mulige symboler. Det udjævner bogstavfrekvenser og gør klassisk frekvensanalyse ineffektiv. Samtidig vokser antallet af mulige nøgler eksplosivt med tekstlængden, så heuristiske og statistiske søgemetoder hurtigt bliver urealistiske. Denne afhandling undersøger, om moderne neurale netværk kan dekryptere sådanne chifre automatisk. Vi evaluerer to arkitekturer med forskellige interne rute-mekanismer: Mamba tilstandsrumsmodel (SSM) med lineær tidskompleksitet og den hybride Jamba-arkitektur. Begge sammenlignes med en stærk baseline, en tæt kausal Transformer (LLaMA) optimeret med FlashAttention for at reducere hukommelsesforbrug. For en retfærdig sammenligning holdes modelstørrelsen omtrent konstant (~36 mio. parametre). Derudover udfører vi zero- og few-shot forsøg med de nyeste, fortrænede store sprogmodeller for at vurdere, om general-purpose arkitekturer kan håndtere symbolsk kryptanalyse. Til at støtte evalueringen introducerer vi et omfattende benchmark: et syntetisk datasæt med 1,9 mio. chifre, systematisk skaleret fra 350 til 10.000 tegn og med varierende redundansniveauer. Vi måler ydeevne med Symbol Error Rate (SER) og introducerer en ny metrik, Strict Mapping Error Rate (SMER), som vurderer både generativ nøjagtighed og korrekt gendannelse af den kryptografiske nøgle. Resultaterne er klare: alle testede autoregressive tilgange – modeller der genererer ét symbol ad gangen – fejlede ensartet og alvorligt. Uden naturlige sproglige semantik viste både API-tilgængelige frontmodeller og lokale arkitekturer generativt kollaps. Vi viser, at hverken præcis, tæt opmærksomhed eller selektiv tilstandsrums-kompression i sig selv kan internalisere de stive, deterministiske afbildninger, som kræves for dekryptering ved denne parameterstørrelse. Ud over at fremhæve kritiske begrænsninger ved at anvende probabilistiske sekvensmodeller til strengt symbolsk ræsonnement, bidrager afhandlingen med et nyt kryptanalytisk benchmark og en evalueringsramme til fremtidige arkitekturer.

[This apstract has been rewritten with the help of AI based on the project's original abstract]