Eine ungültige URL sollte einen 404-Fehler zurückgeben, sodass Google klar ist, dass die URL nicht zu einer bestimmten Website gehört.
Bei einem 5XX-Fehler wird dieses Signal nicht gesendet.
Eigentümer von Websites sollten generell vermeiden, URLs zu verwenden, die Fehler des 5XX-Servers auslösen, unabhängig davon, woher sie stammen.
Es bedeutet also , dass Google niemals aufhören wird, eine 404-Seite zu crawlen, solange irgendwo Signale für die URL im Web vorhanden sind.

404er Fehler haben unterschiedliche Bedeutungsgrade

Typ 1. Auf der eigenen Webseite aufgetretene 404-Fehler
Dies sind meiner Meinung nach die schlechtesten 404-Fehler, da sie auf der eigenen Webseite vorkommen,
wenn eine Seite mit einer fehlerhaften href verlinkt wird oder die Seite entfernt wurde,
der Link dazu jedoch nicht.

Diese sind schlecht, da sie die Benutzererfahrung und die Benutzerfreundlichkeit der Website beeinträchtigen.
Solche toten Links sollten so schnell wie möglich repariert werden.

Typ 2. Fehler durch alte Links
Diese können auch wirklich schlecht sein, da Links von anderen Websites auf Seiten verweisen können,
die nicht mehr vorhanden sind, oder Benutzer möglicherweise eine
Seite mit einem Lesezeichen versehen haben, die nicht mehr vorhanden ist.

Wiederum verursachen sie eine schlechte Benutzererfahrung, aber diese Fehler sind für SEO noch schlimmer,
da sie häufig auf einen qualitativ hochwertigen Link von einer anderen Website zurückzuführen sind.

Wenn das Linkziel ein 404-Fehler ist, wird dieser Link nicht mitgezählt.
Somit hat dies gar keinen Einfluß auf das Ranking. Das ist schon mal ein großer Verlust.

Typ 3. Unschuldige Fehlbildung von URLs
Das passiert die ganze Zeit. Jemand, der entweder eine URL in einem Link fett verfasst (falsch schreibt), versucht einen Link, der nicht vorhanden ist, klickt möglicherweise auf einen Link in einer E-Mail,
die über zwei Zeilen aufgeteilt ist, oder er kommt versehentlich zu einer ungültigen URL.

Das ist keine große Sache.

Google meldet diese, wenn er solche findet, und wenn es sich bei der URL um eine Adresse handelt,
die noch nie existiert hat und die nicht von einer qualitativ hochwertigen Linkquelle referenziert wird,
könnte man sie normalerweise einfach ignorieren. Wenn man sich die Server-Protokolle anschaut,
wird man viele solcher Links davon finden.
Diese sind ein grundlegender Fehler und keine große Sache.

Typ 4. Systemische 404-Fehler
Wenn man allerdings ständig steigende Anzahl von 404-Werten sieht,
liegt es irgendwo in Ihrem Code ein Systemfehler vor.
Möglicherweise ist eine XML-Sitemap, die die URLs irgendwie durcheinander bringt.
Oder es könnte sein, dass in der Code ungültige URLs erstellt,
die von Google beim Crawlen ermittelt werden.

In beiden Fällen weist dies normalerweise auf etwas in Ihrem Code hin,
das beschädigt ist und behoben werden muss.

Fazit

Es ist ganz egal auf welche Art und Weise die 404-Fehler generiert werden, ob aus Versehen ein Link falsch gesetzt wurde, oder dies an dem Code liegt. Im Grunde sollten diese schnellstmöglichst solche Fehler behoben werden. Denn jedes Mal, wenn Google einen Pfad durchläuft, in dem man mehr ungültige URLs als gültige URLs crawlen muss, wird die Zeit des Crawlers im Wesentlichen verschwendet. Dies bedeutet, dass der Crawler möglicherweise nicht zu Ihrem gültigen und wichtigen Inhalt gelangt. Dies kann sich definitiv negativ auf die Indexierung und das Ranking im Laufe der Zeit auswirken.