banner

Blog

Jul 29, 2023

Die Modularität des Phagen-Tailspikes und der horizontale Gentransfer zeigen die Spezifität gegenüber E. coli O

Virology Journal Band 20, Artikelnummer: 174 (2023) Diesen Artikel zitieren

421 Zugriffe

11 Altmetrisch

Details zu den Metriken

Die Interaktion zwischen Bakteriophagen und ihren Wirten ist komplex und hochspezifisch. Rezeptorbindende Proteine ​​(RBPs) von Phagen wie Schwanzfasern und Schwanzspitzen leiten den Infektionsprozess ein. Diese RBPs binden an verschiedene äußere Membranstrukturen, einschließlich des O-Antigens, einem serogruppenspezifischen, zuckerbasierten Bestandteil der äußeren Lipopolysaccharidschicht gramnegativer Bakterien. Zu den virulentesten Escherichia coli-Stämmen gehört der Shiga-Toxin-produzierende E. coli (STEC)-Pathotyp, der von einer Untergruppe von O-Antigen-Serogruppen dominiert wird.

Umfangreiche phylogenetische und strukturelle Analysen wurden verwendet, um Spezifitätskorrelationen zwischen Phagen-RBP-Subtypen und STEC-O-Antigen-Serogruppen zu identifizieren und zu validieren, wobei auf dem Prinzip des horizontalen Gentransfers als Haupttreiber der RBP-Evolution gestützt wurde.

Wir identifizierten O-Antigen-spezifische RBP-Subtypen für sieben der neun häufigsten STEC-Serogruppen (O26, O45, O103, O104, O111, O145 und O157) und sieben weitere E. coli-Serogruppen (O2, O8, O16, O18, 4s/ O22, O77 und O78). Acht Phagengattungen (Gamaleya-, Justusliebig-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakeviren) entstanden aufgrund ihres hohen Anteils an serogruppenspezifischen RBPs. Darüber hinaus enthüllen wir Sequenzmotive in der RBP-Region, die möglicherweise als Rekombinations-Hotspots zwischen lytischen Phagen dienen.

Die Ergebnisse tragen zu einem besseren Verständnis des Mosaiks von Phagen-RBPs bei, demonstrieren aber auch eine Methode zur Identifizierung und Validierung neuer RBP-Subtypen für aktuelle und künftig neu entstehende Serogruppen.

Bakteriophagen (oder Phagen) sind Viren, die Bakterien infizieren. Die Phagen-Wirt-Beziehung ist spezifisch und komplex. Rezeptorbindende Proteine ​​(RBPs) von Phagen wie Schwanzfasern und Schwanzspitzen sind die ersten Phagenproteine, die mit dem Wirt interagieren und den Infektionsprozess auslösen. Diese Proteine ​​können spezifisch äußere Zellwandstrukturen von Bakterien wie Kapselpolysaccharide (CPS) [32, 57] oder Lipopolysaccharide (LPS) [21], (Lipo-)Teichonsäuren, äußere Membranproteine, Flagellen oder Pili binden [54]. Schwanzfasern nehmen im Allgemeinen eine faserige Form an und umfassen eine distale Domäne, die den Rezeptor bindet, während Schwanzspitzen typischerweise kürzer sind und eine enzymatische Domäne enthalten, die bei der Bindung auch ihren Rezeptor abbaut [12]. In dieser Arbeit verwenden wir den umfassenden Begriff RBP, da nicht konsistent Informationen über das Vorhandensein einer solchen enzymatischen Aktivität verfügbar sind. Während die meisten Phagen ein oder zwei RBPs kodieren, exprimieren einige polyvalente Phagen mehrere RBPs und bilden so eine verzweigte RBP-Struktur. Jedes dieser RBPs erkennt einen anderen Rezeptor, wodurch der Phagen mehrere Wirte infizieren kann [17, 31, 41, 45, 53].

Zahlreiche Phagen, die Escherichia coli infizieren, kodieren RBPs, die auf die äußere Schicht von LPS, das sogenannte O-Antigen, abzielen. Wenn dieser Virulenzfaktor auf der äußeren Zellwand von E. coli vorhanden ist, wird die Struktur als glattes LPS bezeichnet. Für glatte E. coli-Stämme wurde derzeit eine hohe O-Antigen-Serogruppenvariabilität mit 176 verschiedenen Strukturen beschrieben [37]. Zu den pathogensten E. coli-Stämmen gehört der Shiga-Toxin-produzierende E. coli (STEC)-Pathotyp, der weltweit eine der Hauptursachen für Magen-Darm-Erkrankungen darstellt. Die Prävalenz bestimmter O-Antigene, die mit diesem Pathotyp assoziiert sind, variiert sowohl im Laufe der Zeit als auch je nach geografischem Standort. Die Bedeutung von STEC wurde 2015 von der Ernährungs- und Landwirtschaftsorganisation (FAO) der Vereinten Nationen und der Weltgesundheitsorganisation (WHO) anerkannt. Die Serogruppe O157 ist der am weitesten verbreitete Serotyp in den Vereinigten Staaten, obwohl der Anteil der Nicht-O157-Serogruppen weiter zunimmt. Im Jahr 2020 wurden in Europa mehr STEC-Fälle mit der Serogruppe O26 gemeldet als Fälle mit der Serogruppe O157 [13]. Darüber hinaus kann es zu isolierten STEC-Ausbrüchen neu auftretender Serogruppen kommen, wie zum Beispiel dem STEC-Ausbruch der O104-Serogruppe in Deutschland im Jahr 2011 [28]. Zu den weiteren wichtigen Nicht-O157-Serogruppen, die mit menschlichen Erkrankungen assoziiert sind, gehören O45, O91, O103, O104, O111, O145 und O146, wobei die Prävalenz in den USA im Vergleich zu Europa unterschiedlich ist [15, 16].

Die meisten Schwanzfasern und Schwanzspitzen sind homotrimere, modulare RBPs. Sie bestehen im Allgemeinen aus zwei Domänen: (1) einer N-terminalen Ankerdomäne, die als Bindungsdomäne des RBP an den Phagenpartikel fungiert, und (2) einer C-terminalen Rezeptorbindungsdomäne (RBD), die für die Bindung verantwortlich ist und/oder Spaltung des Wirtsrezeptors. Wenn dieses RBD enzymatische Aktivität aufweist, weist es im Allgemeinen eine β-helikale Struktur auf. Die Substratbindungsstellen befinden sich innerhalb der β-Helix-Domäne, entweder an den drei Schnittstellen zwischen Untereinheiten (zwischen Untereinheiten), wie im Tailspike (TSP) des Phagen Sf6 und TSP1 und TSP2 von CBA120, oder auf der Oberfläche jeder Untereinheit (intra-Untereinheit) wie in den TSPs der Phagen P22, Det7 und HK620 [7, 35, 40, 58, 64]. Die RBD kann optional kleine Domänen wie eine Chaperon-, Adhäsin- oder Kohlenhydratbindungsdomäne umfassen. Die C-terminale RBD ist stark dem horizontalen Gentransfer (HGT) ausgesetzt und wird häufig sowohl innerhalb als auch außerhalb der phylogenetischen Grenzen der Phagengattungen ausgetauscht, während die N-terminale Ankerdomäne innerhalb einer Phagengattung konserviert bleibt [21, 31, 46 ]. Bestimmte Phagen nutzen Sequenzmotive, um die Rekombination zu unterstützen, was zu einem hohen Mosaikgehalt im Genom führt [2, 25]. Solche potenziellen Motive wurden auch innerhalb des RBP-Gens identifiziert (56, 61).

Diese Arbeit demonstriert das O-Antigen-Bindungspotential von RBPs von Mitgliedern aus acht Phagengattungen, nämlich den Gamaleya-, Justusliebig-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakeviren. Wir bestätigen, dass die Auswahl von Phagen, die RBPs desselben Subtyps exprimieren, Wirte mit denselben Serogruppen erkennt, und wir sagen die Serogruppenspezifität verschiedener RBPs in silico basierend auf phylogenetischer und struktureller Clusterbildung voraus. Darüber hinaus haben wir RBD-umgebende DNA-Sequenzmotive identifiziert, die in RBP-Genen in den hier untersuchten lytischen Phagengattungen konserviert sind.

Es wurde eine methodische Pipeline entwickelt, um mutmaßliche O-Antigen-spezifische RBPs zu identifizieren und zu validieren. Im Allgemeinen bestand die Pipeline aus drei Schritten (Abb. 1), die die Einrichtung eines anfänglichen RBP-Datensatzes (Schritt 1), die Erweiterung auf einen erweiterten RBP-Datensatz (Schritt 2) und die anschließende Validierung und Filterung beider umfassten Datensätze, um einen endgültigen kuratierten Datensatz von O-Antigen-Serogruppen-spezifischen RBPs zu erhalten (Schritt 3).

Überblick über die methodische Pipeline, die zur Identifizierung und Validierung von RBPs verwendet wurde. Schritt 1 umfasste die Erfassung eines ersten RBP-Datensatzes (Gruppen A, B und C), der in Schritt 2 weiter erweitert wurde (Gruppen D, E und F). Im letzten Schritt 3 wurden verschiedene RBP-Subtypen validiert und streng auf eine hohe Wahrscheinlichkeit der E. coli-O-Antigen-Spezifität gefiltert

In Schritt 1 wurden relevante RBPs für den anfänglichen Datensatz basierend auf experimentell validierten O-Antigen-spezifischen RBPs auf RBP-Ebene (Gruppe A) oder indirekt auf Phagenebene (Gruppe B) gesammelt. Der ursprüngliche Datensatz wurde durch die Identifizierung horizontaler Transferereignisse der C-terminalen Domänen von RBPs der Gruppen A und B über Phagengattungen hinweg weiter ergänzt, was zu zusätzlichen RBPs der Gruppe C führte. Durch phylogenetische Clusterung von RBPs der Gruppen A, B und C wurden verschiedene RBP-Subtypen mit einer entsprechenden O-Antigen-Serogruppe etabliert.

In Schritt 2 wurden zusätzliche mutmaßliche O-Antigen-spezifische RBPs identifiziert, basierend auf einer dominanten Verbindung zwischen der Prophagen-RBP-Spezifität und dem O-Antigen des Prophagen-Wirts (Gruppe D), basierend auf Gattungen, die für solche O-Antigen-spezifischen RBPs angereichert sind ( Gruppe E) und die Identifizierung zusätzlicher horizontaler Transferereignisse der C-terminalen Domänen von RBPs der Gruppe AE (Gruppe F).

In Schritt 3 wurde eine Qualitätskontrolle basierend auf Validierung und Filterung durchgeführt, um nur diejenigen RBP-Subtypen beizubehalten, die mit hoher Wahrscheinlichkeit auf eine einzelne O-Antigen-Serogruppe abzielen.

Ein Pool von Phagen mit experimentell bestätigter Spezifität der E. coli-Serogruppe wurde aus der Literatur mithilfe der Suchanfrage „phage tailspike O-antigen Shiga toxin-producing E. coli“ auf Google Scholar (abgerufen am 15. November 2022) zusammengestellt. Phagen-RBPs mit experimentell bestätigter Serogruppenspezifität auf RBP-Ebene wurden als Gruppe A bezeichnet. Einige Phagen kodieren mehrere RBPs, die eine verzweigte RBP-Struktur bilden. Wenn mehrere RBPs nachgewiesen wurden, wurden die einzelnen RBPs entsprechend der RBP-Reihenfolge in ihren Referenzphagen (Phagen CBA120 und G7C) identifiziert und nummeriert. Die RBPs von Phagen, die serogruppenspezifisch sind und auf Phagenebene durch Wirtsbereichstests bestätigt wurden, wurden als Gruppe B gekennzeichnet. Für Gruppe B wurden nur Phagen mit einem einzelnen RBP (bestätigt durch MAUVE progressives Alignment [11]) gegen eng verwandte Phagen von verwendet derselben Gattung) ausgewählt, da angenommen wird, dass das RBP für die Interaktion mit dem O-Antigen des Wirts verantwortlich ist.

Um sich speziell auf die HGT der RBDs aus RBPs der Gruppen A und B zu konzentrieren, wurde ein vorläufiger N-terminaler Anker-Cutoff von 150 aa gewählt [34, 49, 50]. BLASTp (gesucht in Caudoviricetes (Taxid: 2.731.619)) wurde mit den vorläufigen C-terminalen RBD-Sequenzen jenseits dieses 150-aa-Grenzwerts durchgeführt. Zur Auswahl von HGT-Ereignissen wurde eine AA-Identität von ≥ 30 % Identität und ≥ 60 % Abdeckung gewählt. Diese Wahl wurde auf der Grundlage unserer vorherigen Analysen und der Grundlagen der Homologiemodellierung getroffen [41, 42, 65]. Wenn ein RBP mit Ähnlichkeit zum Abfrage-RBP identifiziert wurde und der für das RBP kodierende Phagen mindestens einen bekannten Wirt hatte, der zur gleichen Serogruppe wie der Wirt des Abfrage-Phagen gehörte, wurden der Phage und sein RBP zurückgehalten. Bei dieser Suche wurden nur taxonomisch klassifizierte Escherichia- und Enterobacteria-Phagen mit annotierten RBPs berücksichtigt. Nicht verifizierte Sequenzen oder Genome mit falsch annotierten RBP-Kodierungssequenzen (CDS) wurden verworfen. Diese neu identifizierten RBPs gehören zur Gruppe C. Wenn mehrere Stämme derselben Serogruppe ein sehr ähnliches RBP (≥ 80 % AA-Identität) kodierten, wurde nur ein RBP zurückgehalten, um RBP-Redundanz zu vermeiden. Als nächstes wurden die RBPs aus den Gruppen A, B und C mit bekannter Serogruppenspezifität in RBP-Subtypen klassifiziert (≥ 30 % Identität und ≥ 60 % Abdeckung basierend auf BLASTp).

Der anfängliche Datensatz wurde um potenzielle O-Antigen-spezifische RBPs von Prophagen (Gruppe D) erweitert, basierend auf der Taxonomie (Gruppe E) und der Identifizierung von HGT-Ereignissen (Gruppe F). Für Gruppe D wurden Prophagen ausgewählt, die in Stämme integriert sind, die zu den wichtigsten Serogruppen gehören, die unter den STEC-Stämmen vorherrschen, insbesondere O26, O45, O91, O103, O104, O111, O145, O146 und O157. Um zunächst E. coli-Genome mit den gewünschten Serogruppen auszuwählen, verwendeten wir BLASTn [48] mit dem O-Antigen-Biosynthese-Gencluster der jeweiligen Serogruppen (DQ196413.1, AY771223.1, AY035396.1, AY532664) als Abfragesequenz. 1, AF361371.1, AF078736.1, AY863412.1, DQ465249.1, AF061251.1). Die zurückgehaltenen Stämme wurden anschließend mithilfe von tBLASTn auf Lederberg- und Uetakevirus-Prophagen untersucht. Die verwendeten Abfragesequenzen sind die ersten 205 und 124 AA der RBPs der jeweiligen Phagen phiV10 (Uetakevirus, YP_512279.1) und HK620 (Lederbergvirus, NC_002730.1), wie im Abschnitt „Delineation Anchor-RBD“ beschrieben. Wenn ein E. coli-Stamm mit einem vorhergesagten Uetake- oder Lederbergvirus-Prophagen gefunden wurde, wurde die Serogruppe des Stamms mit SerotypeFinder [24] mit ≥ 95 % AA-Identität weiter bestätigt. Als nächstes wurde das Prophage Hunter-Tool [55] verwendet, um die aktiven (Prophage Hunter-Score von > 0,8) Prophage-Genomsequenzen zu extrahieren. Für einige Lederbergviren wurde aufgrund ihres sehr variablen Genoms eine Ausnahme gemacht. Wenn keine aktiven Prophagen gefunden wurden, wurden auch Prophagen mit einem Wert zwischen 0,5 und 0,8 (als „mehrdeutig“ gekennzeichnet) verwendet. Prophagengenome wurden mithilfe der KBase-Plattform [1] mit dem RAST-Annotationstool [4] annotiert. Wenn mehrere Stämme derselben Serogruppe ein sehr ähnliches RBP (≥ 80 % AA-Identität) kodierten, wurde nur der Prophage mit dem höchsten Prophage Hunter-Score zurückgehalten, um RBP-Redundanz zu vermeiden.

Für Gruppe E wurden alle verifizierten Genome von Phagen der sieben im ursprünglichen Datensatz beschriebenen Gattungen (Gamaleya-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakeviren) aus der NCBI-Datenbank (abgerufen im Januar) gesammelt 16, 2023). Ihre RBPs wurden ausgewählt und dem Datensatz hinzugefügt. Phagen mit glatten E. coli-Stämmen, nicht spezifizierten Wirten oder E. coli als Wirtsorganismus wurden zurückgehalten, Phagen mit häufig verwendeten rauen E. coli-Wirtsstämmen, nämlich den Stämmen 58, AG1, B, BL21, C, C600, DH1, DH5α, MG1655 , W3110 und W945 [22, 30] als Wirtsorganismus wurden verworfen. Um RBP-Redundanz zu vermeiden, wurde für jeden RBP-Subtyp innerhalb derselben Phagengattung nur ein Phagenvertreter ausgewählt (≥ 30 % AA-Identität, ≥ 60 % Abdeckung über die vorläufige RBD).

Für Gruppe F wurden HGT-Ereignisse der RBP-Subtypen aus Gruppe A–E über alle Phagengattungen hinweg mithilfe des tBLASTn-Tools (≥ 30 % AA-Identität und ≥ 60 % Abdeckung über die vorläufigen RBDs) innerhalb von Caudoviricetes (Taxid: 2.731.619) und Enterobacteriaceae ( Taxid: 543). Caudoviricetes-Treffer wurden dem Datensatz hinzugefügt, RBPs von nicht klassifizierten Phagen wurden jedoch verworfen. Wenn ein RBP in einer weiteren Phagengattung identifiziert wurde, wurden erneut Phagen aus diesen Gattungen gesammelt, wie für Gruppe E beschrieben. Wenn BLAST-Treffer in E. coli-Stämmen gefunden wurden, wird die Pipeline zum Sammeln von Prophagen-RBPs (Gruppe D, SerotypeFinder, Prophage Hunter, RAST-Annotation) wurde wiederholt, um die RBPs der Phagen zu erhalten. In Übereinstimmung mit Gruppe D und E wurde für jeden RBP-Subtyp innerhalb einer Phagengattung ein einzelner RBP-Vertreter ausgewählt.

Nach der Erfassung des vollständigen Datensatzes (Gruppen A–F; n = 136) konnten alle RBPs in 64 verschiedene RBP-Subtypen geclustert werden. Anschließend wurde die Serogruppenspezifität pro RBP-Subtyp validiert. Für jedes RBP innerhalb des RBP-Subtyps wurde die Serogruppe des Wirtsstamms des Phagen, der das RBP kodiert, oder der Serogruppen-Wirtsstamm, in den der Prophage integriert war, mithilfe von SerotypeFinder identifiziert (24). Neben den 136 RBPs wurden auch alle Wirtsserogruppeninformationen der RBP-Doppel (RBPs desselben RBP-Subtyps innerhalb einer einzelnen Phagengattung) analysiert. Die folgenden Kriterien galten für die Zuordnung einer Serogruppe zu einem bestimmten Subtyp: (i Wenn ein Mitglied der Gruppe A oder B (experimentell bestätigt auf RBP-Ebene oder auf Phagenebene) im RBP-Subtyp vorhanden war, wurde die O-Antigen-Serogruppe dieses Mitglieds verwendet dem gesamten RBP-Subtyp zugeordnet; (ii Für alle anderen RBP-Subtypen müssen mindestens 90 % der Serogruppen identisch sein (mit mindestens zwei bestätigten Serogruppen). RBP-Subtypen, die diese Kriterien nicht erfüllten, wurde keine O-Antigen-Serogruppe zugewiesen zugewiesen. Um den endgültigen Datensatz zu erhalten, haben wir diejenigen Phagengattungen zurückgehalten, die mindestens zwei O-Antigen-spezifische RBPs aufweisen.

Die Ausrichtung des gesamten Phagengenoms wurde durch VICTOR-Phylogenie unter Verwendung der GBDP-Methode (Genome-BLAST Distance Phylogeny) durchgeführt (39). Die Abgrenzung von Anker und RBD wurde wie im Abschnitt „Abgrenzung Anker-RBD“ beschrieben gewählt. MAFFT MSA (G-INS-1) verwendet die Neighbor-Joining-Methode und wurde verwendet, um genaue phylogenetische Baumdaten der gesammelten RBPs und ihrer jeweiligen Anker und RBDs zu erstellen (27). Alle phylogenetischen Bäume wurden mit Interactive Tree Of Life (iTOL) v5 [36] visualisiert und das Layout mit Adobe Illustrator Version 25.4.1 bearbeitet.

Das Clinker-Genomvisualisierungstool [19] wurde verwendet, um die Homologie zwischen CDSs in der RBP-Region zu veranschaulichen. Zu diesem Zweck wurden zirkuläre Genome mit der SnapGene-Software (www.snapgene.com) linearisiert. Alle Figuren wurden mit Adobe Illustrator Version 25.4.1 und Adobe InDesign Version 16.4.3 poliert.

Aminosäure- und DNA-Sequenzen der RBPs wurden mittels MUSCLE Multiple Sequence Alignment (MSA) abgeglichen [14]. Zur Identifizierung von Motivsequenzen wurden RBPs mit DNA-Sequenzhomologie ausgewählt und neu ausgerichtet. Die MSA wurde mit der SnapGene-Software (www.snapgene.com) visualisiert und die resultierende prozentuale Identitätsmatrix wurde als Heatmap mit Python, Version 3.10.4 [62] und Matplotlib, Version 3.6.3 [23], visualisiert.

HGT-Ereignisse von RBP-Sequenzen wurden mithilfe des MUSCLE Multiple Sequence Alignment (MSA) eingehend analysiert, als RBP-Sequenzen innerhalb einer einzelnen Phagengattung verglichen wurden [14]. Die Domänenabgrenzungen wurden manuell kuratiert, basierend auf der Untersuchung von HGT-Ereignissen innerhalb der RBP-Kodierungssequenz durch Lokalisierung flexibler Linkerdomänen in den vorhergesagten Tertiärproteinstrukturen der RBP-Monomere und auf zuvor bestätigten experimentellen Daten gut untersuchter RBPs von Mitgliedern der Phagengattung. Ausgewählte Abgrenzungen finden Sie in der Zusatzdatei 1: Tabelle S1.

AlphaFold2 (v2.1.1; Multimer, maximale Recycles = 12) wurde auf dem HPC-UGent verwendet, um die homotrimeren Quartärstrukturen der RBPs vorherzusagen [26]. Als die Vorhersagen der Quartärstruktur fehlschlugen, wurde die vollständige RBP-Sequenz in die N-terminale Ankerdomäne und die C-terminale RBD aufgeteilt und es wurden separate Vorhersagen gemacht. Zur Färbung umfasste die Ankerdomäne die N-terminale Phagenschwanzbindungsdomäne und, falls vorhanden, die trennende α-Helix. Die RBD wurde so gewählt, dass sie alle Domänen umfasst, die dieser Ankerdomäne nachgeschaltet sind. Strukturen wurden weiterverarbeitet und Root-Mean-Square-Abweichungen (RMSDs) wurden mit dem PyMol Molecular Graphics System, Version 2.5.2 [52], Blender, Version 2.93.3 [10] und Adobe InDesign Version 16.4.3 berechnet.

Um die modulare Entwicklung von O-Antigen-Serogruppen-spezifischen RBPs aus Phagen zu untersuchen, die vorherrschende STEC-Serogruppen infizieren, haben wir zunächst einen ersten Datensatz von Phagen-RBPs (Schritt 1; Abb. 1, Zusatzdatei 1: Tabelle S1) unter Verwendung von drei verschiedenen Quellen zusammengestellt :

Escherichia coli-Phagen-RBPs mit experimentell verifizierter O-Antigen-Serogruppenspezifität, bestätigt auf RBP-Ebene (Gruppe A; n = 8; RBPs der Phagen CBA120 (RBP2, RBP3 und RBP4), EP75 (RBP1), G7C (RBP2), HK620, LB226692_Prophage und phiV10). Der zur Gattung Kuttervirus gehörende Phagen CBA120 kodiert für vier separate RBPs. Es wurde experimentell bestätigt, dass RBP2, RBP3 und RBP4 das O157-, O77- bzw. O78-Antigen spalten (TSP2, TSP3 und TSP4 [45]). Phagen der Gattung Gamaleyavirus kodieren für zwei O-Antigen-spezifische RBPs, einschließlich des Phagen G7C, dessen zweites RBP (RBP2) nachweislich das 4s/O22 O-Antigen spaltet (gp63.1, [46],

Escherichia coli-Phagen-RBPs mit experimentell bestätigter O-Antigen-Serogruppenspezifität auf Phagenebene, wenn der jeweilige Phage nur ein einzelnes RBP kodiert (Gruppe B; n = 4; RBPs der Phagen CLB_P1, Ro103C3Iw, Ro145c2YLVW und Ro45lw);

Escherichia coli-Phagen-RBPs, identifiziert durch HGT über Phagen hinweg. Die Einschlusskriterien sind (1) dass das RBP zum gleichen RBP-Subtyp (≥ 30 % AA-Identität über die RBD) wie eines der experimentell validierten O-Antigen-Serogruppen-spezifischen RBPs aus Gruppe A und/oder B gehört und (2 ), dass der jeweilige Phage einen Wirt mit derselben Serogruppe infiziert (Gruppe C; n = 5; RBPs der Phagen ESCO41, Penshu1, PhAPEC7 (RBP2), phiWAO78-1 und TL-2011b).

Diese anfängliche Auswahl umfasste 17 Phagen-RBPs, die von sieben verschiedenen Phagengattungen (Gamaleya-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakeviren) kodiert wurden und zu sechs verschiedenen RBP-Subtypen gehörten, einer für jede der sechs Serogruppen (O18). , 4s/O22, O78, O103, O104 und O157). RBPs der Gruppe A haben das höchste Konfidenzniveau in Bezug auf die Spezifitätsvorhersage, da sie direkt experimentell validiert werden, wohingegen sich das Konfidenzniveau für Gruppe B und noch weiter für RBPs der Gruppe C verringert, da ihre Vorhersagen zunehmend auf indirekten Beweisen basieren.

Um den anfänglichen Datensatz zu vervollständigen, haben wir drei E. coli-Phagen-RBPs, die für die K1-Kapsel spezifisch sind, als Außengruppe aufgenommen. Die RBP-Spezifität für Kapselserotypen und ihre Entwicklung durch HGT-Ereignisse sind gut dokumentiert. Kayfunavirus K1F und Kagunavirus K1H, die homologe (49 % AA-Identität) und experimentell verifizierte RBPs aufweisen, die auf die Kapsel K1 abzielen [43, 51], werden der Gruppe A hinzugefügt. Ein dritter Phage phiv205-1 hat ein offensichtliches HGT-Ereignis durchlaufen, das für ein RBP kodiert gehört zum K1-spezifischen RBP-Subtyp der Phagen K1F und K1H (63,1 bzw. 55,6 % AA-Identität) und infiziert einen E. coli-Stamm mit dem Kapselserotyp K1 (zur Gruppe C hinzugefügt, n = 1) (Abb. 2). .

Überblick über die Methodik dieser Studie. In drei Schritten wurde ein erster (Gruppe A–C) und erweiterter (Gruppe A–F) Datensatz erfasst (Abb. 1). In Schritt 1 wurden Referenzphagen aus zuvor veröffentlichten Arbeiten gesammelt, was zu RBPs der Gruppe A mit auf RBP-Ebene bestätigter Serogruppenspezifität und RBPs der Gruppe B führte, die von Phagen mit einem einzelnen RBP und experimentell bestätigter Serogruppenspezifität auf Phagenebene abgeleitet waren. Mithilfe des HGT-Prinzips wurden RBPs der Gruppe C identifiziert, die zum gleichen RBP-Subtyp wie die RBPs der Gruppen A und B gehören und die Serogruppe des jeweiligen Subtyps infizieren. In Schritt 2 wurde der Datensatz erweitert. RBPs von Lederberg- oder Uetakevirus-Prophagen relevanter STEC-Serogruppen wurden in Gruppe D ausgewählt. Gruppe E umfasst eine Sammlung aller RBPs von E. coli-Phagen innerhalb der sieben durch Gruppe A–D erhaltenen Gattungen. Gruppe F verwendet das HGT-Prinzip, um alle RBPs in der NCBI-Datenbank zu identifizieren, die zu denselben RBP-Subtypen gehören wie diejenigen in Gruppe A–E. Beachten Sie, dass für jeden RBP-Subtyp innerhalb einer einzelnen Phagengattung nur ein RBP-Vertreter zurückgehalten wurde, um RBP-Redundanz zu vermeiden. K1-Targeting-RBPs wurden in der gesamten Pipeline als Außengruppe hinzugefügt. Schließlich wurde die Serogruppenspezifität aller RBP-Subtypen in Schritt 3 durch eine Konsistenzanalyse der Wirtserogruppen der Phagen validiert, die ein RBP desselben RBP-Subtyps enthielten

Der Ausgangsdatensatz umfasst 20 RBPs. Für die Phagengenome dieses ersten Datensatzes und ihre RBPs wurden separate phylogenetische Bäume erstellt (Abb. 3). Die RBP-Sequenzen wurden anhand ihrer N-terminalen strukturellen Ankerdomäne, die für die Bindung an das Phagenpartikel verantwortlich ist, und ihrer C-terminalen RBD, die für die Rezeptorerkennung verantwortlich ist, abgegrenzt. Anschließend wurden phylogenetische Bäume für die N-terminalen strukturellen Ankerdomänen und die C-terminalen RBDs der RBPs getrennt erstellt. Das Phagengenom und die Ankerdomänen gruppieren sich gemäß der Phagentaxonomie (Abb. 3a, b), wohingegen die RBD des RBP zu einer Gruppierung entsprechend dem entsprechenden Wirtserotyp führt (Abb. 3c). Bei Verwendung der vollständigen RBP-Kodierungssequenz war auch eine Clusterbildung nach Wirtserotyp sichtbar, was durch die im Allgemeinen längere Länge der RBD im Vergleich zur Ankerdomäne erklärt werden kann (Abb. 3d). Diese hervorragende Clusterbildung im ursprünglichen Datensatz zeigt, wie HGT-Ereignisse der RBD-Domänen innerhalb und zwischen Phagengattungen die RBP- und Phagenspezifität geprägt haben, während die Ankerdomänen innerhalb der Phagengattungen konserviert sind, um die Anlagerung an den Phagenschwanz zu ermöglichen.

Phylogenetische Bäume von Phagen und ihren RBPs aus dem ursprünglichen Datensatz. Ein phylogenetischer Baum des gesamten Phagengenoms unter Verwendung der VICTOR-Phylogenie. Phylogenetische Bäume basierend auf der MAFFT-G-INS-1-Ausrichtung von b den N-terminalen Ankerdomänen der interessierenden RBPs, c der C-terminalen RBD der RBPs und d der vollständigen RBP-Kodierungssequenzen. Die Farbe der Ellipsen zeigt das vom RBP anvisierte O-Antigen an, während die Phagenpartikelmorphologie die taxonomische Phagengruppe anzeigt, wie in Tafel a angegeben. Für Phagen, die mehrere RBPs kodieren, wurden die RBPs entsprechend der Genreihenfolge angezeigt (z. B. stellt die zweite Ellipse von CBA120 RBP2 dar). RBPs desselben Subtyps, die zu Phagen derselben Gattung gehörten, wurden nur einmal gezeigt, mit Ausnahme von RBP2 des Phagen EP75 in Panel a. Beachten Sie, dass vier RBPs des ursprünglichen Datensatzes, bei denen es sich um Singletons handelt, nicht in der Abbildung enthalten sind (RBP3 des Phagen CBA120 und die RBPs der Phagen ESCO41, Ro145c2YLVW und Ro45lw).

Die Beobachtung einer strikten Korrelation von RBP-Subtypen innerhalb und zwischen Phagengattungen mit der Spezifität der O-Antigen-Serogruppe im ursprünglichen Datensatz ermutigte uns, die Pipeline zu erweitern, um weitere potenzielle O-Antigen-spezifische RBPs aus E. coli-Phagen zu identifizieren und diese zu kartieren große Vielfalt an RBP-Subtypen pro Serogruppe. Daher haben wir als zweiten Schritt in unserer Pipeline unseren anfänglichen Datensatz um zusätzliche RBPs mit hohem Potenzial für Serogruppenspezifität erweitert (Schritt 2; Abb. 2; Zusatzdatei 1: Tabelle S1). Drei verschiedene Quellen basierend auf Prophagen (Gruppe D), taxonomischen Beziehungen (Gruppe E) und identifizierten HGT-Ereignissen (Gruppe F) wurden verwendet, inspiriert von unterschiedlichen Überlegungen, die die O-Antigen-Spezifität der jeweiligen RBPs unterstützen. Für den gesamten erweiterten Datensatz wurde nur ein RBP-Repräsentant für jeden RBP-Subtyp innerhalb einer Phagengattung zurückgehalten, um RBP-Redundanz zu vermeiden.

Die erste Gruppe (Gruppe D) von RBPs beruht auf der Hypothese, dass ein integrierter Prophage normalerweise ein RBP codiert, das es ermöglicht, den Bakterienstamm zu infizieren, in den es integriert ist [5]. Diese Hypothese wurde nur auf Prophagen angewendet, die über ein einzelnes RBP verfügen, um sicherzustellen, dass die potenzielle O-Antigen-Spezifität dem richtigen RBP zugeordnet wird. Wir haben uns insbesondere auf die gemäßigten Phagengattungen Lederberg- und Uetakeviren konzentriert. Letztere sind beispielhafte Phagengattungen für experimentell validierte O-Antigen-spezifische RBPs, wie im ursprünglichen Datensatz (Gruppe A) identifiziert.

Nach diesem Prinzip wurden RBPs identifiziert, die von Uetakevirus- und/oder Lederbergvirus-Prophagen stammen, die in Stämme der vorherrschenden STEC-Serogruppen O26, O45, O91, O103, O104, O111, O145, O146 und O157 integriert waren (n = 9, Gruppe D). Die Prävalenz von Prophagen war in den verschiedenen Serogruppen sehr unterschiedlich (Zusatzdatei 2: Tabelle S2), aber Stämme aller Serogruppen enthielten mindestens einen Prophagen, der zu einer der beiden Gattungen gehörte, mit Ausnahme der Serogruppe O91. Während bei den O103-Stämmen acht von 32 (25 %) einen Prophagen kodierten, der zu einer dieser Gattungen gehörte, war dies bei nur einem von 39 gescreenten O157-Stämmen der Fall (< 3 %). Bei den meisten Stämmen wurde in einem einzigen Genom nicht mehr als ein Prophage jeder Gattung gefunden. Nach dem Entfernen aller redundanten RBPs innerhalb einer einzelnen Gattung und eines RBP-Subtyps (≥ 30 % AA-Identität gegenüber der vorläufigen RBD) wurden unterschiedliche Uetakevirus-Prophagen-RBPs aus Stämmen mit den Serogruppen O26 (n = 1), O45 (n = 1), O103 ( n = 2) und O146 (n = 1) sowie Lederbergvirus-RBPs für die Serogruppen O26 (n = 1), O103 (n = 1), O111 (n = 1) und O145 (n = 1).

Die Begründung für Gruppe E basierte auf der Beobachtung, dass alle RBPs aus Gruppe AD nur sieben Gattungen angehörten, nämlich Gamaleya-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakeviren. Wir kamen daher zu dem Schluss, dass diese Gattungen möglicherweise mit O-Antigen-spezifischen RBPs angereichert sind, und erweiterten den Datensatz durch manuelle Kuratierung und Filterung um alle RBPs dieser Gattungen (n = 65).

RBPs der Gruppe F wurden basierend auf der Identifizierung von HGT-Ereignissen hinzugefügt (n = 42). Dabei haben wir uns auf das Modularitätsprinzip von RBPs verlassen, das aus strukturellen Gründen konservierte Anker beibehält, während die RBD gegen Spezifitätsschalter ausgetauscht wird. Mithilfe von tBLASTn-Suchen mit den zuvor identifizierten vorläufigen RBD-Subtypen (Gruppe A–E) als Abfrage wurden neue RBPs entdeckt, die über ein HGT-Ereignis verknüpft sind, auch in der bisher unerforschten Gattung Justusliebigviren. Diese zusätzliche Phagengattung wurde dann wie für RBPs der Gruppe E beschrieben weiter abgebaut. Neun von 42 RBPs in dieser Gruppe wurden aus intakten Prophagen von E. coli-Stämmen gewonnen.

Zu diesem Zeitpunkt umfasste der erweiterte Datensatz (Gruppe A–F) 136 RBPs (Zusatzdatei 1: Tabelle S1), die anschließend einem abschließenden Validierungsschritt unterzogen wurden, um nur RBPs der O-Antigen-Serogruppe auszuwählen (Schritt 3; Abb. 2). Zunächst wurden alle RBPs geclustert (basierend auf ≥ 30 % AA-Identität gegenüber der vorläufigen RBD), was zu 64 verschiedenen RBP-Subtypen führte. Zweitens wurde die Serogruppe des Wirtsstamms des Phagen, der ein RBP kodiert, oder die Serogruppe des Wirtsstamms, in den der Prophage integriert wurde, für jedes RBP des RBP-Subtyp-Clusters aufgelistet. Die folgenden Kriterien wurden dann angewendet, um jedem einzelnen RBP-Subtyp eine Serogruppe zuzuordnen: (i) wenn ein Mitglied der Gruppe A oder B (experimentell auf RBP-Ebene oder auf Phagenebene bestätigt) im RBP-Subtyp vorhanden war, das O-Antigen Die Serogruppe dieses Mitglieds wurde dem gesamten RBP-Subtyp zugeordnet. (ii) für alle anderen RBP-Subtypen müssen mindestens 90 % der Serogruppen des Wirtsstamms identisch sein (mit mindestens zwei RBPs). Wichtig ist, dass wir beachten, dass alle RBP-Subtypen, die Kriterium (i) erfüllen, auch Kriterium (ii) erfüllen. Basierend auf diesen Kriterien konnte eine O-Antigen-Serogruppe 15 RBP-Subtypen mit insgesamt 54 RBPs zugeordnet werden. Die verbleibenden RBP-Subtypen zeigten entweder eine Inkonsistenz in den Wirtsserogruppen (25 RBP-Subtypen mit 49 RBPs) oder es konnte aufgrund fehlender Daten keine Serogruppe zugeordnet werden (22 RBP-Subtypen mit 31 RBPs) (Abb. 4a). Mehr RBPs des endgültigen, validierten Datensatzes stammen aus Gruppe F als aus Gruppe E, was darauf hindeutet, dass die Methode zur Verwendung von HGT zur Identifizierung neuer O-Antigen-spezifischer RBPs effizienter war als die Methode zur Extraktion von RBPs aus Phagen, die zu denselben Gattungen gehören.

Validierung des erweiterten Datensatzes und Filterung zum endgültigen Datensatz. a Die Zuordnung einer Serogruppe pro RBP wird pro Gruppe des anfänglichen (Gruppe A–C) und erweiterten (Gruppe A–F) Datensatzes visualisiert. Alle gestapelten Balken ergeben die Gesamtzahl der RBPs, die im erweiterten Datensatz gesammelt wurden (n = 136). Die Serogruppenspezifität wurde RBPs (n = 54) zugewiesen, basierend auf experimenteller Validierung auf RBP-Ebene (dunkelgrün), auf Phagenebene (grün) oder wenn mindestens 90 % der RBPs eines bestimmten RBP-Subtyps (mit einem Minimum von zwei) haben die gleiche vorhergesagte Serogruppe (hellgrün). Alle anderen RBPs (grau) wurden verworfen, da vorhergesagt wurde, dass sie nicht serogruppenspezifisch sind, oder weil es an Vertrauen mangelte. b Die Serogruppenvorhersage von RBPs wird pro Phagengattung angezeigt und ist auf Gattungen beschränkt, die mindestens zwei durch die Serogruppe bestätigte RBPs enthalten

In einem letzten Auswahlschritt haben wir nach Gattungen gefiltert, die mindestens zwei Serogruppen-spezifische RBPs aufweisen, was dazu führte, dass acht RBPs mit einer zugewiesenen O-Antigen-Serogruppe aus acht verschiedenen Gattungen weggelassen wurden. Nach dieser Validierung und Filterung umfasste der endgültige O-Antigen-spezifische RBP-Datensatz 44 RBPs von 15 verschiedenen RBP-Subtypen, verteilt auf Phagen, die zu acht Phagengattungen gehörten, wobei Kayfunaviren (n = 4) und Kutterviren (n = 4) experimentell am häufigsten vorkommen bestätigte serogruppenspezifische RBPs (Gruppe A und B), während Lederbergviren (n = 10) und Uetakeviren (n = 6) die am häufigsten für Serogruppen vorhergesagten RBPs zählen (Abb. 4b). Die acht in dieser Forschung untersuchten Gattungen weisen unterschiedliche Morphologien auf (Abb. 5b) und sind taxonomisch nicht verwandt (Abb. 6a).

Übersicht über die RBP-Region und Struktur ausgewählter RBPs aus acht verschiedenen Phagengattungen (Kayfuna-, Kaguna-, Nouzilly-, Justusliebig-, Lederberg-, Uetake-, Gamaleya- und Kutterviren). a Paarweise Ausrichtung der RBP-Genregion von Phagenmitgliedern mit unterschiedlichen RBDs innerhalb der Gattung. Die verschiedenen annotierten Gene sind angegeben. Innerhalb des RBP (rot) werden die konservierten Ankerdomänen durch Schattierung hervorgehoben. b Vereinfachte Morphologie der RBP-Architektur von Phagen, die zu den jeweiligen Gattungen gehören, mit Schwerpunkt auf dem RBP und seinen beiden Domänen: Anker (Schattierung) und RBD. c Vorhergesagte Quartärstruktur ausgewählter Gattungsmitglieder, wobei die Ankerdomäne und die RBD blau bzw. rot hervorgehoben sind. d Die verzweigte Struktur von Kuttervirus-RBPs, wie von Sørensen et al. [56]. Sequenzidentitätsmatrizen für die einzelnen Domänen finden Sie in der Zusatzdatei 3: Abb. S1–S2

ein phylogenetischer Baum, der die taxonomische Beziehung der verschiedenen Phagen unter Verwendung der VICTOR-Phylogenie für das gesamte Phagengenom veranschaulicht. Das Farbschema des RBP-Subtyps wurde entsprechend ihrer (vorhergesagten) Wirtserogruppe dargestellt. Wenn mehrere RBPs im Phagengenom vorhanden waren, werden sie in derselben Reihenfolge wie die RBPs ihrer Referenzphagengattungen (CBA120 und G7C) dargestellt. Phylogenetische Bäume basierend auf dem MAFFT-G-INS-1-Alignment von b den N-terminalen Ankerdomänen der interessierenden RBPs, c der C-terminalen RBD der RBPs und d der vollständigen RBP-Kodierungssequenzen zur Identifizierung horizontaler Gentransferereignisse über taxonomische Phagen hinweg Gruppen

Für jede der ausgewählten Gattungen wurden die Syntenie des Phagengenoms, die RBP-Architektur und die Strukturanalyse der RBPs durchgeführt (Abb. 5). Die RBP-kodierenden Sequenzen sind im Allgemeinen die variabelsten Sequenzen des Genoms innerhalb einer Gattung, eingebettet in eine konservierte Gensyntenie, mit Ausnahme von Lederberg- und Uetakeviren. Diese Gattungen weisen stromabwärts des RBP-Gens kaum oder gar keine Ähnlichkeiten auf. Dies kann durch die frühere Beobachtung erklärt werden, dass gemäßigte Phagen im Allgemeinen stärker horizontalen Gentransferereignissen ausgesetzt sind [38]. Alle RBPs des endgültigen Datensatzes verfügen über die klassische N-terminale, konservierte Ankerdomäne mit einer C-terminalen RBD, mit Ausnahme des Kayfunavirus CLB_P1, bei dem das RBP in zwei separate Proteine ​​gespalten ist, d. h. ein intermediäres Adapterprotein (entsprechend dem Anker). ) und ein zweites Protein (entsprechend dem RBD), das sich voraussichtlich an das Adapterprotein bindet (ähnlich den Phagen K1-5, SP6, K1E [59] und KP34 [31]).

Die verzweigten RBP-Strukturen von Gamaleya- und Kutterviren (Abb. 5b) scheinen für HGT sehr empfänglich zu sein. Von den 16 ausgewählten Gamaleyaviren wurden elf verschiedene RBP-Subtypen für RBP1 und sieben für RBP2 identifiziert. In ähnlicher Weise wurden von den zehn E. coli-infizierenden Kutterviren fünf, eins, vier und fünf verschiedene RBP-Subtypen für RBP1, RBP2, RBP3 und RBP4 gefunden. Bei Gamaleyaviren wurde 28 % der RBP-Subtypen einer E. coli-Serogruppe zugeordnet (Abb. 4b). Die übrigen RBP-Subtypen wurden weder aufgrund fehlender Daten (28 %) noch aufgrund von Serogruppeninkonsistenzen zwischen den RBP-Subtyp-Mitgliedern (50 %) einer Serogruppe zugeordnet. Bei Kutterviren wurden 29,5 % der RBP-Subtypen einer E. coli-Serogruppe zugeordnet, während 41 % aufgrund fehlender Daten verworfen wurden. Die verbleibenden RBP-Subtypen wurden aufgrund von Serogruppeninkonsistenzen (29,5 %) verworfen, aber im Gegensatz zu anderen Gattungen vor allem, weil vorhergesagt wurde, dass die RBPs auf andere Arten als E. coli (24 %) abzielen, darunter viele Klebsiella pneumoniae-Stämme.

Phylogenetische Bäume der vollständigen Phagengenome, der N-terminalen Anker, der C-terminalen RBDs und der RBPs voller Länge aus dem erweiterten Datensatz sind in Abb. 6 dargestellt. Auch hier ist ein ähnliches Muster wie beim ursprünglichen Datensatz zu erkennen (Abb. 3). Die N-terminalen Anker gruppieren sich gemäß der Taxonomie, während die C-terminalen RBDs einer Serogruppen-Gruppierung folgen. Die RBPs voller Länge zeigen auch eine serogruppengesteuerte Clusterbildung, da C-terminale RBDs den größten Anteil des RBP darstellen. Komplementär zu jedem phylogenetischen Baum basierend auf der MAFFT-G-INS-1-Ausrichtung bestätigen Aminosäureähnlichkeiten basierend auf der MUSCLE-Ausrichtung der RBPs und der N-terminalen und C-terminalen Domänen des endgültigen Datensatzes diese Ergebnisse weiter (zusätzliche Datei 3: Abbildungen S1–S3). Eine Ausnahme von dieser perfekten phylogenetischen Clusterbildung ist die Homologie zwischen N-terminalen Kutter- und Gamaleyavirus-Domänen. Die Domänen von drei von vier Kuttervirus-RBPs (RBP1, RBP3 und RBP4) weisen eine hohe Ähnlichkeit mit der Domäne von RBP2 von Gamaleyaviren auf, und Kuttervirus RBP2 zeigt Homologie zu Gamaleyavirus RBP1, was auf die Erhaltung der RBP-Verzweigungsstruktur über diese Gattungen hinweist [7, 21, 46].

Um die Beziehung zwischen Quartärstruktur, Serogruppenspezifität und Phagengattung weiter zu analysieren, haben wir die Quartärstruktur jedes RBP des endgültigen Datensatzes mit AlphaFold2 vorhergesagt und die Strukturen pro Serogruppe geclustert (Zusatzdatei 4: Abb. S4). Der paarweise Vergleich aller Strukturen zeigt auch, dass HGT das dominierende Prinzip ist, das die Evolution und Struktur von RBPs prägt: Die Struktur des N-terminalen Ankers bleibt auf der Ebene der Phagengattung konserviert, während die Struktur der C-terminalen RBD-Cluster pro O-Antigen konserviert ist Serogruppe, unabhängig von diversen Primärsequenzen, die bis zu 70 % abweichen können. Zur Veranschaulichung: Dies wird deutlich für einen systematischen Satz von 2 × 2 RBPs gezeigt, die zu Kaguna- und Lederbergviren gehören und auf die Serogruppen O78 bzw. O145 abzielen. Ihre Ankerstrukturen sind auf Gattungsebene sehr ähnlich (RMSD von 1,46 und 1,18 Å), wohingegen die RBD-Strukturen auf Serogruppenebene ähnlich sind (RMSD von 1,83 und 2,97 Å) (Abb. 7). Diese Musterkonsistenz, die sich sowohl durch die phylogenetische Clusterbildung (Abb. 6) als auch durch die hohe Erhaltung der Quartärstruktur pro Funktion (Zusatzdatei 4: Abb. S4; Abb. 7) zeigt, bestätigt die Gültigkeit der etablierten Pipeline für die Neurekrutierung und Kommentierung prognostizierte serogruppenspezifische RBPs und hebt HGT erneut als Haupttreiber für Spezifitätswechsel über taxonomische Grenzen hinweg hervor.

Die Quartärstrukturen einer beispielhaften Untergruppe von vier RBPs aus zwei Gattungen (Kaguna- und Lederbergvirus) und zwei RBP-Subtypen (mit zugeordneten Serogruppen O145 und O78). Die Struktur des N-terminalen Ankers (Proteinstruktur in Blau) ist auf der Ebene der Phagengattung konserviert, wohingegen die Struktur des C-terminalen RBD (Proteinstruktur in Rot) pro O-Antigen-Serogruppe gruppiert ist, was einen gattungsübergreifenden HGT veranschaulicht

Durch weitere Untersuchungen wurden zwei konservierte DNA-Sequenzregionen identifiziert, die sich vor und nach der RBD befinden. Bemerkenswerterweise sind diese konservierten Regionen in allen RBP-Genen aller lytischen Phagengattungen Gamaleya-, Kaguna-, Kayfuna-, Kutter-, Justusliebig- und Nouzillyviren vorhanden (Abb. 8), jedoch nicht in den Prophagen der Uetake- und Lederbergviren. Motiv eins umfasst eine 44 nt lange Region am Ende der Ankerdomänensequenz und ist in allen sechs Kagunavirus-RBPs, vier von fünf Kayfunavirus-RBPs, allen drei Justusliebigvirus-RBPs, beiden Nouzillyvirus-RBPs, dem zweiten RBP beider Gamaleyaviren und allen konserviert Kuttervirus-RBPs mit Ausnahme von CBA120 RBP2 (Zusatzdatei 5: Abb. S5, a; Zusatzdatei 6: Abb. S6) (n = 20). In einer Teilmenge dieser RBPs (n = 10) bleibt dieses Motiv über einen längeren Zeitraum erhalten (Motiv zwei; 95 nt) (Zusatzdatei 5: Abb. S5, b; Zusatzdatei 6: Abb. S7). Motiv drei hingegen befindet sich in der nichtkodierenden Region stromabwärts der RBP-Kodierungssequenz und ist für alle Gamaleya-, Kutter- und Justusliebigvirus-RBPs, ein Kayfunavirus- und ein Nouzillyvirus-RBP (20 nt; n = 13; Zusatzdatei 5) konserviert : Abb. S5c; Zusatzdatei 6: Abb. S8). Es wird vorhergesagt, dass dieses konservierte Motiv auch als Terminatorsequenz fungiert. Für die jeweiligen Motive wurden durchschnittliche DNA-Sequenzidentitäten von 63 ± 9, 69 ± 8 und 81 ± 12 % erhalten. Die Konservierung innerhalb dieser Motive ist deutlich höher als in den umgebenden DNA-Sequenzregionen (Zusatzdatei 5: Abb. S5d). Während die Rekombination auf nicht-homologische und homologe Weise erfolgen kann, schlagen wir vor, dass diese konservierten Regionen vor und nach den RBD-Kodierungssequenzen über taxonomische Grenzen hinweg als Rekombinations-Hotspots fungieren können, um die Nischenspeziation durch den Erwerb eines geeigneten RBD von einem anderen Phagen schnell voranzutreiben durch horizontalen Transfer, auch über taxonomische Grenzen hinweg.

Visualisierung der RBP-Sequenzregion ausgewählter lytischer Phagen der jeweiligen Phagengattungen Kayfuna-, Kaguna-, Nouzilly-, Gamaleya-, Justusliebig- und Kutterviren. Pro Gattung wurde ein beispielhafter Phage ausgewählt, um die Erhaltung der DNA-Sequenz über die Gattungen hinweg zu veranschaulichen. Konservierte Motive mit den Längen 44 (n = 20), 95 (n = 10) und 20 bp (n = 13) für Motiv eins bis drei zeigen Homologie zwischen den verschiedenen Phagengattungen. Die Konsenssequenzen werden durch Sequenzlogos angezeigt

Wir haben eine Pipeline aufgebaut, um serogruppenspezifische RBPs in silico zu identifizieren. Wir haben uns daher auf das Modularitätsprinzip von RBPs verlassen, das konservierte Anker für die strukturelle Anbindung an den Phagenschwanz beibehält und gleichzeitig die RBD gegen Spezifitätsschalter austauscht. Sowohl auf phylogenetischer als auch auf struktureller Ebene gibt diese Modularität eine klare Orientierung bei der Klassifizierung der RBPs in RBP-Subtypen. Insgesamt wurden 14 verschiedene RBP-Subtypen, die auf O2, O8, O16, O18, 4s/O22, O26, O45, O77, O78, O103, O104, O111, O145 und O157 abzielen, in 39 Phagen identifiziert, die auf acht verschiedene Phagengattungen verteilt waren. Gleichzeitig wurden mehrere geclusterte RBP-Subtypen gefunden, die höchstwahrscheinlich auf einen anderen Rezeptor als das O-Antigen abzielen. Beispielsweise zeigte das RBP von Justusliebigvirus VecB während des Serogruppenvalidierungsschritts Ähnlichkeit mit RBPs von Prophagen, die in E. coli-Stämme der Serogruppen O6, O11 und O153 integriert waren, mit 89,8, 66,1 und 61,7 % AA-Identität. Außerdem zeigt RBP1 des Gamaleyavirus PGN829.1 mehr als 99,5 % AA-Identität mit RBPs von Prophagen in Stämmen mit den Serogruppen O11, O83, O86 und O102. Weitere Beispiele sind das RBP von Kayfunavirus YZ1 (Serogruppen O102, O6, O1, O153 und O6; ≥ 95 % Identität), das RBP von Uetakevirus phiv142-3 (einschließlich Serogruppen O5, O1, O102 und O51; ≥ 95 % Identität), und das RBP von Justusliebigvirus alia (einschließlich der Serogruppen O7, O23, O146; ≥ 75,7 % Identität). Ein RBP-bindendes glattes E. coli-Stämmchen aus mehreren Serogruppen wurde bereits zuvor identifiziert [20]. Eine mögliche Erklärung ist, dass diese RBPs, die zum selben Subtyp gehören, auf einen Rezeptor abzielen, der von mehreren Serogruppen gemeinsam genutzt wird, beispielsweise das K-Antigen (Kapsel). Es ist möglicherweise weniger wahrscheinlich, dass Proteine ​​der äußeren Membran als Rezeptor fungieren, da sich RBPs von Phagen, die glatte Stämme infizieren, aufgrund der sterischen Hinderung des langkettigen O-Antigens nicht leicht den Proteinen der äußeren Membran nähern können [8, 20, 29]. Zweitens könnten sich diese RBPs, die zum gleichen RBP-Subtyp gehören, möglicherweise weiter divergiert haben, um ihre Wirtsspezifität durch Einzelpunktmutationen in ihrer Substratbindungsstelle zu verändern, wie es für einige Schwanzfasern beschrieben wurde [3, 33, 60, 66]. Weitere Untersuchungen sind erforderlich, um weitere Schlussfolgerungen zu ziehen, aber mehrere auf Serogruppen abzielende Phagen könnten ein breiteres therapeutisches Potenzial haben, was ein attraktives Merkmal für die Entwicklung von Phagencocktails darstellt.

Die gemäßigten Phagengattungen Lederberg- und Uetakeviren bieten eine elegante Möglichkeit, neue RBPs mit Spezifität gegenüber einer O-Antigen-Serogruppe von Interesse zu identifizieren. Phagen dieser Gattungen wurden in acht von neun interessierenden Serogruppen identifiziert und es besteht ein klarer Zusammenhang zwischen dem RBP des Prophagen und der O-Antigen-Serogruppe ihres Wirts [5]. Dieser Ansatz ist generisch und kann problemlos auf andere Serogruppen ausgeweitet werden. Zusätzlich zu unseren Erkenntnissen wurden die RBP-Sequenzen von Salmonella enterica, die Lederbergviren infizieren, verwendet, um den O-Antigen-Typ seines Wirts vorherzusagen. Dabei gruppierten sich 743 Prophagen-RBPs in 18 verschiedene RBP-Subtypen, die perfekt mit dem O-Antigen-Polysaccharid korrelierten, das sein Wirt aufweist auf seiner Oberfläche [5]. Eine Einschränkung dieses Ansatzes besteht jedoch darin, dass einige Lederberg- und Uetakeviren möglicherweise auch ein O-Antigen-Modifikationsgen hinter ihrem RBP kodieren [9, 44] und dadurch den Rezeptor als Mechanismus zur Verhinderung einer Superinfektion verändern. Neben der Serogruppenvorhersage wurden RBDs von Lederberg- und Uetakeviren mit einem Podovirus-Morphotyp erfolgreich in myo-like phage tail-like bacteriocins (PTLBs) gepfropft [49, 50], um das Abtötungsspektrum des PTLB erfolgreich auszutauschen. Darüber hinaus weisen viele RBDs von RBPs von Kutterviren eine Homologie zu denen von Lederberg- oder Uetakeviren auf, wie z. B. TSP3 des Phagen SPTD1 [18] und zu anderen in dieser Arbeit identifizierten RBDs. Dies zeigt, dass Lederberg- und Uetakeviren ideale Kandidaten als Ausgangspunkt für die Identifizierung eines RBP sind, das auf eine interessierende O-Antigen-Serogruppe abzielt, und von dort aus expandieren, um weitere RBPs desselben RBP-Subtyps aus Phagen anderer taxonomischer Gruppen zu rekrutieren.

Unsere Forschung legt nahe, dass bei vielen Phagen der Gattungen Gamaleya-, Justusliebig-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakevirus ihr RBP(s) der einzige Faktor ist, der die Serogruppenspezifität bestimmt. Folglich können diese RBPs verwendet werden, um die Serogruppe des Phagenwirts vorherzusagen, basierend auf der Erhaltung der Serogruppenspezifität der RBP-Subtypen. Kutterviren wurden zuvor verwendet, um die Wirtserogruppe von Salmonella enterica und E. coli vorherzusagen. RBP-Subtypen (> 75 % AA-Identität) wurden für das O78-Antigen von E. coli und das O22-Antigen- und O4/O9-Antigen-Rückgrat von S. enterica bestätigt [56]. In unserer Arbeit haben wir eine zuverlässige Clusterbildung in RBP-Subtypen basierend auf einer AA-Identität von lediglich ≥ 30 % gefunden, während die vorhergesagten quartären Proteinstrukturen sehr ähnlich bleiben. Dies weist darauf hin, dass eine erhebliche Divergenz durch adaptive Evolution die Phagenfitness bei einem HGT-Ereignis einer RBD verbessert und gleichzeitig die Serogruppenspezifität bewahrt. RBPs des gleichen Subtyps, aber mit geringer Sequenzähnlichkeit, haben daher im Vergleich zu RBPs mit höherer Ähnlichkeit einen entfernter verwandten Vorfahren. Diese Beobachtungen veranschaulichen das Zusammenspiel horizontaler und vertikaler Evolutionsprozesse, die Tailspikes formen. Der niedrige Schwellenwert kann jedoch zur Einbeziehung falsch positiver Ergebnisse führen, wenn eine Serogruppe einem RBP zugeordnet wird, das bereits entscheidende Mutationen durchlaufen hat, die zu einem Wechsel der Serogruppenspezifität führen. Als Kriterium haben wir angegeben, dass 90 % aller RBPs innerhalb eines Subtyps mit ihrer Wirtserogruppe übereinstimmen müssen, andernfalls wurde der RBP-Subtyp als Nicht-O-Antigen-Targeting klassifiziert. Daher haben wir möglicherweise fälschlicherweise serogruppenspezifische RBP-Subtypen verworfen, weil ein einzelnes RBP möglicherweise seine Spezifität geändert hat. Zusätzlich zu den acht in dieser Studie untersuchten Gattungen tauchten auch Agtre-, Phapecocta-, Roguna- und Vectreviren sowie Mitglieder der Familie Ackermannviridae oder der Unterfamilie Braunvirinae häufig in den RBPs der Gruppe F auf, basierend auf der HGT-Identifizierung, was darauf hindeutet, dass sie ebenfalls eine Rolle spielen könnten eine wichtige Rolle bei der HGT von RBPs mit E. coli-Serogruppenspezifität.

Mitglieder dieser Gattungen können so manipuliert werden, dass sie den Wirtsbereich der Phagen einfach durch Austausch der RBD-Domänen austauschen. Da Phagen im Laufe der Evolution durch horizontalen Transfer scheinbar mehrfach das Wirtsspektrum gewechselt haben, könnten Phagen mit angepassten RBPs entworfen werden, um auf den Stamm der Wahl abzuzielen. Przondovirus K11, ein mit Kayfunaviren verwandter Phagen, wurde erfolgreich durch Austausch des RBD entwickelt, um den Wirtsbereich in Richtung verschiedener Klebsiella-Kapselserotypen zu verändern [32]. In ähnlicher Weise wurden Kuttervirus-Phagen-SPTD1-RBDs innerhalb derselben Phagengattung ausgetauscht, um auf verschiedene Salmonella-O-Antigen-Serogruppen abzuzielen [18]. Darüber hinaus wurden die RBDs von Podo-ähnlichen Lederberg- und Uetakeviren, wie bereits erwähnt, mit Myo-ähnlichen PTLBs ausgetauscht, was zeigt, dass RBDs über verschiedene Morphologien hinweg ausgetauscht werden können [49, 50].

Die beobachtete Sequenzkonservierung rund um die RBD kann die Rekombination zwischen Gamaleya-, Justusliebig-, Kaguna-, Kayfuna-, Kutter- und Nouzillyviren unterstützen. Obwohl illegitime Rekombinationsereignisse praktisch überall im Phagengenom auftreten können, können bestimmte Regionen der Sequenzkonservierung als Rekombinations-Hotspots dienen. Solche Hotspots wurden mehrfach identifiziert. In gemäßigten Phagenclustern, einschließlich Lederbergviren, wurden konservierte Sequenzmotive zwischen Genomkassetten identifiziert, was zu einem höheren Genommosaikismus führte [6, 9, 25, 47]. Darüber hinaus wurde auch Sequenzhomologie zwischen verschiedenen Gattungen lytischer Phagen identifiziert. Beispielsweise wurde bereits eine Sequenzhomologie zwischen den verschiedenen RBPs von Kutterviren sowie zwischen Kutter- und Gamaleyaviren vorgeschlagen, um die Rekombination über verschiedene Tailspike-Gene hinweg zu unterstützen [7, 21, 46, 56]. In dieser Forschung haben wir konservierte Motive beobachtet, die es ermöglichen könnten, dass homologe Rekombinationen in den Sequenzregionen rund um die RBD in bis zu sechs verschiedenen lytischen Phagengattungen mit einer höheren Rate auftreten. Darüber hinaus wurden bei der Erweiterung des Datensatzes in diesem Projekt verschiedene HGT-Ereignisse bei Phagen beobachtet, die zu denselben, wiederkehrenden Gattungen gehörten, was darauf hinweist, dass die Wahrscheinlichkeit für HGT-Ereignisse innerhalb der RBPs dieser Gattungen höher ist als bei anderen Gattungen. Allerdings sind diese Motive nicht für alle lytischen Phagen-RBPs im endgültigen Datensatz universell und es konnte keine Korrelation zwischen dem Vorhandensein dieser Motive und der Anzahl der Rekombinationsereignisse, die wir zwischen diesen Phagen beobachteten, beobachtet werden.

Bei der Durchführung dieser Untersuchung wurden einige Hürden identifiziert. (i) Die erste Einschränkung ist das Fehlen von Daten zur Phagen-Wirt-Serogruppe in öffentlichen Datenbanken. Wenn die Serogruppe des Phagenwirts bekannt ist, sollte sie erwähnt werden, da sie wertvolle Informationen in Studien zur Phagen-Wirt-Interaktion liefern kann. Darüber hinaus ist die Anzahl der verfügbaren Phagengenome von Phagen, die glatte E. coli-Stämme infizieren, im Vergleich zu denen, die raue E. coli-Stämme infizieren, relativ gering. Darüber hinaus infizieren die meisten verfügbaren glatten E. coli-infizierenden Phagengenome E. coli der Serogruppe O157. Um neue Phagen zu finden, sollten bei der Phagenisolierung häufiger glatte E. coli-Stämme aller Serogruppen als Wirte verwendet werden. Die zur E. coli-Serotypisierung verwendete Methode ist ebenfalls relevant, da Prophagen zusätzliche O-Antigen-Modifikationsgene kodieren können, die bei genetisch basierten Serotypisierungstests übersehen werden können. (ii) Eine zweite Hürde ist die falsche Annotation vieler RBPs in Datenbanken wie NCBI. Dies ist teilweise auf die Vielfalt der verwendeten Terminologie zurückzuführen. Schwanzfasern haben im Allgemeinen eine faserartige Struktur, die von einem langen α-Helix-Bündel mit einem C-terminalen RBD dominiert wird, wohingegen Schwanzspitzen eine enzymatisch aktive, β-helikale, verlängerte Struktur ohne, eine oder zwei C-terminale Kohlenhydratbindungen haben Chaperon-Domänen [12]. Beide Begriffe werden oft vermischt. Falsch annotierte RBPs machen eine manuelle und zeitaufwändige Kuratierung des RBP durch Phagengenom-Alignments erforderlich. Neue Computertools wie PhageDPO [63] können diesen Prozess erleichtern, erfordern jedoch immer noch eine manuelle Validierung. (iii) Die Zahl der durch Kristallographie definierten RBP-Strukturen wächst, ist aber immer noch rar. Daher haben wir uns weitgehend auf den AlphaFold2-Algorithmus verlassen, um die bemerkenswert konservierten quartären Anker- und RBD-Strukturen entsprechend der Gattung bzw. der Serogruppe aufzudecken. Dennoch scheiterte der AlphaFold2-Algorithmus häufig daran, gute Strukturen zu liefern, wie etwa die trimere Struktur von O8 und O16, die auf RBPs abzielen, entweder aufgrund von Einschränkungen bei der Rechenleistung für den Umgang mit diesen großen trimeren Proteinen oder aufgrund hoher Fehlerschätzungen. Die Einschränkung der Rechenleistung könnte größtenteils umgangen werden, indem eine Hochleistungsrecheninfrastruktur verwendet und das RBP in seinen Anker und RBD für separate Vorhersagen aufgeteilt wird. Die hohen Fehlerschätzungen werden durch die Unfähigkeit verursacht, die gegenseitige Orientierung der einzelnen Domänen aufgrund der flexiblen Gelenkdomänen vorherzusagen, aufgrund der begrenzten Anzahl verfügbarer Kristallstrukturen (z. B. für die Ankerdomäne der Lederbergvirus-RBPs), aber auch durch zu den dazwischenliegenden T4gp10-ähnlichen Domänen, die zur Erstellung verzweigter RBPs benötigt werden [31, 45, 46]).

Zusammenfassend wurde eine Pipeline zur Identifizierung und Validierung von E. coli-O-Antigen-spezifischen RBPs eingerichtet. Acht Phagengattungen (Gamaleya-, Justusliebig-, Kaguna-, Kayfuna-, Kutter-, Lederberg-, Nouzilly- und Uetakeviren) entstanden aufgrund ihres hohen Anteils an serogruppenspezifischen RBPs. Mit ihrer konservierten N-terminalen Ankerdomäne und austauschbaren RBD bieten sie eine ideale Plattform für das Phagen-Wirt-Engineering im Hinblick auf die O-Antigen-Serogruppenspezifität. Diese Forschung unterstreicht auch die Notwendigkeit, Rekombinations-Hotspots rund um RBDs zu untersuchen, was zu einem besseren Verständnis des Phagengenom-Mosaikismus führen könnte.

Die Datensätze, die die Schlussfolgerungen dieses Artikels unterstützen, sind im Artikel und seinen zusätzlichen Dateien enthalten.

Arkin AP, Cottingham RW, Henry CS, Harris NL, Stevens RL, Maslov S, Dehal P, Ware D, Perez F, Canon S, Sneddon MW, Henderson ML, Riehl WJ, Murphy-Olson D, Chan SY, Kamimura RT, Kumari S, Drake MM, Brettin TS, Yu D. KBase: Wissensdatenbank des US-amerikanischen Ministeriums für Energiesystembiologie. Nat Biotechnol. 2018;36(7):566–9. https://doi.org/10.1038/nbt.4163.

Artikel CAS PubMed PubMed Central Google Scholar

Bobay LM, Touchon M, Rocha EPC. Wirtsrekombinationsfunktionen manipulieren oder ersetzen: ein Dilemma, das die Entwicklungsfähigkeit von Phagen beeinflusst. PLoS Genet. 2013. https://doi.org/10.1371/journal.pgen.1003825.

Artikel PubMed PubMed Central Google Scholar

Boon M, Holtappels D, Lood C, Van Noort V, Lavigne R. Die Erweiterung des Wirtsspektrums des Pseudomonas-Virus LUZ7 wird durch eine konservierte Schwanzfasermutation vorangetrieben. PHAGE: Ther Appl Res. 2020;1(2):87–90. https://doi.org/10.1089/phage.2020.0006.

Artikel Google Scholar

Brettin T, Davis JJ, Disz T, Edwards RA, Gerdes S, Olsen GJ, Olson R, Overbeek R, Parrello B, Pusch GD, Shukla M, Thomason JA, Stevens R, Vonstein V, Wattam AR, Xia F. RASTtk: eine modulare und erweiterbare Implementierung des RAST-Algorithmus zum Erstellen benutzerdefinierter Annotationspipelines und zum Annotieren von Genomstapeln. Sci Rep. 2015;5(1):1–6. https://doi.org/10.1038/srep08365.

Artikel CAS Google Scholar

Casjens SR, Grose JH. Beiträge von P2- und P22-ähnlichen Prophagen zum Verständnis der enormen Vielfalt und Häufigkeit von Schwanzbakteriophagen. Virologie. 2016;496:255–76. https://doi.org/10.1016/j.virol.2016.05.022.

Artikel CAS PubMed Google Scholar

Casjens SR, Winn-Stapley DA, Gilcrease EB, Morona R, Kühlewein C, Chua JEH, Manning PA, Inwood W, Clark AJ. Das Chromosom des Shigella-flexneri-Bakteriophagen Sf6: vollständige Nukleotidsequenz, genetischer Mosaikismus und DNA-Verpackung. J Mol Biol. 2004;339(2):379–94. https://doi.org/10.1016/J.JMB.2004.03.068.

Artikel CAS PubMed Google Scholar

Chen C, Bales P, Greenfield J, Heselpoth RD, Nelson DC. Kristallstruktur von ORF210 aus E. coli O157:H1-Phage CBA120 (TSP1), einem mutmaßlichen Tailspike-Protein. Plus eins. 2014;9(3):93156. https://doi.org/10.1371/journal.pone.0093156.

Artikel CAS Google Scholar

Chiu J, Ng K. Escherichia coli O-Antigen Serotyp O16 ist ein Restriktionsfaktor für die Bakteriophagen-T4-Infektion. J Exp Microbiol Immunol. 2017;3:38–44.

Google Scholar

Clark AJ, Inwood W, Cloutier T, Dhillon TS. Nukleotidsequenz des Coliphagen HK620 und die Entwicklung lambdoider Phagen. J Mol Biol. 2001;311(4):657–79. https://doi.org/10.1006/JMBI.2001.4868.

Artikel CAS PubMed Google Scholar

Community BO. Blender: ein 3D-Modellierungs- und Rendering-Paket (2018). http://www.blender.org

Darling ACE, Mau B, Blattner FR, Perna NT. Lila: Mehrfachausrichtung der konservierten Genomsequenz mit Umlagerungen. Genomres. 2004;14(7):1394. https://doi.org/10.1101/GR.2289704.

Artikel CAS PubMed PubMed Central Google Scholar

Dunne M, Prokhorov NS, Loessner MJ, Leiman PG. Neuprogrammierung des Wirtsbereichs von Bakteriophagen: Gestaltungsprinzipien und Strategien zur Entwicklung rezeptorbindender Proteine. Aktuelle Meinung Biotechnol. 2021;68:272–81. https://doi.org/10.1016/J.COPBIO.2021.02.006.

Artikel CAS PubMed PubMed Central Google Scholar

Ecdc. Jährlicher epidemiologischer STEC-Infektionsbericht für 2020 – wichtige Fakten, (2020)

Edgar RC. MUSCLE: Ausrichtung mehrerer Sequenzen mit hoher Genauigkeit und hohem Durchsatz. Nukleinsäuren Res. 2004;32(5):1792. https://doi.org/10.1093/NAR/GKH340.

Artikel CAS PubMed PubMed Central Google Scholar

Ernährungs- und Landwirtschaftsorganisation der Vereinten Nationen, WHO (2018). Shiga-Toxin produzierende Escherichia coli (STEC) und Lebensmittel: Zuordnung, Charakterisierung und Überwachung: Bericht.

Behörde für Lebensmittelsicherheit, E, Boelaert F, Stoicescu A, Amore G, Messens W, Hempen M, Rizzi V, Antoniou SE, Baldinelli F, Dorbek-Kolin E, Van der Stede Y, ECDC-Mitarbeiter Taina Niskanen, Haussig J , Kaczmarek M , Gomes Dias J , Ship L , Mancin M , Mantovani C , Sardella A , Altieri I . EFSA J. 2021;19(2):e06406. https://doi.org/10.2903/J.EFSA.2021.6406.

Artikel Google Scholar

Gebhart D, Williams SR, Scholl D. Der Bakteriophage SP6 kodiert für ein zweites Tailspike-Protein, das die Serogruppen C2 und C3 von Salmonella enterica erkennt. Virologie. 2017;507:263–6. https://doi.org/10.1016/J.VIROL.2017.02.025.

Artikel CAS PubMed Google Scholar

Gil J, Paulson J, Brown M, Zahn H, Nguyen MM, Eisenberg M, Erickson S. Anpassung des Wirtsspektrums von Ackermannviridae-Bakteriophagen durch chimäre Tailspike-Proteine. Viren. 2023;15:286. https://doi.org/10.3390/v15020286.

Artikel CAS PubMed PubMed Central Google Scholar

Gilchrist CLM, Chooi YH. Clinker und Clustermap.js: Automatische Generierung von Gencluster-Vergleichszahlen. Bioinformatik. 2021;37(16):2473–5. https://doi.org/10.1093/BIOINFORMATICS/BTAB007.

Artikel CAS PubMed Google Scholar

Golomidova AK, Efimov AD, Kulikov EE, Kuznetsov AS, Bealov IS, Letarov AV. Das O-Antigen schränkt die Lysogenisierung von Nicht-O157-Escherichia-coli-Stämmen durch den Stx-konvertierenden Bakteriophagen phi24B ein. Sci Rep. 2021;11(1):3035. https://doi.org/10.1038/S41598-021-82422-X.

Artikel CAS PubMed PubMed Central Google Scholar

Greenfield J, Shang . Sci Rep. 2020;10(1):1–14. https://doi.org/10.1038/s41598-020-72373-0.

Artikel CAS Google Scholar

Hobman JL, Penn CW, Pallen MJ. Laborstämme von Escherichia coli: Musterbürger oder betrügerische Straftäter, die schändlich altern? Mol Mikrobiol. 2007;64(4):881–5. https://doi.org/10.1111/J.1365-2958.2007.05710.X.

Artikel CAS PubMed Google Scholar

Hunter JD. Matplotlib: eine 2D-Grafikumgebung. Informatik-Ing. 2007;9(3):90–5. https://doi.org/10.1109/MCSE.2007.55.

Artikel Google Scholar

[ PMC kostenloser Artikel ] [ PubMed ] Joensen KG, Tetzschner AMM, Iguchi A, Aarestrup FM, Scheutz F. Schnelle und einfache In-silico-Serotypisierung von Escherichia coli-Isolaten durch Verwendung von Sequenzierungsdaten des gesamten Genoms. J Clin Microbiol. 2015;53(8):2410–26. https://doi.org/10.1128/JCM.00008-15/SUPPLE_FILE/ZJM999094355SD2.XLSX.

Artikel CAS PubMed PubMed Central Google Scholar

Juhala RJ, Ford ME, Duda RL, Youlton A, Hatfull GF, Hendrix RW. Genomsequenzen der Bakteriophagen HK97 und HK022: allgegenwärtiger genetischer Mosaikismus in den lambdoiden Bakteriophagen. J Mol Biol. 2000;299(1):27–51. https://doi.org/10.1006/jmbi.2000.3729.

Artikel CAS PubMed Google Scholar

Jumper J, Evans R, Pritzel A, Green T, Figurnov M, Ronneberger O, Tunyasuvunakool K, Bates R, Žídek A, Potapenko A, Bridgland A, Meyer C, Kohl SAA, Ballard AJ, Cowie A, Romera-Paredes B, Nikolov S, Jain R, Adler J, Hassabis D. Hochpräzise Proteinstrukturvorhersage mit AlphaFold. Natur. 2021;596(7873):583–9. https://doi.org/10.1038/s41586-021-03819-2

Artikel CAS PubMed PubMed Central Google Scholar

Katoh K, Standley DM. Eine einfache Methode zur Kontrolle der Überausrichtung im MAFFT-Programm zur Ausrichtung mehrerer Sequenzen. Bioinformatik. 2016;32(13):1933–42. https://doi.org/10.1093/BIOINFORMATICS/BTW108.

Artikel CAS PubMed PubMed Central Google Scholar

Kim JS, Lee MS, Kim JH. Aktuelle Updates zu Ausbrüchen von Shiga-Toxin produzierenden Escherichia coli und seinen potenziellen Reservoirs. Front Cell Infect Microbiol. 2020. https://doi.org/10.3389/FCIMB.2020.00273.

Artikel PubMed PubMed Central Google Scholar

Kirel YA, Prokhorov NS, Shashkov AS, Ovchinnikova OG, Zdorovenko EL, Liu B, Kostryukova ES, Larin AK, Golomidova AK, Letarov AV. Variationen in der O-Antigen-Biosynthese und O-Acetylierung im Zusammenhang mit veränderter Phagenempfindlichkeit in Escherichia coli 4s. J Bakteriol. 2015;197(5):905–12. https://doi.org/10.1128/JB.02398-1

Artikel CAS PubMed PubMed Central Google Scholar

Kuhnert P, Nicolet J, Frey J. Schnelle und genaue Identifizierung von Escherichia coli K-12-Stämmen. Appl Environ Microbiol. 1995;61(11):4135–9.

Artikel CAS PubMed PubMed Central Google Scholar

Latka A, Leiman PG, Drulis-Kawa Z, Briers Y. Modellierung der Architektur von Depolymerase-haltigen Rezeptorbindungsproteinen in Klebsiella-Phagen. Fronti Microbiol. 2019. https://doi.org/10.3389/fmicb.2019.02649.

Artikel Google Scholar

Latka A, Sebastien L, Dennis G, Dorien D, Barbara M, Timothy L, Zuzanna DK, Yves B. Die Entwicklung der modularen Rezeptorbindungsproteine ​​von Klebsiella-Phagen verändert ihre Kapselserotypspezifität. MBio. 2021;12(3):e00455-e521. https://doi.org/10.1128/mBio.00455-21.

Artikel CAS PubMed PubMed Central Google Scholar

Le S, He Plus eins. 2013. https://doi.org/10.1371/JOURNAL.PONE.0068562.

Artikel PubMed PubMed Central Google Scholar

Leiman PG, Battisti AJ, Bowman VD, Stummeyer K, Mühlenhoff M, Gerardy-Schahn R, Scholl D, Molineux IJ. Die Strukturen der Bakteriophagen K1E und K1–5 erklären den prozessiven Abbau von Polysaccharidkapseln und die Entwicklung neuer Wirtsspezifitäten. J Mol Biol. 2007;371(3):836–49. https://doi.org/10.1016/j.jmb.2007.05.083.

Artikel CAS PubMed Google Scholar

Leiman PG, Molineux IJ. Entwicklung einer neuen Enzymaktivität aus derselben Motivfalte. Mol Mikrobiol. 2008;69(2):287. https://doi.org/10.1111/J.1365-2958.2008.06241.X.

Artikel CAS PubMed PubMed Central Google Scholar

Letunic I, Bork P. Interactive Tree Of Life (iTOL) v5: ein Online-Tool für die Anzeige und Annotation phylogenetischer Bäume. Nukleinsäuren Res. 2021. https://doi.org/10.1093/nar/gkab301.

Artikel PubMed PubMed Central Google Scholar

Liu B, Furevi A, Perepelov AV, Guo X, Cao H, Wang Q, Reeves PR, Knirel YA, Wang L, Widmalm G. Struktur und Genetik von Escherichia coli O-Antigenen. FEMS Microbiol Rev. 2020;44(6):655–83. https://doi.org/10.1093/femsre/fuz028.

Artikel CAS PubMed Google Scholar

Mavrich TN, Hatfull GF. Die Entwicklung von Bakteriophagen unterscheidet sich je nach Wirt, Lebensstil und Genom. Nat Microbiol. 2017. https://doi.org/10.1038/nmicrobiol.2017.112.

Artikel PubMed PubMed Central Google Scholar

Meier-Kolthoff JP, Göker M. VICTOR: Genombasierte Phylogenie und Klassifizierung prokaryotischer Viren. Bioinformatik. 2017;33(21):3396–404. https://doi.org/10.1093/BIOINFORMATICS/BTX440.

Artikel CAS PubMed PubMed Central Google Scholar

Müller JJ, Barbirz S, Heinle K, Freiberg A, Seckler R, Heinemann U. Ein intersubunit aktives Zentrum zwischen superspiralisierten parallelen β-Helices in der trimeren Tailspike-Endorhamnosidase des Shigella flexneri-Phagen Sf6. Struktur. 2008;16(5):766–75. https://doi.org/10.1016/J.STR.2008.01.019.

Artikel PubMed Google Scholar

Ouyang R, Costa AR, Cassidy CK, Otwinowska A, Williams VCJ, Latka A, Stansfeld PJ, Drulis-Kawa Z, Briers Y, Pelt DM, Brouns SJJ, Briegel A. Hochauflösende Rekonstruktion eines Jumbo-Bakteriophagen, der verkapselte Bakterien infiziert unter Verwendung hyperverzweigter Schwanzfasern. Nat Commun. 2022. https://doi.org/10.1038/s41467-022-34972-5.

Artikel PubMed PubMed Central Google Scholar

Pearson WR. Eine Einführung in die Suche nach Sequenzähnlichkeit („Homologie“). Aktuelles Protokoll Bioinform. 2013. https://doi.org/10.1002/0471250953.bi0301s42.

Artikel Google Scholar

Peng Q, Yuan Y. Charakterisierung eines neu isolierten Phagen, der pathogene Escherichia coli infiziert, und Analyse seiner Mosaikstrukturgene. Sci Rep. 2018;8(1):1–10. https://doi.org/10.1038/s41598-018-26004-4.

Artikel CAS Google Scholar

Perry LL, SanMiguel P, Minocha U, Terekhov AI, Shroyer ML, Farris LA, Bright N, Reuhs BL, Applegate BM. Sequenzanalyse des Escherichia coli O157:H7-Bakteriophagen ΦV10 und Identifizierung eines Phagen-kodierten Immunitätsproteins, das das O157-Antigen modifiziert. FEMS Microbiol Lett. 2009;292(2):182–6. https://doi.org/10.1111/J.1574-6968.2009.01511.X.

Artikel CAS PubMed Google Scholar

Plattner M, Shneider MM, Arbatsky NP, Shashkov AS, Chizhov AO, Nazarov S, Prokhorov NS, Taylor NMI, Buth SA, Gambino M, Gencay YE, Brøndsted L, Kutter EM, Kirel YA, Leiman PG. Struktur und Funktion des verzweigten Rezeptor-Bindungskomplexes des Bakteriophagen CBA120. J Mol Biol. 2019;431(19):3718–39. https://doi.org/10.1016/j.jmb.2019.07.022.

Artikel CAS PubMed Google Scholar

Prokhorov NS, Riccio C, Zdorovenko EL, Shneider MM, Browning C, Knirel YA, Leiman PG, Letarov AV. Funktion des Esterase-Tailspike des Bakteriophagen G7C bei der Adsorption von Wirtszellen. Mol Mikrobiol. 2017;105(3):385–98. https://doi.org/10.1111/MMI.13710.

Artikel CAS PubMed Google Scholar

Recktenwald J, Schmidt H. Die Nukleotidsequenz des für Shiga-Toxin (Stx) 2e kodierenden Phagen φP27 ist nicht mit anderen Stx-Phagengenomen verwandt, die modulare genetische Struktur bleibt jedoch erhalten. Immun infizieren. 2002;70(4):1896–908. https://doi.org/10.1128/IAI.70.4.1896-1908.2002.

Artikel CAS PubMed PubMed Central Google Scholar

Sayers EW, Bolton EE, Brister JR, Canese K, Chan J, Comeau DC, Connor R, Funk K, Kelly C, Kim S, Madej T, Marchler-Bauer A, Lanczycki C, Lathrop S, Lu Z, Thibaud-Nissen F, Murphy T, Phan L, Skripchenko Y, Sherry ST. Datenbankressourcen des National Center for Biotechnology Information. Nukleinsäuren Res. 2022;50(D1):D2 https://doi.org/10.1093/NAR/GKAB1112.

Artikel CAS PubMed Google Scholar

Scholl D, Cooley M, Williams SR, Gebhart D, Martin D, Bates A, Mandrell R. Ein konstruiertes Pyocin vom R-Typ ist ein hochspezifisches und empfindliches bakterizides Mittel gegen den durch Lebensmittel übertragenen Krankheitserreger Escherichia coli O157:H7. Antimikrobielle Wirkstoffe Chemother. 2009;53(7):3074–80. https://doi.org/10.1128/AAC.01660-08.

Artikel CAS PubMed PubMed Central Google Scholar

Scholl D, Gebhart D, Williams SR, Bates A, Mandrell R. Die Genomsequenz von E. coli O104:H4 führt zur schnellen Entwicklung eines gezielten antimikrobiellen Wirkstoffs gegen diesen neu auftretenden Krankheitserreger. Plus eins. 2012;7(3):e33637. https://doi.org/10.1371/journal.pone.0033637.

Artikel CAS PubMed PubMed Central Google Scholar

Scholl D, Merril C. Das Genom des Bakteriophagen K1F, eines T7-ähnlichen Phagen, der die Fähigkeit erworben hat, sich auf K1-Stämmen von Escherichia coli zu replizieren †. Bakteriologie. 2005;187(24):8499–503. https://doi.org/10.1128/JB.187.24.8499.

Artikel CAS Google Scholar

Schrödinger LLC (2015). Das molekulare Grafiksystem PyMOL, Version ~1.8

Schwarzer D, Buettner FFR, Browning C, Nazarov S, Rabsch W, Bethe A, Oberbeck A, Bowman VD, Stummeyer K, Muhlenhoff M, Leiman PG, Gerardy-Schahn R. Ein multivalenter Adsorptionsapparat erklärt das breite Wirtsspektrum des Phagen phi92 : eine umfassende genomische und strukturelle Analyse. J Virol. 2012;86(19):10384–98. https://doi.org/10.1128/jvi.00801-12.

Artikel CAS PubMed PubMed Central Google Scholar

Silva JB, Storms Z, Sauvageau D. Wirtsrezeptoren für die Adsorption von Bakteriophagen. FEMS Microbiol Lett. 2016;363:2. https://doi.org/10.1093/femsle/fnw002.

Artikel CAS Google Scholar

Song W, Sun HX, Zhang C, Cheng L, Peng Y, Deng Z, Wang D, Wang Y, Hu M, Liu W, Yang H, Shen Y, Li J, You L, Xiao M. Prophage Hunter: ein Integrativ Jagdwerkzeug für aktive Prophagen. Nukleinsäuren Res. 2019;47(W1):W74–80. https://doi.org/10.1093/nar/gkz380.

Artikel CAS PubMed PubMed Central Google Scholar

Sørensen AN, Woudstra C, Sørensen MCH, Brøndsted L. Subtypen von Schwanzspitzenproteinen sagen das Wirtsspektrum von Ackermannviridae-Phagen voraus. Comput Struct Biotechnol J. 2021;19:4854–67. https://doi.org/10.1016/j.csbj.2021.08.030.

Artikel CAS PubMed PubMed Central Google Scholar

Squeglia F, Maciejewska B, Łątka A, Ruggiero A, Briers Y, Drulis-Kawa Z, Berisio R. Strukturelle und funktionelle Studien eines Klebsiella-Phagenkapsel-Depolymerase-Tailspikes: mechanistische Einblicke in den Kapselabbau. Struktur. 2020;28(6):613-624.e4. https://doi.org/10.1016/J.STR.2020.04.015.

Artikel CAS PubMed Google Scholar

Steinbacher S, Baxa U, Miller S, Weintraub A, Seckler R, Huber R. Kristallstruktur des mit Salmonella sp. komplexierten Phagen-P22-Tailspike-Proteins. O-Antigen-Rezeptoren. Proc Natl Acad Sci USA. 1996;93(20):10584. https://doi.org/10.1073/PNAS.93.20.10584.

Artikel CAS PubMed PubMed Central Google Scholar

Stummeyer K, Schwarzer D, Claus H, Vogel U, Gerardy-Schahn R, Mühlenhoff M. Evolution von Bakteriophagen, die eingekapselte Bakterien infizieren: Lehren aus Escherichia coli K1-spezifischen Phagen. Mol Mikrobiol. 2006;60(5):1123–35. https://doi.org/10.1111/J.1365-2958.2006.05173.X.

Artikel CAS PubMed Google Scholar

Taslem Mourosi J, Awe A, Guo W, Batra H, Ganesh H, Wu Int J Mol Sci. 2022;23(20):12146. https://doi.org/10.3390/IJMS232012146.

Artikel CAS PubMed PubMed Central Google Scholar

Tétart F, Desplats C, Krisch HM. Genomplastizität im distalen Schwanzfaserort des T-even-Bakteriophagen: Rekombination zwischen konservierten Motiven vertauscht die Adhäsinspezifität. J Mol Biol. 1998;282(3):543–56. https://doi.org/10.1006/JMBI.1998.2047.

Artikel PubMed Google Scholar

Van Rossum G, Drake FL. Python 3-Referenzhandbuch. CreateSpace. 2009;121:242.

Google Scholar

Vieira M, Duarte J, Domingues R, Oliveira H, Dias O (nd). PhageDPO: Phagen-Depolymerase-Finder. https://doi.org/10.1101/2023.02.24.529883

Walter M, Fiedler C, Grassl R, Biebl M, Rachel R, Hermo-Parrado XL, Llamas-Saiz AL, Seckler R, Miller S, van Raaij MJ. Struktur des rezeptorbindenden Proteins des Bakteriophagen det7: ein podoviraler Schwanzdorn in einem Myovirus. J Virol. 2008;82(5):2265–73. https://doi.org/10.1128/JVI.01641-07.

Artikel CAS PubMed Google Scholar

Xiang Z. Fortschritte in der Modellierung der Homologieproteinstruktur. Curr Protein Peptid Sci. 2006;7(3):217–27. https://doi.org/10.2174/138920306777452312.

Artikel CAS PubMed PubMed Central Google Scholar

Yehl K, Lemire S, Yang AC, Ando H, Mimee M, Torres MDT, de la Fuente-Nunez C, Lu TK. Manipulation des Wirtsbereichs von Phagen und Unterdrückung der Bakterienresistenz durch Mutagenese der Phagenschwanzfasern. Zelle. 2019;179(2):459-469.e9. https://doi.org/10.1016/j.cell.2019.09.015.

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Die in dieser Arbeit verwendeten Rechenressourcen (Stevin Supercomputer Infrastructure) und Dienste wurden vom VSC (Flämisches Supercomputerzentrum) bereitgestellt, finanziert von der Universität Gent, FWO und der flämischen Regierung – Abteilung EWI. CP und AL werden von der Forschungsstiftung Flandern unterstützt (FWO;1S79422N; 1240021N)

Abteilung für Biotechnologie, Universität Gent, Valentin Vaerwyckweg 1, 9000, Gent, Belgien

Célia Pas, Agnieszka Latka und Yves Briers

Abteilung für Pathogenbiologie und Immunologie, Universität Breslau, Przybyszewskiego 63, 51-148, Breslau, Polen

Agnieszka Latka

Zentrum für Lebensmittelsicherheit und Qualitätsmanagement, ZHAW School of Life Sciences and Facility Management, Einsiedlerstrasse 31, 8820, Wädenswil, Schweiz

Lars Fieseler

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

CP: Konzeptualisierung, Methodik, Validierung, Software, Untersuchung, Datenkuratierung, Schreiben – Originalentwurf, Visualisierung. AL: Schreiben – Überprüfen und Bearbeiten. LF: Schreiben – Überprüfen und Bearbeiten. YB: Konzeptualisierung, Schreiben – Überprüfung und Bearbeitung, Supervision.

Korrespondenz mit Yves Briers.

Unzutreffend.

Unzutreffend.

Die Autoren erklären, dass kein Interessenkonflikt besteht.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

. Tabelle S1: Übersicht über die in dieser Studie verwendeten Phagen.

. Tabelle S2: E. coli-Stämme, die gemäßigte Phagen der Gattungen Uetakevirus oder Lederbergvirus kodieren.

. Abbildungen S1–S3: Ähnlichkeitsmatrizen des RBP und seiner Domänen nach MUSCLE-Mehrfachsequenz-Alignment.

. Abbildung S4: Vorhergesagte Quartärstrukturen der Phagen-RBPs mit AlphaFold2.

. Abbildung S5: DNA-Sequenzmotive rund um die RBD weisen eine höhere Sequenzkonservierung auf als umliegende Regionen.

. Abbildungen S6–S8: Mehrfachsequenz-Alignments der Motiv-DNA-Sequenzen der RBPs von Phagen im endgültigen Datensatz.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/. Der Creative Commons Public Domain Dedication-Verzicht (http://creativecommons.org/publicdomain/zero/1.0/) gilt für die in diesem Artikel zur Verfügung gestellten Daten, sofern in einer Quellenangabe für die Daten nichts anderes angegeben ist.

Nachdrucke und Genehmigungen

Pas, C., Latka, A., Fieseler, L. et al. Die Phagen-Tailspike-Modularität und der horizontale Gentransfer zeigen die Spezifität gegenüber E. coli-O-Antigen-Serogruppen. Virol J 20, 174 (2023). https://doi.org/10.1186/s12985-023-02138-4

Zitat herunterladen

Eingegangen: 24. April 2023

Angenommen: 23. Juli 2023

Veröffentlicht: 07. August 2023

DOI: https://doi.org/10.1186/s12985-023-02138-4

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

AKTIE