Bakterielle Bioindikatoren ermöglichen die Klassifizierung des biologischen Zustands entlang der kontinentalen Donau
HeimHeim > Blog > Bakterielle Bioindikatoren ermöglichen die Klassifizierung des biologischen Zustands entlang der kontinentalen Donau

Bakterielle Bioindikatoren ermöglichen die Klassifizierung des biologischen Zustands entlang der kontinentalen Donau

May 01, 2024

Kommunikationsbiologie Band 6, Artikelnummer: 862 (2023) Diesen Artikel zitieren

698 Zugriffe

14 Altmetrisch

Details zu den Metriken

Trotz der Bedeutung von Bakterien in aquatischen Ökosystemen und ihrer vorhersehbaren Diversitätsmuster über Raum und Zeit hinweg mangelt es weitgehend an Biomonitoring-Tools zur Zustandsbewertung, die auf diesen Organismen basieren. Dies ist teilweise auf unzureichende Daten und Modelle zurückzuführen, um zuverlässige mikrobielle Prädiktoren zu identifizieren. Hier zeigen wir, dass Metabarcoding in Kombination mit multivariaten Statistiken und maschinellem Lernen die Identifizierung bakterieller Bioindikatoren für bestehende Systeme zur Klassifizierung des biologischen Status ermöglicht. Die Dynamik der bakteriellen Beta-Diversität folgt Umweltgradienten und die beobachteten Zusammenhänge verdeutlichen potenzielle Bioindikatoren für ökologische Ergebnisse. Räumlich-zeitliche Verbindungen, die sich über die mikrobiellen Gemeinschaften entlang des Flusses erstrecken, ermöglichen eine genaue Vorhersage des biologischen Zustands flussabwärts anhand von Informationen flussaufwärts. Netzwerkanalysen zu Amplikonsequenzvearianten identifizieren die Gattungen Fluviicola, Acinetobacter, Flavobacterium und Rhodoluna als gute Indikatoren und zeigen Informationsredundanz zwischen Taxa, was mit taxonomischer Verwandtschaft übereinstimmt. Die Redundanz zwischen bakteriellen Bioindikatoren zeigt sich gegenseitig ausschließende Taxa, die eine genaue Modellierung des biologischen Status mit nur 2–3 Amplikonsequenzvarianten ermöglichen. Daher zeigen unsere Modelle, dass die Verwendung einiger bakterieller Amplikonsequenzvarianten aus weltweit verbreiteten Gattungen eine Bewertung des biologischen Zustands entlang von Flusssystemen ermöglicht.

In den letzten Jahrzehnten sind die Erhaltung und Wiederherstellung gefährdeter Flussökosysteme weltweit von zentraler Bedeutung geworden. In Europa stützt sich die Bewertung des ökologischen Zustands auf mehrere Indikatoren, darunter physikalische, chemische und biologische Parameter. Biologische Indikatoren umfassen verschiedene Komponenten der in Süßwasserökosystemen lebenden Gemeinschaften: Fische, Makrowirbellose, Wasserflora einschließlich Phytoplankton, Phytobenthos und Makrophyten. Bisher wurde Prokaryoten wenig Aufmerksamkeit geschenkt1,2,3, mit Ausnahme der gesundheitsbezogenen Wasserqualitätsbewertung, beispielsweise für Bade- oder Trinkwasser4,5,6,7.

Prokaryoten reagieren aufgrund ihrer geringen Größe und ihres hohen Oberflächen-Volumen-Verhältnisses äußerst empfindlich auf Umweltveränderungen, einschließlich Schwankungen bei Nähr- und Schadstoffen, selbst bei sehr geringen Konzentrationen8. Diese Fähigkeit macht sie zu perfekten Kandidaten als Bioindikatoren und Frühwarnwächter, die schnell auf jedes Anzeichen von Stress in der Umwelt reagieren können9. Der Bedarf an biologischen Indizes auf der Grundlage von Prokaryoten wurde mehrfach von verschiedenen Autoren betont und es wurden mehrere Ansätze vorgeschlagen, um diese Gemeinschaften in die aktuellen Biomonitoring-Netzwerke für Süßwasser- und Meeresumgebungen einzubeziehen10.

Erste Versuche, bakterielle Taxa zu identifizieren, die als Bioindikatoren für die Charakterisierung des biologischen Status geeignet sind, wurden von Fortunato et al.11 im Columbia River und seiner Mündung durchgeführt. Sie konnten mehrere Taxa von Bakterioplanktongemeinschaften identifizieren, die für verschiedene Jahreszeiten und Lebensraumtypen spezifisch sind. Aylagas et al.12 gingen noch einen Schritt weiter und verwendeten einen biologischen Statusindex auf Basis benthischer Makroinvertebraten als methodische Grundlage, um unter Verwendung bakterieller Taxa aus der 16S-rRNA-Amplikonsequenzierung einen vergleichbaren Index zu entwickeln. Bakterientaxa wurden entsprechend ihrer positiven oder negativen Assoziation mit organischen und anorganischen Schadstoffeinträgen in zwei ökologische Gruppen eingeteilt. Der von ihnen entwickelte microgAMBI-Index basiert auf der relativen Häufigkeit der Taxa, die jeder der beiden ökologischen Gruppen zugeordnet sind. Darüber hinaus zeigte diese Studie eine signifikante Korrelation zwischen dem neu entwickelten Bakterienindex und der traditionellen Klassifizierungsmethode auf der Grundlage von Makrowirbellosen auf, wobei erstere in einigen Fällen eine bessere Leistung zeigte. Dabei wurde betont, dass Bakterien und der ökologische Zustand miteinander verknüpft sein können und dass auf Bakterien basierende Indizes gültige Anhaltspunkte für die Umweltverträglichkeitsprüfung und die Klassifizierung der Wasserqualität in Küstengebieten sein können.

In einer aktuellen Studie schlugen Cordier et al.10 vor, Umweltgenomik und maschinelle Lernwerkzeuge zu kombinieren, um zuverlässige Routinen zur Bewertung des ökologischen Qualitätszustands zu entwickeln. Sie schlugen die Verwendung überwachter Algorithmen für maschinelles Lernen vor, die eine diskrete Variable (wie die bereits verwendeten für den ökologischen Qualitätsstatus) erfordern, die aus kontinuierlichen Werten biologischer Indikatoren abgeleitet wird, die durch morphologische Taxa-Identifizierung ermittelt werden. Das Lernen von Entscheidungsbäumen vermeidet das mit anderen Algorithmen verbundene Black-Box-Problem, da es die Untersuchung einzelner Modellbäume ermöglicht und so ein Verständnis für die Dynamik relevanter Taxa gewinnt. Durch die gleichzeitige Bewertung von Metabarcoding und morphologischer Taxa-Identifizierung könnte ein prädiktives Biomonitoring-Modell erstellt werden, indem es auf Datensätzen mit bekannter Klassifizierung des ökologischen Zustands trainiert wird. Erstens könnte ein solcher Ansatz mehrere Probleme lösen, die mit dem Fehlen eines taxonomischen Rahmens und der Notwendigkeit detaillierter taxonomischer Datenbanken zusammenhängen. Diese Probleme werden durch das Modell während der Trainingsphase gelöst, da die ökologische Rolle der Taxa (z. B. operative taxonomische Einheiten oder Amplikonsequenzvarianten) und ihre Assoziation mit der gesamten Gemeinschaft automatisch vom Hintergrundrauschen getrennt werden10. Zweitens können Genomdaten von Managern leicht interpretiert werden, ohne dass es zu Unstimmigkeiten kommt, die typischerweise mit der Morpho-Taxonomie einhergehen. Daher könnte die Datenerfassung und -verarbeitung vollständig automatisiert werden. Drittens ist dieser molekulare Ansatz auch kosteneffizient und könnte zeitlich und räumlich für konsistente Biomonitoring-Programme über Länder und Jahre hinweg erweitert werden.

In unserer Arbeit integrieren wir diese Ansätze mithilfe von Entscheidungsbaum-Lernalgorithmen, um potenzielle bakterielle Bioindikatoren in der Planktongemeinschaft der Donau von der Quelle bis zur Mündung zu erkennen. Hier möchten wir eine Methode zur Identifizierung zuverlässiger bakterieller Bioindikatoren zur Charakterisierung und Vorhersage ökologischer Muster wie des ökologischen Zustands und der Wasserqualität der Donau etablieren. Wir gehen davon aus, dass die Mobilität von Organismen im Fluss dafür sorgt, dass die Zusammensetzung der stromaufwärts gelegenen Gemeinschaft aussagekräftig für flussabwärts gelegene ökologische Ergebnisse ist, wie z. B. den ökologischen Zustand anhand des Saprobic-Index und der Chlorophyll-Konzentration. Darüber hinaus haben wir multivariate Statistiken angewendet, um geeignete Bioindikatoren basierend auf der Prävalenz und Varianz prokaryotischer Taxa3 im Zusammenhang mit Umweltfaktoren zu ermitteln, als Momentaufnahme-Ansatz, der die räumliche Abhängigkeit der Standorte nicht berücksichtigt. Abschließend verglichen wir die Ergebnisse des Snapshot- und des räumlich-zeitlichen Ansatzes, um die Effizienz und Übertragbarkeit bakterieller Bioindikatoren für die Bewertung des biologischen Zustands des Flussökosystems im Rahmen von Erhaltungs- und Wiederherstellungsbemühungen zu bewerten.

Die Ergebnisse der Prävalenz-/Varianzanalyse der Daten zur relativen Häufigkeit von Amplikonsequenzvarianten (ASV) zeigten, dass die sechs relevantesten Phyla in dieser Reihenfolge Actinobacteriota, Bacteroidota, Verrucomicrobiota, Proteobacteria, Cyanobacteria und Planctomycetota waren (Abb. 1). Beispielsweise nahm die relative Häufigkeit von Actinobacteriota in den unteren Teilen des Flusses lokal deutlich zu. Die dbRDA ergab einen positiven Zusammenhang zwischen einem erhöhten Beitrag von Actinobacteriota und sinkenden pH-Werten und Wassertemperaturen, die für Flussabschnitte näher an der Mündung charakteristisch sind. Andererseits hatte Bacteroidota einen höheren Beitrag im Quellwasser, was offenbar mit höheren Stickstoffbelastungen, pH-Werten und höherer Leitfähigkeit zusammenhängt. Andere Phyla, die ebenfalls hohe Varianzen aufwiesen, wie Verrucomicrobiota und Proteobacteria, zeigten einen engen Zusammenhang mit Umweltparametern wie der Chlorophyll-a-Konzentration, einem hohen pH-Wert und der Entfernung zur Flussmündung, was wiederum mit einer zunehmenden Nährstoffbelastung zu den flussaufwärts gelegenen Standorten verbunden war.

a Dynamik der Phyla unter allen Probenahmestellen. Die Proben werden von links (stromaufwärts) nach rechts (stromabwärts) mit zunehmendem Abstand von der Quelle angeordnet. b Bakterienstämme mit der höchsten Prävalenz unter den Probenahmestellen und der höchsten Varianz; Die sechs farbigen Punkte sind aufgrund ihrer breiten Präsenz und großen Varianz in verschiedenen Umgebungen die Taxa, die sich am besten als biologische Indikatoren eignen (hervorgehoben in den Ellipsen). c Die RDA zeigt die Beziehungen jedes der 6 identifizierten Phyla zu den Umweltfaktoren. Dies bietet die Grundlage, die Dynamik einzelner Phyla mit Umwelteigenschaften zu verknüpfen; Das heißt, Actinobacteria tragen mehr zur Gemeinschaft an der Flussmündung bei, während Bacteriodota an der Quelle und Verrucomicrobia mit der Chlorophyll-a-Konzentration in relativer Häufigkeit zunehmen. Ähnliche Analysen zu Bakterienklassen und -familien sind in den ergänzenden Abbildungen dargestellt. 4 und 5.

Dementsprechend konnten Taxa mit Indikatorpotenzial für die Beurteilung des biologischen Status auch auf niedrigeren taxonomischen Ebenen (Klassen-, Familien- und Gattungsebene) identifiziert werden. Auf Gattungsebene (Abb. 2) waren die sechs wichtigsten Kandidaten-Bioindikatoren: hgcI_clade, CL500-29 marine group, Flavobacterium, Limnohabitans, Candidatus_Methylopumilus und Sediminibacterium. Diese dbRDA-Ergebnisse betonen, dass eine Differenzierung der Bakteriengemeinschaftsstruktur mit der Abfolge von Lebensräumen entlang des Flusssystems in Verbindung gebracht werden kann, wobei eine hohe (Stamm) bis niedrige (Gattung) taxonomische Auflösung verwendet wird.

a Dynamik der Gattungen unter allen Probenahmestellen. Die Proben werden von links (stromaufwärts) nach rechts (stromabwärts) mit zunehmendem Abstand von der Quelle angeordnet. b Bakteriengattungen mit der höchsten Prävalenz an den Probenahmestellen und der höchsten Varianz; Die 15 farbigen Punkte sind aufgrund ihrer breiten Präsenz und großen Varianz in verschiedenen Umgebungen die Taxa, die sich am besten als biologische Indikatoren eignen (hervorgehoben in den Ellipsen). c Die RDA zeigt die Beziehungen jeder der 15 identifizierten Gattungen zu den Umweltfaktoren. Dies bietet die Grundlage, die Dynamik einzelner Gattungen mit Umwelteigenschaften zu verknüpfen; Das heißt, Canditatus Methylopumilus trägt mehr zur Gemeinschaft an der Flussmündung bei, während Limnohabiter an der Quelle und Flavobacterium spp. Zunahme der relativen Häufigkeit mit dem pH-Wert. Ähnliche Analysen zu Bakterienklassen und -familien sind in den ergänzenden Abbildungen dargestellt. 4 und 5.

Um die Nichtlinearität und Eignung der bakteriellen Beta-Diversität für die Klassifizierung zu untersuchen, führten wir eine Modellierung mit Extreme Gradient Boosting (XGboost) durch. Das Modell für die paarweise Zusammensetzung der Bakteriengemeinschaft Bray-Curtis-Unähnlichkeiten entlang des Chlorophyll-Gradienten zeigte klare nichtlineare Muster (Abb. 3) mit einem R-Quadrat-Wert von 0,32. Wir haben Schwellenwerte identifiziert, bei denen sich die Zusammensetzung der Gemeinschaft stärker als im Durchschnitt änderte, beispielsweise bei Chlorophyll-A-Konzentrationen von 1, 2,5 und 5,5 mg/l.

Die Farbskala stellt die zwischen Standorten berechneten Bray-Curtis-Unähnlichkeitswerte dar. Die Achsen stehen für die Chlorophyll-Konzentration (mg·L−1) an jedem Standort. In (a) werden die beobachteten Beta-Diversitätsmuster entlang des Chlorophyll-a-Gradienten dargestellt, wie mit XGboost modelliert. In (b) wird eine hypothetische Beziehung dargestellt, bei der die Unähnlichkeit zwischen Gemeinschaften linear als Funktion des Unterschieds im Chlorophyll a zwischen Standorten zunimmt. Der Mittelwert der Reaktionsoberfläche in (a) kann als Basis-Beta-Diversität über alle Standorte hinweg behandelt werden. Datenpunkte mit Werten unterhalb des Mittelwerts stellen eine höhere Ähnlichkeit zwischen Standorten dar; Ebenso bedeuten höhere Werte eine geringere Ähnlichkeit. Um die Reaktionsflächen der beobachteten Werte zu interpretieren, kann man zunächst einen Punkt am Rande der Diagonale betrachten und dann einer Reihe von Punkten weiter oben auf der Chlorophyll-a-Achse folgen. Hier zeigt ein Grat an, dass eine Chlorophyll-Konzentration ein wahrscheinlicher Schwellenwert ist, ab dem die Verschiebung der Zusammensetzung der Bakteriengemeinschaft größer als der Durchschnitt ist. In gleicher Weise weist ein Tal auf eine Chlorophyll-Konzentration hin, die sich wahrscheinlich in einem Intervall des Chlorophyll-A-Gradienten befindet, entlang dem sich Bakteriengemeinschaften nicht wesentlich verschieben. Weitere Einzelheiten zum XGboost-Ansatz und seiner Interpretation finden sich in Fontaine et al.57.

Der räumlich-zeitliche Ansatz identifizierte mehrere Kombinationen von ASVs als gute Prädiktoren sowohl für die Klassifizierung der Wasserqualität (gemäß dem Saprobic Index) als auch für die Chlorophyll-a-Konzentration. Wir haben die Netzwerkanalyse auf die informativsten ASVs konzentriert, die durch einen Schwellenwert des 95. Perzentils in Bezug auf das Auftreten in den Vorhersagemodellausgaben definiert sind. Wie in Abb. 4 dargestellt, bildeten diese ASVs ein verbundenes Ko-Ausschlussnetzwerk. Obwohl einige der ASVs bessere Prädiktoren zu sein schienen als andere, erwies sich keines als unverzichtbar, um die genauesten Vorhersagen zu erhalten. ASVs, die sich als die besten Prädiktoren erwiesen haben, könnten in Kombinationen von zwei oder drei ASVs zusammengestellt werden, um die höchstmögliche Genauigkeit zu erzielen. Die einfachsten Vorhersagemodelle mit perfekter Genauigkeit wurden mit einem Fluviicola-Vertreter gepaart mit entweder einem Acinetobacter oder einem Flavobacterium erhalten. Rhodoluna (Klasse Actinobacteriia) und Flavobacterium (Klasse Bacteroidia) wurden hinsichtlich der Häufigkeit ihres Vorkommens als die wichtigsten Taxa im Hinblick auf den Informationsgehalt für die Vorhersage des biologischen Status identifiziert. Die anderen sechs der acht informativsten ASVs gehörten zur marinen Gruppe CL500-29 (Klasse Acidimicrobiia), Alterythrobacter (Klasse Alphaproteobacteria), der aquatischen Gruppe MWH-UniP1 (Klasse Gammaproteobacteria) und zwei gehörten zu Acinetobacter (Klasse Gammaproteobacteria).

Farben repräsentieren die jeweiligen Bakterienklassen, zu denen die ASVs gehören. In einem Netzwerk mit gleichzeitigem Vorkommen stellt der Knotendurchmesser die Anzahl des Vorkommens jedes Taxons in den besten Modellen dar, während die Dicke der Verbindungslinien die Anzahl des gleichzeitigen Vorkommens von ASV-Paaren darstellt. b Co-Exklusion-Netzwerk. Links stellen Taxa dar, die in demselben Modell nie zusammen vorkamen.

Es wurde festgestellt, dass insgesamt 168 ASVs in verschiedenen Kombinationen vollkommen genaue Modelle für die Klassifizierung des biologischen Status ergaben, während 25 im besten Modell für Chlorophyll a vorhanden waren. Die Mehrzahl der ASVs gehörte zum Stamm der Proteobakterien, wobei die Klassen der Gammaproteobakterien und Alphaproteobakterien am häufigsten vorkommen. Bakterien der Klasse Bacteroidia waren gemessen an der Anzahl der als gute Prädiktoren identifizierten ASVs die zweitwichtigste Klasse, gefolgt von der Klasse Actinobacteria. Wie in Abb. 5 hervorgehoben, lieferten 20 ASVs, die vier Bakterienklassen zugeordnet waren, genaue Vorhersagen sowohl für die Klassifizierung des biologischen Status als auch für die Eutrophierung, wobei die meisten von ihnen der Klasse der Gammaproteobakterien zugeordnet waren. Einer davon, ein Acinetobacter-Vertreter, wird ebenfalls zu den Top-Prädiktoren der Netzwerkanalyse gezählt. Die Klasse Bacteroidia war die zweitwichtigste Klasse in Bezug auf die Anzahl der ASVs, die gute Prädiktoren sowohl für die Klassifizierung des biologischen Status als auch für die Chlorophyll-A-Konzentration waren, gefolgt von Verrucomicrobiae und nur einem ASV, der zur Klasse Bacilli gehörte. Fünf zu den Actinobakterien gehörende ASVs wurden lediglich als gute Prädiktoren für die Chlorophyll-a-Konzentration identifiziert.

Farben stellen Bakterienklassen dar, während Symbole die Variable darstellen, für die ein ASV als Prädiktor identifiziert wurde. Die horizontale Position der Knoten im Dendrogramm gibt an, auf welcher taxonomischen Ebene sie vorkommen, markiert durch gepunktete Linien vom Königreich zur Gattung. Das Histogramm stellt die relative Häufigkeit des Auftretens jedes ASV in den Modellausgaben dar.

Die Vorhersagegenauigkeit der Modelle war für Chlorophyll a in den verschiedenen Flussabschnitten unterschiedlich. Während die Modelle nur für das mittlere Transekt ein R-Quadrat von 0,98 ergaben, betrug das globale R-Quadrat für alle drei Transekte 0,86. Im Gegensatz dazu betrug die Genauigkeit der besten Vorhersagemodelle zur Wasserqualitätsklassifizierung für die drei Transekte (linke, rechte und mittlere Beobachtungen) immer 100 %.

Diese Studie unterstreicht das Potenzial der Identifizierung bakterieller Bioindikatoren für die Bewertung des biologischen Zustands von Flussökosystemen anhand bakterieller Metabarcoding-Daten, trotz methodischer Einschränkungen wie Variationen in der Kopienzahl13, PCR-Verzerrungen14, dem Zusammensetzungscharakter der Sequenzierungsdaten15 sowie anderer Einschränkungen16. Sowohl der Prävalenz-/Varianz- als auch der räumlich-zeitliche Ansatz, der in dieser Studie verwendet wurde, lieferten vergleichbare Ergebnisse in Bezug auf mögliche bakterielle Bioindikatoren und zeigten, dass dominante bakterielle Taxa ökologisch informativ sein können. Somit könnten beide Ansätze die derzeit implementierten morphologiebasierten Methoden ergänzen und erweitern, um eine ökologische Qualitätsbewertung zu erstellen, jedoch auf schnellere und kostengünstigere Weise. Der räumlich-zeitliche Ansatz ist ein vollständig datengesteuertes Ansatzklassifizierungssystem und kann iterativ aktualisiert werden, wodurch das disruptive Potenzial von Metabarcoding und maschinellem Lernen für das Biomonitoring freigesetzt werden kann. Proben aus der Routineüberwachung können die Trainingsdaten in Echtzeit ergänzen und die Modellvorhersagen weiter verbessern und auf lange Sicht den größten Teil des möglichen Umgebungsbedingungenraums abdecken.

Zu den möglichen zukünftigen Verbesserungen unseres Ansatzes gehören die menschliche Interpretierbarkeit und die Erleichterung des Verständnisses der trainierten Modelle. Dies ist entscheidend für einen reibungslosen Übergang zu maschinellen Lernansätzen bei komplexen Entscheidungsproblemen17. Mittlerweile stehen mehrere Tools zur Verfügung, die es ermöglichen, die Vorhersagen zu erklären, indem sie die Merkmale der Daten identifizieren, die zu einer bestimmten Vorhersage beitragen18. Solche Ansätze werden es Biologen und Ökologen außerdem ermöglichen, die Modellentwicklung zu bewerten und zu steuern, ohne in die Vorbehalte des maschinellen Lernens zu geraten10.

Durch die Verwendung des räumlich-zeitlichen Ansatzes kann eine genaue Modellierung des biologischen Status und der Chlorophyllkonzentration erreicht werden, die nur auf kleinen Sätzen von ASVs basiert, sofern diese über eine hohe Vorhersagekraft verfügen und hinsichtlich des Informationsgehalts komplementär sind. Dass sich eine genaue Modellierung des biologischen Status auf nur zwei bis drei ASVs stützen kann, eröffnet Möglichkeiten für verschiedene Ansätze zur Identifizierung von Bioindikatoren. Dazu gehören Systeme zur Identifizierung vor Ort unter Verwendung von Biosensoren wie ökogenomischen Sensoren oder kleinen mikrofluidischen Lab-on-Chip-Geräten, die auf identifizierte Bioindikatoren für die allgemeine Klassifizierung des ökologischen Zustands abzielen könnten. Point-of-Care- und Echtzeit-Sensorgeräte könnten das wahre Potenzial von Mikroben in aktuellen Biomonitoring-Netzwerken und Biodiversitätsvorhersagen erschließen, wie es bereits in der Wettervorhersage zu sehen ist.

Die Prävalenz-/Varianzanalyse auf Klassen- und Gattungsebene ergab, dass mehrere Taxa, die zum dominanten Stamm der Actinobacteriota gehören, die aussagekräftigsten für Veränderungen der Umwelteigenschaften sind. Der Stamm der Actinobacteriota umfasst Taxa, die typischerweise in verschiedenen Süßwasserumgebungen vorkommen19 und spielt eine zentrale Rolle bei den heterotrophen biogeochemischen Prozessen in Flussökosystemen20. Sie scheinen stark vom pH-Wert und den Nährstoffkonzentrationen beeinflusst zu werden, die sich aufgrund ihrer geringen Wachstumsraten oft negativ auf ihre Häufigkeit auswirken19,21,22,23 und die Ergebnisse unserer Analyse bestätigen ihre Umweltpräferenzen. Ihr höheres Vorkommen im Unterlauf der Donau könnte auf die geringeren Nährstoffkonzentrationen und den Gehalt an organischer Substanz infolge von Verdünnungseffekten zurückzuführen sein, während ihr geringeres Vorkommen im Oberlauf des Flusses auf den negativen Zusammenhang zwischen Schwebeteilchen und diesem zurückzuführen sein könnte Taxon11,24,25.

Bei der Fokussierung auf die Achsen der RDA-Visualisierung (Abb. 1 und 2) widersprachen Bacteroidota diesem Trend und waren eher mit den oberen Flussläufen verwandt, mit höheren Nährstoffeinträgen, höherer Leitfähigkeit und starker Abhängigkeit von nahegelegenen Wäldern und Grundwasserquellen26. Flavobacterium (Klasse Bacteroidia) war die dritte wichtige Gattung, die in der Prävalenz-/Varianzanalyse mit der höchsten Häufigkeit in den flussaufwärts gelegenen Bereichen hervorgehoben wurde, was eine Präferenz für eutrophischere Umgebungen zeigt. Das Häufigkeitsmuster dieses Stammes hängt wahrscheinlich mit dem vorherrschenden Eintrag widerspenstiger organischer Substanz aus der Uferzone und den Wäldern zusammen. Aus der Literatur geht hervor, dass die mikrobielle Gemeinschaft im Quellwasser ihre Hauptquelle wahrscheinlich in den Boden- und Grundwassergemeinschaften hat, die in den Oberlauf der Donau treiben26,27. Bacteroidota haben sich bereits zuvor als gute Indikatoren für anthropogene Verschmutzung und Auswirkungen der Landwirtschaft auf Süßwasserökosysteme erwiesen28. Echtzeit-qPCR wird normalerweise verwendet, um mit diesem Taxon in Zusammenhang stehende Genmarker in Flusssystemen, die von Abwässern aus Kläranlagen betroffen sind, und in Aquakultursystemen zu identifizieren. Dies zeigt, dass Bacteroidota bei der Bestimmung des Verschmutzungsgrads zuverlässig ist29,30,31,32,33. In unserer Studie standen Taxa der Klasse Bacteroidota in eindeutigem Zusammenhang mit dem biologischen Zustand der Donau, was ihre potenzielle Relevanz für das Biomonitoring in Flussökosystemen weiter bestätigte.

Proteobakterien waren eine weitere Gruppe, die durch die Varianz-/Prävalenzanalyse als Bioindikatoren hervorgehoben wurde, wobei die Gattung Limnohabitans – ein Vertreter der Klasse Gammaproteobakterien – als Indikator für eutrophische Bedingungen identifiziert wurde. Andere Mitglieder der Klasse der Gammaproteobakterien, wie z. B. E. coli, sind wichtige und empfindliche Indikatoren für die fäkale Verschmutzung in aquatischen Ökosystemen und Wasserressourcen. Ihre Zahlen werden traditionell durch standardisierte kulturbasierte Zählmethoden5,34 erhoben. Sehr interessant ist, dass Cyanobakterien in Flussabschnitten, die durch eine höhere Chlorophyll-a-Konzentration gekennzeichnet sind, eine relativ geringe Häufigkeit aufwiesen. Dieses Muster mag kontraintuitiv erscheinen, hängt aber höchstwahrscheinlich mit der Häufigkeit von Grünalgen und Kieselalgen in der Phytoplanktongemeinschaft zusammen, die im Vergleich zu ihren bakteriellen Gegenstücken einen größeren Einfluss auf die Chlorophyll-a-Konzentrationen hatten35.

Aus beiden in dieser Studie umgesetzten Ansätzen geht hervor, dass ASVs, die zu den dominanten Taxa in der Bakteriengemeinschaft gehören, wie Actinobacteriota, insbesondere der Gattung Rhodoluna, Bacteroidota, insbesondere der Gattung Flavobacterium, sowie Proteobacteria, ebenfalls zu den besten Indikatoren für Verschiebungen gehören im biologischen Zustand der Wasserqualität in der Donau. Dieser Befund steht im Einklang mit den Ergebnissen von Fortunato et al.11, wo unter den mikrobiellen Gemeinschaften aus drei verschiedenen Umgebungen, die einen Salzgehaltsgradienten aufweisen, die besten Indikatoren für Veränderungen der Umweltfaktoren zu den am häufigsten vorkommenden Taxa gehörten.

Obwohl der räumlich-zeitliche Ansatz mehrere Kombinationen von ASVs identifizierte, die genaue Vorhersagen lieferten, traten viele häufig auftretende ASVs in keinem bestimmten Modell zusammen auf. Es kann davon ausgegangen werden, dass diese ASVs in Modellen nicht gleichzeitig vorkommen, da sie redundante Informationsinhalte enthalten. Das Ko-Ausschluss-Netzwerk (Abb. 4) ermöglicht die Identifizierung von Redundanzen im Informationsgehalt der informativsten ASVs. Diese Ergebnisse der Netzwerkanalysen legen nahe, dass es keine wirklich besten oder unverzichtbaren Bakterientaxa gibt, die Informationen über den biologischen Status und die Chlorophyllkonzentration liefern. Vielmehr ist eine bestimmte Menge an Informationen erforderlich, um genaue Modelle zu erhalten, die von mehreren Taxa mit unterschiedlichem Grad der Überlappung gemeinsam genutzt werden.

Obwohl in dieser Studie keine funktionalen Informationen zu Bakteriengemeinschaften verfügbar waren, ist es denkbar, dass ökologische Funktion und Informationsgehalt miteinander verknüpft sind. Redundante ASVs sollten Taxa sein, die ähnliche ökologische Nischen besetzen, allerdings ohne Konkurrenzausschluss. Die Redundanz und damit die Überlappung des ökologischen Informationsgehalts nimmt wahrscheinlich mit der phylogenetischen Verwandtschaft zwischen den Taxa zu, was durch eine größere Anzahl von Verbindungen zwischen eng verwandten Taxa im Co-Ausschlussnetzwerk veranschaulicht wird. Unter den besten Prädiktoren zeigten Vertreter derselben Klassen höhere Redundanzbeziehungen im Vergleich zu Taxa, die zu verschiedenen Phyla gehörten (Abb. 5). Dies wurde in einer früheren Studie gezeigt, in der die funktionelle Kohärenz zwischen eng verwandten Taxa von niedrigen (Arten) bis zu hohen (Stamm) taxonomischen Niveaus reichte36. Gleichzeitig können Bakterien verschiedenen ökologischen Gruppen angehören und sich taxonomisch auf der Ebene eines einzelnen Nukleotids in einem 16S-rRNA-Tag unterscheiden37.

Funktionelle Kohärenz kann in taxonomischen Datensätzen durch Gen-Degeneration und horizontalen Gentransfer verdeckt werden. Studien zum Vergleich der Biobewertungsleistungen verschiedener taxonomischer Ebenen zeigten jedoch, dass einige höhere Taxa (insbesondere die Gattungsebene) im Vergleich zur Artenebene in den Eukaryoten relativ präzise und effizient sein könnten38,39. Andere betonten den Vorteil gemischter taxonomischer Ebenen, um die taxonomischen Details an den Informationsgehalt jeder Gruppe anzupassen40. Redundante ASVs, die zur gleichen hohen taxonomischen Ebene gehören wie in unserer Studie identifiziert, bestätigen das Potenzial für einen hohen Informationsgehalt auf hohen taxonomischen Ebenen. Darüber hinaus können diese taxonomischen Gruppen Bioindikatoren mit hohem Informationsgehalt in einem breiten Spektrum von Flusssystemen enthalten, auch wenn nicht genau dieselben ASVs vorhanden sind, die in unserer Studie identifiziert wurden.

Um die wahre Natur des Signals hinter der Informationsredundanz zwischen Taxa zu identifizieren, kann argumentiert werden, dass die gesamte genomische Information aus mikrobiellen Gemeinschaften gewonnen werden muss. Dieser Idealfall des Zugriffs auf vollständige genomische Informationen würde die Identifizierung gemeinsamer funktioneller Merkmale und allgemeiner die Aufteilung des gesamten Informationsgehalts in einzelne Komponenten ermöglichen. Während Letzteres derzeit unrealistisch ist, kann man die Suche nach idealen Bioindikatoren mit der Hypothese beginnen, dass Cluster orthologer Gengruppen 16S-rRNA-ASVs überlegen sein sollten. Funktionelle Gene allein stellen jedoch möglicherweise nicht unbedingt eine Einheit ökologischer Informationen dar, da sie degeneriert oder Teil unvollständiger Stoffwechselwege sein können.

Die in unserer Studie gezeigte Gemeinschaftsdynamik bestätigt die Ergebnisse früherer Bakterioplanktonuntersuchungen in anderen Flussökosystemen41,42,43 sowie in der Donau selbst26. Es scheint, dass die Abfolge des Bakterioplanktons selbst in verschiedenen Flussökosystemen auf der ganzen Welt ähnlichen Bahnen folgt, wobei die Gemeinschaften flussaufwärts und flussabwärts recht unterschiedlich sind und eng mit der Verweildauer im Wasser zusammenhängen43. Wie von Read et al.43 vermutet, könnten flussaufwärts gelegene Flussabschnitte durch schnell wachsende Bakterientaxa gekennzeichnet sein, R-Strategen, die in der Lage sind, die Ressourcen zu verarbeiten; das wären die Bacteroidota. Wenn andererseits der Fluss größer wird, ist der Einfluss der Uferzone geringer und die Nährstoffverfügbarkeit wird aufgrund des Verdünnungseffekts und der verringerten Bioverfügbarkeit widerspenstiger Kohlenstoffquellen verringert. K-Strategen-Organismen wie die Actinobacteriota würden sich durchsetzen. Dieses wiederkehrende Muster der mikrobiellen Abfolge legt nahe, dass räumlich-zeitliche Vorhersagemodelle für alle Arten der biologischen und ökologischen Zustandsbewertung auf Flussökosysteme mit einer ähnlichen Bakterioplanktonzusammensetzung anwendbar sind.

Der Zusammenschluss mikrobieller Gemeinschaften über Gradienten hinweg kann Beziehungsmustern folgen, die von weitgehend linear bis eindeutig nichtlinear reichen. Daher stellt sich in dieser Studie die Frage nach der Natur solcher Beziehungen und nach der Frage, wie sie in einer Weise modelliert werden können, die mit natürlichen Mustern im Einklang steht. Wenn Beziehungen linearer Art sind, sollte eine kontinuierliche Antwortvariable modelliert werden, da dadurch unnötiger Informationsverlust durch die Diskretisierung eines Gradienten in Klassen vermieden wird. Ebenso ist eine ausgeprägte Nichtlinearität ein fruchtbarer Boden für einen Klassifizierungsansatz.

In unserer Studie weist das Auftreten abrupter und unterdurchschnittlicher Änderungsraten in der Zusammensetzung der Mikrobengemeinschaft entlang des Chlorophyll-A-Gradienten darauf hin, dass Bakteriengemeinschaften entlang bestimmter Flussabschnitte entlang des Fließwegs tendenziell einigermaßen homogen sind und sich deutlich über bestimmte Schwellenwerte hinaus ändern. Die letzte deutliche Verschiebung findet beispielsweise zwischen 5 und 6 mg Chlorophyll pro Liter statt, danach bleibt die Veränderungsrate der Bakteriengemeinschaft bis zum Ende des Gradienten etwa unterdurchschnittlich (Abb. 3). Konzentrationen von 6 mg Chlorophyll a/l und mehr können als natürlicher Bereich angesehen werden, der eutrophen Gewässern entspricht. Die nichtlineare Beziehung zwischen der Zusammensetzung der Bakterioplanktongemeinschaft entlang des Chlorophyll-Gradienten unterstützt einen allgemeinen biologischen Klassifizierungsansatz, lässt jedoch unbeantwortet, wie viele natürliche Klassen letztere besitzt und ob die Referenzklassen des Saprobic Index natürliche überlappen.

Bei der Schwellenwertanalyse wurden die Beobachtungen als unabhängig behandelt, während sie räumlich und zeitlich miteinander verbunden sind. Dies bedeutet, dass es zu Diskrepanzen in der Reaktionszeit der Gemeinschaftsbildung zwischen Primärproduzenten und dem Rest der mikrobiellen Gemeinschaft kommen kann, da sich Wassermassen bewegen und sich die Bedingungen schneller ändern, als ein Gleichgewicht erreicht werden kann. Bei der Zusammenführung von Nebenflüssen kann es vorkommen, dass Wassermassen zunächst nebeneinander fließen und sich erst nach vielen Kilometern gründlich vermischen44. Unsere Ergebnisse aus dem räumlich-zeitlichen Ansatz bezüglich Chlorophyll deuten in diese Richtung. Diese laminare vs. mischende Dualität spiegelt sich in einer höheren Modellgenauigkeit für den Midstream-Transekt wider und muss bei der Erstellung von Designmatrizen berücksichtigt werden. Beobachtungen links, rechts und in der Mitte des Stroms sollten daher hinsichtlich der Beobachtungsreihenfolge als separate räumliche Reihen behandelt werden. Die Gesamtgenauigkeit ist jedoch höher, wenn unterschiedliche Zeitreihen in ein Modell integriert werden, anstatt jede einzelne Zeitreihe einzeln zu verarbeiten. Um für die linken und rechten Transekte Genauigkeiten zu erreichen, die mit denen des Mittelflusses vergleichbar sind, ist es denkbar, dass die Werte, die für Verzögerungsstufen und Skalierung an den Zusammenführungsstellen der Nebenflüsse verwendet werden, von flussaufwärts gelegenen Stellen des Nebenflusses selbst und nicht vom Hauptfluss stammen müssen.

Um zu überprüfen, ob Bakterienindikatoren für die Vorhersage des biologischen Status robust sind, müsste man testen, ob die Gruppen, die bestimmten ökologischen Prozessen in einem Flusssystem zugrunde liegen, in gleicher Weise auf andere Flüsse und über Jahreszeiten hinweg zutreffen. Um die Eignung der in dieser Studie hervorgehobenen ASV-Kandidaten sowie die allgemeine Anwendbarkeit varianzbasierter und räumlich-zeitlicher ASV-Screeningmethoden aufzudecken, sind umfangreiche Trainingsdaten aus mehreren Flusssystemen erforderlich, um allgemeine und robuste Klassifizierungssysteme für die Umweltbewertung zu entwickeln basierend auf bakteriellen Daten. Es besteht auch Bedarf an einer Harmonisierung der Probenahmeprotokolle, der Vorbereitung der DNA-Bibliothek, der Generierung von Sequenzdaten und der nachgelagerten bioinformatischen Verarbeitung, um eine reproduzierbare Bewertung des biologischen Zustands in allen Flusssystemen zu erreichen.

Die Donau erstreckt sich über eine Länge von 2780 km, von ihrer Quelle im Schwarzwald in Deutschland, von wo aus sie durch zehn verschiedene Länder (Deutschland, Österreich, Slowakei, Ungarn, Kroatien, Serbien, Bulgarien, Rumänien, Moldawien und Ukraine) fließt und ihren Lauf in endet ein Delta am Schwarzen Meer. Sein Einzugsgebiet umfasst 801.500 km2 und wird von fast 81 Millionen Einwohnern bevölkert45. Das Wasser der Donau dient Industrie, Landwirtschaft und Menschen als Trinkwasserversorgung und Erholungsraum sowie als Transportweg, der mehrere Länder verbindet30.

Seit 2001 wird alle sechs Jahre die Gemeinsame Donauuntersuchung (JDS) von der Internationalen Kommission zum Schutz der Donau (IKSD)30,45,46 organisiert. Als umfassende Untersuchung von 2600 km der Donau (ergänzende Abbildung 1) ist das JDS eine der größten internationalen wissenschaftlichen Expeditionen mit dem Ziel, Daten über die Hydromorphologie des Flusses, die Dynamik mehrerer biologischer Gemeinschaften und die physikalisch-chemischen Eigenschaften des Wassers zu sammeln Parameter, Schadstoffe und mehr.

Wasserproben für die mikrobielle Gemeinschaft wurden von Hand aus dem Epilimnion in 1-L-Kolben entnommen, gleichzeitig wurden auch die physikalisch-chemischen Parameter des Wassers mit Handsonden gemessen. Die Probenentnahme von Makrowirbellosen erfolgte mithilfe eines Multi-Habitat-Sampling-Ansatzes47, bei dem verschiedene Teile des Flussbetts gestört wurden und die Makrowirbellosen mit einem Netz gesammelt wurden. An 60 Standorten wurden Proben vom linken und rechten Flussufer sowie der Flussmitte entnommen.

Alle Daten, Probenahmemethoden sowie Analysemethoden sind über die offizielle Website der Internationalen Kommission zum Schutz der Donau (ICPDR; http://www.icpdr.org/wq-db/) öffentlich verfügbar abschließender wissenschaftlicher Bericht48. Ausgewählte Daten aus JDS3 (2013) wurden zuvor in mehreren Studien veröffentlicht30,35.

Die Klassifizierung des ökologischen Zustands gemäß der Wasserrahmenrichtlinie wurde anhand von JDS3-Daten durchgeführt, die für einige der entlang des Flusses analysierten biologischen Gemeinschaften gesammelt wurden, darunter Makrowirbellose, Makrophyten, Fische und Phytoplankton. In verschiedenen Ländern werden unterschiedliche biologische Klassifizierungssysteme verwendet, und die Interkalibrierung der verschiedenen Methoden bleibt eine Herausforderung48. Der Saprobic-Index, der auf benthischen Makrowirbellosengemeinschaften basiert, ist eines der am besten etablierten Klassifizierungssysteme zur Bewertung des biologischen Zustands gemäß der WRRL und wird hauptsächlich zur Bewertung organischer Verschmutzung verwendet. Dies war das einzige Klassifizierungssystem, das in den verschiedenen Ländern entlang der Donau einheitlich verwendet wurde, und wurde daher in unserer Studie als biologisches Referenzklassifizierungssystem verwendet.

Genomische DNA wurde unter Verwendung eines leicht modifizierten Protokolls eines zuvor veröffentlichten Verfahrens auf Phenol-Chloroform- und Perlenschlagbasis extrahiert49 unter Verwendung von Isopropanol anstelle von Polyethylenglykol zur DNA-Fällung50. Die Gesamt-DNA-Konzentration wurde unter Verwendung des Quant-iT™ PicoGreen® dsDNA Assay Kit (Life Technologies Corporation, USA) bewertet und die 16S-rRNA-Genkonzentrationen in den DNA-Extrakten wurden unter Verwendung einer domänenspezifischen quantitativen PCR quantifiziert, wobei die Reaktionen 2,5 μl von 1:4 und enthielten 1:16 verdünnter DNA-Extrakt als Matrize, 0,2 μM der Primer 8F und 338, die auf die V1–V2-Region der meisten bakteriellen 16S-rRNA-Gene abzielen, und iQ SYBR Green Supermix (Bio-Rad Laboratories, Hercules, USA)26. DNA-Extrakte wurden im Hinblick auf die 16S-rRNA-Genkonzentrationen normalisiert, um eine standardisierte Anzahl bakterieller 16S-rRNA-Gen-Vorlagen für die Amplifikation und Barcode-Kennzeichnung in einem zweistufigen Barcode-Verfahren zu verwenden. Kurz gesagt, die Primer des ersten Schritts (341f und 805r) enthielten Adapter zum Einführen von Illumina-Adaptern und im zweiten Schritt wurden zwei Barcodes verwendet. Die PCR-Primer des ersten Schritts waren somit (Adaptersequenz, gefolgt von der Primersequenz) Adapter-341f ('5 - ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCCTACGGGNGGCWGCAG-3') und Adapter-805r ('5-AGACGTGTGCTCTTCCGATCTGACTACHVGGGTATCTAATCC-3'). Die erste Stufe der Amplikon-PCR (ampPCR) wurde in zweifacher Ausfertigung in 20-µL-Reaktionsmischungen durchgeführt, die 1 × Q5-Reaktionspuffer, 0,2 mM Dinukleosidtriphosphate (dNTPs), 0,5 µmol L−1 Vorwärts- und Rückwärtsprimer und 0,4 U Q5 High-Fidelity enthielten DNA-Polymerase (New England BioLabs) sowie Umwelt-DNA als Vorlage, die vor der Barcode-Kennzeichnung auf gleiche Mengen an 16S-rRNA-Genkopien normalisiert wurde, um die Vergleichbarkeit zu erhöhen und PCR-Bias zu reduzieren. Die Zyklusbedingungen für die ampPCR im ersten Schritt waren 1 Minute lang 98 °C, gefolgt von 20 Zyklen mit 10 Sekunden lang 98 °C, 30 Sekunden lang 62 °C, 30 Sekunden lang 72 °C und einer abschließenden Verlängerung bei 72 °C 2 Minuten. Die doppelten Produkte wurden gepoolt und unter Verwendung des Agencourt AMPure XP-Reinigungssystems (Beckman Coulter) gereinigt. Der zweite PCR-Schritt enthält variable Kombinationen von Primern mit unterschiedlichen Multiplex-Identifikatoren für probenspezifisches „Barcoding“ (vorwärts, AATGATACGGCGACCACCGAGATCTACAC-[index]-ACACTCTTTCCCTACACGACG; rückwärts, CAAGCAGAAGACGGCATACGAGAT-[index]-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT), die an die Adapter des ersten Schritts binden und unter Einbeziehung von Illumina-Adaptern wurde in einzelnen 20-µL-Reaktionen durchgeführt. Die Reaktionen enthielten 1 × Q5-Reaktionspuffer, 0,2 mmol L-1-Dinukleosidtriphosphate (dNTPs), 0,25 µmol L-1-Vorwärts- und Rückwärtsindexprimer, 0,4 U Q5-High-Fidelity-DNA-Polymerase (New England BioLabs) und 2 µl gereinigte Amplifikate aus 1. Schritt ampPCR als Vorlage. Die Zyklusbedingungen für die 2. Schritt-Index-PCR (idxPCR) waren 98 °C für 1 Minute, gefolgt von 15 Zyklen mit 98 °C für 10 s, 66 °C für 30 s, 72 °C für 30 s und einer abschließenden Verlängerung bei 72 °C für 2 Min. PCR-Produkte (Amplikonbibliotheken) wurden wie oben beschrieben gereinigt und mit dem PicoGreen-Kit (Life Technologies) quantifiziert. Die Produkte wurden in der SciLifeLab SNP/SEQ-Sequenzierungseinrichtung an der Universität Uppsala, Uppsala, Schweden, auf einem Illumina MiSeq (2 × 300 bp) in zwei Läufen sequenziert.

Rohsequenzdaten von JDS3 aus verschiedenen Sequenzierungsläufen wurden separat verarbeitet. Nach der automatischen Demultiplexierung der rohen Amplikon-Sequenzierungsdaten durch die Illumina MiSeq-Sequenzierungssoftware in 675 einzelne Proben (einschließlich 66 technischer und 329 biologischer Replikatpaare) aus zwei Sequenzierungsläufen für JDS3 wurden Primer mit dem CUTADAPT-Tool51 entfernt und Sequenzen ohne passende Primer verworfen. Das R-Paket dada2 (Version 1.8)52 wurde für die De-Replikation, Rauschunterdrückung und Sequenzpaarverkettung verwendet. Nach manueller Überprüfung der Qualitätsscore-Plots wurden Vorwärts- und Rückwärtsablesungen der bakteriellen 16S-rRNA-Genamplikons auf eine Länge von 260 bzw. 200 bp gekürzt und Reads mit einem einzelnen Phred-Score unter 10 wurden entfernt. Nach der Dereplikation der Lesevorgänge wurden Vorwärts- und Rückwärtsfehlermodelle mithilfe einer Teilmenge von ~107 Sequenzlesevorgängen erstellt. Chimären wurden mit der Funktion „removeBimeraDenovo“ in „dada2“ entfernt. Die Taxonomie wurde mithilfe des Bayes'schen Klassifikators und der nichtredundanten SILVA-Datenbank 13853,54 zugewiesen. Als nächstes wurden 329 biologische Replikatpaare für den JDS3-Datensatz zusammengeführt und gemittelt, um die endgültige Tabelle der Amplicon-Sequenzvarianten (ASVs) zu erhalten. Der für diese Studie berücksichtigte Datensatz umfasste die linken, rechten und mittleren Transekte der Donau und umfasste insgesamt 160 Proben, nach Ausschluss von Proben von Nebenflussstandorten. Chloroplastische, mitochondriale, eukaryotische und archaeale ASVs wurden mit dem Phyloseq-Paket Version 1.40.0 entfernt, was zu 3509 bakteriellen ASVs führte. Einzelheiten zu Proben- und Sequenzdaten finden Sie in der Ergänzungstabelle 1.

Der für die Sequenzdatenverarbeitung verwendete Code ist auf Github verfügbar – https://github.com/alper1976/danube_indicators (https://doi.org/10.5281/zenodo.8193431)55.

Statistische Analysen und Diagrammerstellung wurden in R Version 4.0.2 (12.12.2019; R Core Team, 2014) durchgeführt. Aus der ASV-Tabelle haben wir vier Datensätze erstellt und die ASVs auf Stamm-, Klassen-, Familien- und Gattungsebene gruppiert. Für jeden der vier Datensätze haben wir die Prävalenz (Häufigkeit des Auftretens an jeder Probenahmestelle) und den Variationskoeffizienten (Standardabweichung der Taxon-Häufigkeit dividiert durch den Mittelwert) berechnet3. Diese beiden Parameter wurden in einem Streudiagramm gegeneinander aufgetragen, um Taxa mit der höchsten Varianz zu erkennen, die an allen Probenahmestellen häufiger vorkommen, da diese möglicherweise geeignete biologische Indikatoren darstellen.

Um die Umweltfaktoren für den Aufbau der Bakteriengemeinschaft zu identifizieren, haben wir spezifische Variablen aus den Metadaten ausgewählt („pH“, „Elektrische Leitfähigkeit“, „Wassertemperatur“, „Fluss-km/Entfernung zur Mündung“, „Ntot“, „Chl a“, „DOC“, „Total Coliforms (LOG10(x + 1)“, „BacHum (LOG10(x + 1)“, „AllBac (LOG10(x + 1)“, „E.coli (LOG10(x + 1)“ ) (Ergänzende Abbildung 2). Fehlende Beobachtungen wurden mit der Mäusefunktion aus dem „Namensvetter“-R-Paket (Version 3.13.0) und dem VIM-Paket (Version 6.2.2) unter Verwendung des Predictive Mean Matching-Imputationsansatzes unterstellt. 56. Beziehungen zwischen Beta-Diversität und Chlorophyll a wurden untersucht, um das Ausmaß der Linearität entlang dieses Gradienten zu charakterisieren und nach möglichen Schwellenwerten zu suchen, die mit Verschiebungen in der Zusammensetzung der mikrobiellen Gemeinschaft verbunden sind. Die Analyse wurde anhand paarweiser Bray-Curtis-Unterschiede der Zusammensetzung der Bakteriengemeinschaft entlang des Chlorophyll a-Gradienten durchgeführt nach Fontaine et al.57.

Mithilfe eines Step-Forward-Auswahlmodells (vegane Version 2.6-2) haben wir für jede der vier taxonomischen Ebenen der Bakterien die Variablen ausgewählt, die am meisten mit der Hellinger-transformierten Bray-Curtis-Unähnlichkeitsmatrix zu tun haben. Das Ziel der Vorwärtsselektion bestand darin, Umweltparameter zu identifizieren, die mit der Zusammensetzung der Gemeinschaft variieren. Als nächstes wurden die aussagekräftigsten Variablen auf Multikollinearität getestet, indem der Wert des Varianzinflationsfaktors und der Toleranzwert verwendet wurden. Diejenigen Variablen, die einen Wert des Varianzinflationsfaktors über 5 aufwiesen, wurden von weiteren Analysen ausgeschlossen. Eine distanzbasierte Redundanzanalyse (dbRDA) wurde unter Verwendung der Hellinger-transformierten Bray-Curtis-Matrix für jede der vier taxonomischen Ebenen durchgeführt, indem nur die am häufigsten vorkommenden und variabelsten Taxa mit den oben ausgewählten Metadaten einbezogen wurden, um spezifische Beziehungen zwischen Phyla-Klassen zu identifizieren , Familien oder Gattungen mit besonderen Umweltfaktoren.

Variablen im Zusammenhang mit dem biologischen Status (Chlorophyll-A-Konzentration als Indikator für Eutrophierung und Klassifizierung der Saprobität gemäß dem Saprobic-Index) für flussabwärts gelegene Standorte wurden anhand von Informationen aus der Zusammensetzung der flussaufwärts gelegenen Bakteriengemeinschaft vorhergesagt. Die Identifizierung von ASVs, die für die Vorhersage des biologischen Status von Bedeutung sind, erfolgte in zwei Hauptschritten. Zunächst haben wir ein unbeaufsichtigtes Random-Forest-Modell (randomForest Version 4.6–14) erstellt, um Erkenntnisse über die latente Struktur der Standorte auf Basis von ASVs zu gewinnen und die ASV-Tabelle vorzufiltern, da der folgende Screening-Schritt rechenintensiv ist. Ohne Kenntnis der wahren Struktur innerhalb der Daten wurde eine Gittersuchoptimierung der Parameter für das unbeaufsichtigte Zufallswaldmodell an einem überwachten Modell durchgeführt, bei dem die Antwortvariable Chlorophyll eine Konzentration und die erklärenden Daten die Hellinger-transformierte ASV-Häufigkeitstabelle waren. Der niedrigste mittlere quadratische Fehler dieser überwachten Lernmodelle wurde mit einer Kombination von mtry=1600 und ntree=30 mit einer Datensatzaufteilung von 0,8/0,2 für Trainings- und Testsätze erzielt. Unter Verwendung dieser Parameter wurde das unbeaufsichtigte Zufallswaldmodell auf derselben Hellinger-transformierten ASV-Häufigkeitstabelle trainiert. Aus der unbeaufsichtigten Modellausgabe wurden Kandidaten-ASVs für die nachgelagerte Analyse ausgewählt, basierend auf dem Überschreiten eines Schwellenwerts von 0 im prozentualen Anstieg des mittleren quadratischen Fehlers (%IncMSE).

Der zweite Hauptschritt im ASV-Screening-Prozess bestand darin, für jeden ASV in absteigender Reihenfolge von %IncMSE eine Rastersuche nach der optimalen Kombination von Schritten (d. h. Anzahl der vorgelagerten Standorte) durchzuführen, die für (i) Transformation und (ii) verwendet werden sollten ) Verzögerung bei Verwendung von XGboost (Sci-Kit Learn-Implementierung von XGboost Version 1.3.3). Mit anderen Worten besteht das Ziel der Rastersuche darin, die zwei optimalen Verschiebungsrahmen für die Anzahl der Standorte für jeden ASV zu finden, der zur Vorhersage von Antwortvariablen verwendet wird. Die Transformation besteht in diesem Fall in der Skalierung und Zentrierung der ASV-Häufigkeiten, während die Verzögerung die Anzahl der Beobachtungen ist, die von flussaufwärts gelegenen Standorten für die Vorhersage an einem bestimmten flussabwärts gelegenen Standort benötigt werden. Das Kriterium für die Auswahl der besten Wertekombinationen für Transformation und Verzögerung war das Modell-R im Quadrat zum Testsatz für Chlorophyll a und der Genauigkeitsprozentsatz für die Klassifizierung des biologischen Status. Die Entwurfsmatrix für das ASV-Screening enthält zunächst die Proben-ID, den Transektcode (links, rechts und in der Mitte) und die Entfernung zur Flussmündung. Diese Metadatenvariablen werden einbezogen, um die Kontinuität jedes Längstransekts im Hinblick auf die laminare Strömungsdynamik sowie die Reisezeit im Falle der Entfernung zur Flussmündung zu berücksichtigen. Nachdem ein verbessertes R-Quadrat-Modell erhalten wurde, wird der Entwurfsmatrix ein ASV in seiner optimalen Transformations- und Verzögerungskombination hinzugefügt. Der ASV-Screening-Prozess wurde 1000 Mal für beide Wasserqualitätsvariablen mit zufälliger ASV-Reihenfolge und zufälligen Kombinationen von XGboost-Hyperparametern durchgeführt. Für die Klassifizierung auf der Grundlage des Saprobic-Index wiesen jedoch zwei Beobachtungen einen hohen biologischen Status auf und erschienen erstmals 550 km von der Flussmündung entfernt (ergänzende Abbildung 3), was jenseits der ersten 80 % der Beobachtungen liegt, in der Reihenfolge der Entfernung von der Flussmündung Donauquelle. Es ist unmöglich, die Modellgenauigkeit zu bewerten, wenn der Testsatz Variablenklassen enthält, die im Trainingssatz nicht vorhanden sind. Um Beobachtungen aller Variablenklassen in den Trainingssatz einzubeziehen, wurde die Trainings- und Testaufteilung der Daten für XGboost-Modelle (sowohl für die Chlorophyll-A-Konzentration als auch für die Klassifizierung des biologischen Status) auf 0,85 bzw. 0,15 festgelegt, wobei die Aufteilung erfolgte nach den ersten 85 % der Beobachtungen.

Die Modellausgaben für das ASV-Screening zur biologischen Klassifizierung wurden gefiltert, um nur diejenigen zu behalten, die eine Genauigkeit von 100 % aufweisen. Im Fall von Chlorophyll a wurde das Modell mit dem höchsten R-Quadrat beibehalten. Die Modellausgaben wurden in eine Anwesenheits-/Abwesenheitstabelle mit einzelnen Modellen als Zeilen und ASVs als Spalten zur Klassifizierung der Wasserqualität umgewandelt. Die resultierende Tabelle wurde dann für eine Netzwerkanalyse verwendet, die mit der R-Bibliothek igraph (Version 1.2.4.2) durchgeführt wurde. Kookkurrenz- und Koexklusionsnetzwerke wurden verwendet, um den Informationsgehalt und die Redundanz zwischen ASVs zu untersuchen. Informationsredundanz zwischen einzelnen Taxa im Sinne von Informationsgehalt, der sich in Modellvorhersageleistung umsetzt, wurde hier als ASVs interpretiert, die in keinem einzelnen Screening-Prozess-Output zusammen vorhanden sind. Die Logik hinter dieser Annahme besteht darin, dass ASVs sich gegenseitig ausschließen, wenn sie gemeinsame Vorhersageinformationen enthalten. Da der Screening-Prozess den ersten ASV eines Satzes erfasst, der einen bestimmten Anteil an Informationen enthält, würden die folgenden aus demselben Satz weggelassen, da sie das Modell nicht verbessern würden.

Im Gegensatz zum gemeinsamen Vorkommen, bei dem Gewissheit über die Beziehung besteht, kann das Gleiche nicht vom hier gefundenen gemeinsamen Ausschluss angenommen werden, da er aus der begrenzten Anzahl zufälliger Permutationen der gemeinsam gescreenten ASVs resultieren könnte. Dennoch tauchte in den meisten Ergebnissen des Screening-Prozesses eine kleine Anzahl von ASVs auf, was auf einen Anschein von Sättigung in ihrer Stichprobe schließen lässt und somit darauf hindeutet, dass ihre Co-Ausschlussbeziehungen korrekt sind. Die Auswahl der für diese Co-Ausschlussanalyse aufbewahrten ASVs wurde daher auf das 95. Perzentil nach Anzahl der Vorkommnisse festgelegt. Anschließend wurde ein Dendrogramm mit allen ASVs erstellt, die die besten Modelle für Eutrophierung und Wasserqualität lieferten, um taxonomische Überschneidungen zwischen Prädiktoren für beide Variablen zu visualisieren. Die hierarchische Clusterbildung wurde anhand einer Distanzmatrix durchgeführt, die aus der Taxonomietabelle berechnet wurde.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Daten des ICPDR, die in diesem Manuskript verwendet wurden, finden Sie auf GitHub – https://github.com/alper1976/danube_indicators (https://doi.org/10.5072/zenodo.1222217)55. Alle Sequenzierungsdaten sind im NCBI Sequence Read Archive unter der Zugangsnummer PRJNA835446 verfügbar. Weitere Daten können auf Anfrage beim ICPDR angefordert werden. Die Quelldaten hinter den Histogrammen in Abb. 1, 2 und 5 sind jeweils in den Zusatzdaten 1–3 verfügbar.

Code für die Sequenzierungsdatenverarbeitung, Modellierung, statistische Analyse und zusätzliche Details zu den Ansätzen sind auf GitHub verfügbar – https://github.com/alper1976/danube_indicators (https://doi.org/10.5281/zenodo.8193431)55.

Heiskanen, AS et al. Biodiversität in Meeresökosystemen – Europäische Entwicklungen hin zu robusten Bewertungen. Vorderseite. Mar. Sci. 3, 184 (2016).

Artikel Google Scholar

Cordier, T. et al. Überwachtes maschinelles Lernen übertrifft taxonomiebasiertes Umwelt-DNA-Metabarcoding im Biomonitoring. Mol. Ökologisch. Ressource. 18, 1381–1391 (2018).

Artikel CAS PubMed Google Scholar

Pin, L., Eiler, A., Fazi, S. & Friberg, N. Zwei verschiedene Ansätze zur Charakterisierung der mikrobiellen Gemeinschaftsstruktur in epilithischen Flussbiofilmen unter Bedingungen mehrerer Stressoren: Entwicklung molekularer Indikatoren. Mol. Ökologisch. Ressource. 22, 1200–1215 (2021).

Artikel Google Scholar

Mansilha, CR et al. Badegewässer: neue Richtlinie, neue Standards, neuer Qualitätsansatz. Mar. Pollut. Stier. 58, 1562–1565 (2009).

Artikel CAS PubMed Google Scholar

Figueras, MJ & Borrego, JJ Neue Perspektiven bei der Überwachung der mikrobiellen Qualität von Trinkwasser. Int. J. Umgebung. Res. Public Health 7, 4179–4202 (2010).

Artikel PubMed PubMed Central Google Scholar

Oliver, DM et al. Chancen und Grenzen molekularer Methoden zur Quantifizierung mikrobieller Compliance-Parameter in EU-Badegewässern. Umgebung. Int. 64, 124–128 (2014).

Artikel CAS PubMed Google Scholar

Wen, X. et al. Mikrobielle Indikatoren und ihre Verwendung zur Überwachung der Trinkwasserqualität – eine Übersicht. Nachhaltigkeit 2, 2249 (2020).

Artikel Google Scholar

Martínez-Santos, M. et al. Behandelte und unbehandelte Abwässer verändern die Bakteriengemeinschaften im Flusssediment, die am Stickstoff- und Schwefelkreislauf beteiligt sind. Wissenschaft. Gesamtumgebung. 633, 1051–1061 (2018).

Artikel PubMed Google Scholar

Bloem, J. & Breure, AM in Spurenmetallen und anderen Schadstoffen in der Umwelt Kap. 8 (Elsevier, 2007).

Cordier, T., Lanzén, A., Apothéloz-Perret-Gentil, L., Stoeck, T. & Pawlowski, J. Nutzung von Umweltgenomik und maschinellem Lernen für routinemäßiges Biomonitoring. Trends Mikrobiol. 27, 387–397 (2019).

Artikel CAS PubMed Google Scholar

Fortunato, CS et al. Bestimmung von Indikatortaxa über räumliche und saisonale Gradienten am Küstenrand des Columbia River. ISME J. 7, 1899–1911 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Aylagas, E. et al. Ein auf Bakteriengemeinschaften basierender Index zur Bewertung des ökologischen Zustands von Flussmündungs- und Küstenumgebungen. Mar. Pollut. Stier. 114, 679–688 (2017).

Artikel CAS PubMed Google Scholar

Louca, S., Doebeli, M. & Parfrey, LW Die Korrektur der 16S-rRNA-Genkopienzahlen in Mikrobiomuntersuchungen bleibt ein ungelöstes Problem. Mikrobiom 6, 41 (2018).

Artikel PubMed PubMed Central Google Scholar

Krehenwinkel, H. et al. Abschätzung und Abschwächung des Amplifikationsbias beim qualitativen und quantitativen Arthropoden-Metabarcoding. Wissenschaft. Rep. 7, 17668 (2017).

Artikel PubMed PubMed Central Google Scholar

Gloor, GB, Macklaim, JM, Pawlowsky-Glahn, V. & Egozcue, JJ Mikrobiom-Datensätze sind kompositorisch: und dies ist nicht optional. Vorderseite. Mikrobiol. 8, 2224 (2017).

Artikel PubMed PubMed Central Google Scholar

Poretsky, R., Rodriguez-R, LM, Luo, C., Tsementzi, D. & Konstantinidis, KT Stärken und Grenzen der 16S-rRNA-Gen-Amplikonsequenzierung bei der Aufdeckung der zeitlichen Dynamik der mikrobiellen Gemeinschaft. PLoS ONE 9, e93827 (2014).

Artikel PubMed PubMed Central Google Scholar

Miotto, R., Wang, F., Wang, S., Jiang, X. & Dudley, JT Deep Learning für das Gesundheitswesen: Rückblick, Chancen und Herausforderungen. Knapp. Bioinform. 19, 1236–1246 (2018).

Artikel PubMed Google Scholar

Ribeiro, MT, Singh, S. & Guestrin, C. „Warum sollte ich Ihnen vertrauen?“: Erklärung der Vorhersagen eines Klassifikators. Tagungsband der Konferenz 2016 des nordamerikanischen Kapitels der Association for Computational Linguistics: Demonstrations, 1135–1144. https://doi.org/10.18653/v1/N16-3020 (2016).

Newton, RJ, Jones, SE, Eiler, A., McMahon, KD & Bertilsson, S. Ein Leitfaden zur Naturgeschichte von Süßwasserseebakterien. Mikrobiol. Mol. Biol. Pfr. Fr. 75, 14–49 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, B. et al. Variation in der Zusammensetzung der Aktinobakteriengemeinschaft und der möglichen Funktion in verschiedenen Bodenökosystemen im trockenen Heihe-Flussbecken im Nordwesten Chinas. Vorderseite. Mikrobiol. 10, 2209 (2019).

Artikel PubMed PubMed Central Google Scholar

Fierer, N. & Jackson, RB Die Vielfalt und Biogeographie von Bodenbakteriengemeinschaften. Proz. Natl Acad. Wissenschaft. USA 103, 626–631 (2006).

Artikel CAS PubMed PubMed Central Google Scholar

Haukka, K. et al. Einfluss der Nährstoffbelastung auf die Zusammensetzung der Bakterioplanktongemeinschaft in Seemesokosmen. Mikrob. Ökologisch. 51, 137–146 (2006).

Artikel PubMed Google Scholar

Šimek, K. et al. Maximale Wachstumsraten und mögliche Lebensstrategien verschiedener Bakterioplanktongruppen im Verhältnis zur Phosphorverfügbarkeit in einem Süßwasserreservoir. Umgebung. Mikrobiol. 8, 1613–1624 (2006).

Artikel PubMed Google Scholar

Ruiz-González, C., Proia, L., Ferrera, I., Gasol, JM & Sabater, S. Auswirkungen der Regulierung großer Flussdämme auf die Struktur der Bakterioplanktongemeinschaft. FEMS Mikrobiol. Ökologisch. 84, 316–331 (2013).

Artikel PubMed Google Scholar

Wang, Y. et al. Biogeografisches Muster der bakterioplanktonischen Gemeinschaft und mögliche Funktion im Jangtsekiang: Rollen häufiger und seltener Taxa. Wissenschaft. Gesamtumgebung. 747, 141335 (2020).

Artikel CAS PubMed Google Scholar

Savio, D. et al. Bakterienvielfalt entlang eines 2600 km langen Flusskontinuums. Umgebung. Mikrobiol. 17, 4994–5007 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Besemer, K. et al. Entschlüsselung der Anordnung von Biofilmgemeinschaften in Bächen. ISME J. 6, 1459–1468 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Teixeira, P. et al. Bacteroides spp. und traditionelle fäkale Indikatorbakterien bei der Bewertung der Wasserqualität – ein integrierter Ansatz für das Wasserressourcenmanagement in städtischen Zentren. J. Umgebung. Geschäftsführer 271, 110989 (2020).

Artikel Google Scholar

Mayer, RE et al. Vorkommen von humanassoziierten genetischen Quellenverfolgungsmarkern von Bacteroidetes in Roh- und behandeltem Abwasser kommunaler und häuslicher Herkunft und Vergleich mit Standard- und Alternativindikatoren für Fäkalienverschmutzung. Wasserres. 90, 265–276 (2016).

Artikel CAS PubMed Google Scholar

Kirschner, AKT et al. Die multiparametrische Überwachung der mikrobiellen Fäkalienverschmutzung zeigt die Dominanz der menschlichen Kontamination entlang der gesamten Donau. Wasserres. 124, 543–555 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Mayer, RE et al. Globale Verteilung humanassoziierter fäkaler genetischer Marker in Referenzproben aus sechs Kontinenten. Umgebung. Wissenschaft. Technol. 52, 5076–5084 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Nguyen, PL et al. Schneller Nachweis und Überwachung von Flavobacterium psychrophilum in Wasser mithilfe eines tragbaren, tragbaren quantitativen PCR-Handsystems. J. Aquat. Anim. Gesundheit 30, 302–311 (2018).

Artikel CAS PubMed Google Scholar

Joe-Gaddy, V., Brassill, N., Carr, D., McLain, J. & Rock, C. Bewertung der Gesamtzahl von Bacteroides sp. als alternativer Indikator für die Wasserqualität in der Landwirtschaft. J. Lebensmittelmikrobiol. Sicher. Hyg. 6, 1000148 (2021).

Google Scholar

Farnleitner, AH et al. Escherichia coli und Enterokokken sind empfindliche und zuverlässige Indikatoren für die fäkale Verschmutzung von Menschen, Nutztieren und Wildtieren in alpinen Gebirgsgewässern. J. Appl. Mikrobiol. 109, 1599–1608 (2010).

CAS PubMed PubMed Central Google Scholar

Liška, I., Wagner, F., Sengl, M., Deutsch, K. & Slobodník, J. Gemeinsame Donauuntersuchung 3: eine umfassende Analyse der Wasserqualität der Donau. https://www.danubesurvey.org/jds3/jds3-files/nodes/documents/jds3_final_scientific_report_1.pdf (2015).

Pawlowski, J. et al. Die Zukunft biotischer Indizes im ökogenomischen Zeitalter: Integration von (e)DNA-Metabarcoding in die biologische Bewertung aquatischer Ökosysteme. Wissenschaft. Gesamtumgebung. 637–638, 1295–1310 (2018).

Artikel CAS PubMed Google Scholar

Tikhonov, M., Leach, RW & Wingreen, NS Interpretation von 16S-Metagenomdaten ohne Clustering, um eine Sub-OTU-Auflösung zu erreichen. ISME J. 9, 68–80 (2015).

Artikel PubMed Google Scholar

Kelly, MG, Penny, CJ & Whitton, BA Vergleichende Leistung benthischer Diatomeenindizes zur Beurteilung der Flusswasserqualität. Hydrobiologia 302, 179–188 (1995).

Artikel CAS Google Scholar

Rimet, F. & Bouchez, A. Biomonitoring von Flusskieselalgen: Auswirkungen der taxonomischen Auflösung. Ökologisch. Indik. 15, 92–99 (2012).

Artikel Google Scholar

Jones, FC Taxonomische Suffizienz: Der Einfluss der taxonomischen Auflösung auf Süßwasser-Biobewertungen unter Verwendung benthischer Makrowirbellose. Umgebung. Rev. 16, 45–69 (2008).

Artikel Google Scholar

Staley, C. et al. Anwendung der Sequenzierung der nächsten Generation von Illumina zur Charakterisierung der Bakteriengemeinschaft des oberen Mississippi. J. Appl. Mikrobiol. 115, 1147–1158 (2013).

Artikel CAS PubMed Google Scholar

Kolmakova, OV, Gladyshev, MI, Rozanov, AS, Peltek, SE & Trusova, MY Räumliche Artenvielfalt von Bakterien entlang des größten arktischen Flusses, bestimmt durch Sequenzierung der nächsten Generation. FEMS Mikrobiol. Ökologisch. 89, 442–450 (2014).

Artikel CAS PubMed Google Scholar

Read, DS et al. Biogeographie des Flussbakterioplanktons im Einzugsgebietsmaßstab. ISME J. 9, 516–526 (2015).

Artikel CAS PubMed Google Scholar

Velimirov, B., Milosevic, N., Kavka, GG, Farnleitner, AH & Kirschner, AKT Entwicklung des Bakterienkompartiments entlang der Donau: ein Kontinuum trotz lokaler Einflüsse. Mikrob. Ökologisch. 61, 955–967 (2011).

Artikel PubMed Google Scholar

Kirschner, AKT et al. Mikrobiologische Wasserqualität entlang der Donau: Integration von Daten aus zwei Flussumfragen und einem transnationalen Überwachungsnetzwerk. Wasserres. 43, 3673–3684 (2009).

Artikel CAS PubMed Google Scholar

Kavka, GG, Kasimir, GD & Farnleitner, AH Mikrobiologische Wasserqualität der Donau (km 2581 – km 15): Längsvariation der Verschmutzung, bestimmt durch Standardparameter. https://www.researchgate.net/publication/240633716_Microbiological_water_quality_of_the_River_Danube_km_2581_-_km_15_Longitudinal_variation_of_pollution_as_determined_by_standard_parameters/citation/download (2002).

Birk, S. & Hering, D. Direkter Vergleich von Bewertungsmethoden unter Verwendung benthischer Makrowirbellose: ein Beitrag zur Interkalibrierung der EU-Wasserrahmenrichtlinie. Hydrobiologia 566, 401–415 (2006).

Artikel Google Scholar

Birk, S. et al. Interkalibrierende Klassifizierungen des ökologischen Zustands: Europas Streben nach gemeinsamen Managementzielen für aquatische Ökosysteme. Wissenschaft. Gesamtumgebung. 454–455, 490–499 (2013).

Artikel PubMed Google Scholar

Griffiths, RI, Whiteley, AS, O'Donnell, AG & Bailey, MJ Schnelle Methode zur Koextraktion von DNA und RNA aus natürlichen Umgebungen zur Analyse der Zusammensetzung der mikrobiellen Gemeinschaft auf der Basis ribosomaler DNA und rRNA. Appl. Umgebung. Mikrobiol. 66, 5488–5491 (2000).

Artikel CAS PubMed PubMed Central Google Scholar

Reischer, GH et al. Quantitative Verfolgung mikrobieller Fäkalienquellen mit Probenahme unter Berücksichtigung der hydrologischen Einzugsgebietsdynamik. Umgebung. Mikrobiol. 10, 2598–2608 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Martin, M. Cutadapt entfernt Adaptersequenzen aus Sequenzierungslesevorgängen mit hohem Durchsatz. EMBnet J. 17, 10–12 (2011).

Artikel Google Scholar

Callahan, BJ et al. DADA2: hochauflösende Probeninferenz aus Illumina-Amplikondaten. Nat. Methoden 13, 581–583 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Quast, C. et al. Das SILVA-Ribosomal-RNA-Gendatenbankprojekt: verbesserte Datenverarbeitung und webbasierte Tools. Nukleinsäuren Res. 41, D590–D596 (2013).

Artikel CAS PubMed Google Scholar

Yilmaz, P. et al. Die taxonomischen Rahmenwerke SILVA und „All-species Living Tree Project (LTP)“. Nukleinsäuren Res. 42, D643–D648 (2014).

Artikel CAS PubMed Google Scholar

Fontaine, L., Pin, L. & Eiler, A. danube_indicators. https://doi.org/10.5072/zenodo.1222217 (2023).

Horton, NJ & Lipsitz, SR Multiple Imputation in der Praxis: Vergleich von Softwarepaketen für Regressionsmodelle mit fehlenden Variablen. Bin. Stat. 55, 244–254 (2001).

Artikel Google Scholar

Fontaine, L. et al. Mehrere Schwellenwerte und Trajektorien der mikrobiellen Biodiversität, vorhergesagt über Bräunungsgradienten durch neuronale Netze und Entscheidungsbaumlernen. ISME-Komm. 1, 37 (2021).

Artikel PubMed Central Google Scholar

Referenzen herunterladen

Diese Studie wurde finanziell von der Abteilung für Biowissenschaften und dem Zentrum für Biogeochemie im Anthropozän der Universität Oslo („Startpakke“ von Alexander Eiler) unterstützt. Diese Forschung ist Teil des EuroFLOW-Projekts (EUROpean Training and Research Network for Environmental FLOW Management in River Basins), das vom Rahmenprogramm Horizont 2020 – Forschung und Innovation der Europäischen Union im Rahmen der Marie-Skłodowska-Curie-Stipendienvereinbarung (MSCA) Nr. 765553 finanziert wird. Diese Studie wurde vom Österreichischen Wissenschaftsfonds (FWF) im Rahmen des „Vienna Doctoral Program on Water Resource Systems“ (DKplus W1219-N22) und den FWF-Projekten P25817-B22, P23900-B22 und P32464-B gefördert das Forschungsprojekt „Grundwasserressourcensysteme Wien“ in Kooperation mit Wiener Wasser (MA31). Die Infrastruktur (Kreuzfahrtschiffe, schwimmendes Labor) und die Logistik für die Sammlung, Lagerung und den Transport der Proben wurden von der Internationalen Kommission zum Schutz der Donau (IKSD) bereitgestellt. Dieses Manuskript enthält vom ICPDR lizenzierte Daten, die aus der Danubis-Datenbank (https://danubis.icpdr.org/) abgerufen wurden. Wir danken insbesondere Wolfram Graf, Béla Csány, Patrick Leitner, Momir Paunovic, Thomas Huber, Joszef Szekeres, Claudia Nagy und Peter Borza für die Bereitstellung von Daten zu Makroinvertebraten und der Klassifizierung des Saprobienindex, Martin Dokulil und Ulrich Donabaum für die Bereitstellung von Chlorophyll-Daten sowie Carmen Hamchivici, Florentina Dumitrache, Fabio Sena, Günther Umlauf, Carmen Postolache und Ion Udrea für die Bereitstellung allgemeiner physikalisch-chemischer Parameter und Nährstoffe sowie Marija Marjanovic-Rajcic und Damir Thomas für die Bereitstellung von DOC-Daten. Wir danken Franck Lejzerowicz für seine aufschlussreichen Vorschläge, die das Manuskript verbessert haben.

Abteilung für Aquatische Biologie und Toxikologie, Zentrum für Biogeochemie im Anthropozän, Abteilung für Biowissenschaften, Universität Oslo, Blindernv. 31, 0371, Oslo, Norwegen

Laurent Fontaine, Lorenzo Pin & Alexander Eiler

Norwegisches Institut für Wasserforschung (NIVA) Gaustadalléen 21, 0349, Oslo, Norwegen

Lorenzo Pin & Nikolai Friberg

Abteilung Wasserqualität und Gesundheit, Abteilung Pharmakologie, Physiologie und Mikrobiologie, Karl Landsteiner Privatuniversität für Gesundheitswissenschaften, Krems an der Donau, Österreich

Domenico Savio, Alexander KT Kirschner & Andreas H. Farnleitner

Interuniversitäres Kooperationszentrum für Wasser und Gesundheit, Wien, Österreich

Domenico Savio, Alexander KT Kirschner & Andreas H. Farnleitner

Forschungsgruppe für Mikrobiologie und Molekulare Diagnostik 166/5/3, Institut für Chemie-, Umwelt- und Bioingenieurwissenschaften, TU Wien, Wien, Österreich

Domenico Savio & Andreas H. Farnleitner

Abteilung für Süßwasserbiologie, Universität Kopenhagen, Universitetsparken 4, dritter Stock, 2100, Kopenhagen, Dänemark

Nikolai Friberg

School of Geography, University of Leeds, Leeds, LS2 9JT, Großbritannien

Nikolai Friberg

Medizinische Universität Wien, Institut für Hygiene und Angewandte Immunologie, Wassermikrobiologie, Kinderspitalgasse 15, 1090, Wien, Österreich

Alexander KT Kirschner

eDNA Solutions AB, Kärrbogata 22, 44196, Alingsås, Schweden

Alexander Eiler

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

DS, AKTK und AHF haben die Umfrage entworfen und die Probenahme verwaltet und durchgeführt. DS führte die Laborarbeiten zur Verarbeitung von DNA-Proben durch. LP, DS und AE verarbeiteten die Sequenzierungsdaten. LF führte die räumlich-zeitliche Modellierung und Schwellenwertanalyse durch. LP führte die Prävalenz-/Varianzanalyse durch. AE, NF, AKTK und AHF erhielten Fördermittel für die Umfrage. LF, LP, DS und AE haben das Manuskript geschrieben.

Korrespondenz mit Alexander Eiler.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt Lorenzo Brusetti und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptherausgeber: Eoin O'Gorman, Luke R. Grinham und George Inglis. Eine Peer-Review-Datei ist verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Fontaine, L., Pin, L., Savio, D. et al. Bakterielle Bioindikatoren ermöglichen die Klassifizierung des biologischen Zustands entlang der kontinentalen Donau. Commun Biol 6, 862 (2023). https://doi.org/10.1038/s42003-023-05237-8

Zitat herunterladen

Eingegangen: 15. Mai 2022

Angenommen: 10. August 2023

Veröffentlicht: 18. August 2023

DOI: https://doi.org/10.1038/s42003-023-05237-8

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.