높은
홈페이지홈페이지 > 소식 > 높은

높은

Jul 07, 2023

네이처 바이오테크놀로지(2023)이 기사 인용

24k 액세스

5 인용

172 알트메트릭

측정항목 세부정보

순수한 박테리아 배양은 미생물군집 연구의 상세한 실험 및 기계론적 연구에 필수적이며, 복잡한 미생물 생태계에서 개별 박테리아를 분리하는 전통적인 방법은 노동 집약적이고 규모 조정이 어렵고 표현형-유전자형 통합이 부족합니다. 여기에서는 필요에 따라 분리물을 신속하게 생성하기 위한 오픈 소스 고처리량 로봇 변형 분리 플랫폼에 대해 설명합니다. 우리는 콜로니 형태와 게놈 데이터를 활용하여 분리된 미생물의 다양성을 극대화하고 특정 속의 표적 선택을 가능하게 하는 기계 학습 접근 방식을 개발합니다. 20명의 인간 배설물 샘플에 이 플랫폼을 적용하면 모든 풍부한 분류군의 80%를 대표하는 총 26,997개의 분리물을 포함하는 맞춤형 장내 미생물군유전체 바이오뱅크가 생성됩니다. 시각적으로 포착된 100,000개 이상의 콜로니에 대한 공간 분석은 중요한 미생물 상호 작용을 시사하는 Ruminococcaceae, Bacteroidaceae, Coriobacteriaceae 및 Bifidobacteriaceae 계열 간의 공동 성장 패턴을 보여줍니다. 이러한 바이오뱅크의 1,197개 고품질 게놈을 비교 분석한 결과 흥미로운 개인 내 및 개인 간 계통 진화, 선택 및 수평적 유전자 전달이 나타났습니다. 이 배양학 프레임워크는 많은 새로운 미생물군집 연구를 위한 고해상도 게놈 데이터를 사용하여 영상 기반 표현형의 수집 및 정량적 분석을 체계화하기 위한 새로운 연구 노력에 힘을 실어줄 것입니다.

Metagenomics는 토양 군집에서 장내 미생물 군집에 이르기까지 다양한 미생물 생태계의 구성을 광범위하게 조사할 수 있는 기능을 제공합니다. 그러나 미생물은 서식지에서의 기능적 역할과 발생하는 수많은 종간 과정을 기계적으로 분석하기 위해 분리되고 배양되어야 합니다. '무차별 대입' 무작위 콜로니 따기에 의존하는 전통적인 재배 방법은 지루하고 노동 집약적입니다1,2,3,4. 96개 또는 384개의 웰을 사용하는 연속 희석 기반 분리 방법은 자원 집약적이며 인구 집단에서 동일한 우점 균주를 반복적으로 분리하는 결과를 낳습니다5. 미세유체 시스템은 나노리터 반응기에서 성장을 가능하게 하지만 클론 분리물은 추출하기 어렵습니다6,7. 전형적인 미생물군집이 긴 꼬리의 풍부 분포를 보이는 수백에서 수천 개의 고유한 종을 포함할 수 있다는 점을 감안할 때8(즉, 소수는 지배적이지만 대부분은 희귀함) 체계적인 배양학을 통해 포괄적인 균주 수집을 생성하는 것은 중요하고 뛰어난 과제로 남아 있습니다.

미생물은 특정 배지에서 자라는 능력이나 생산하는 대사산물 등 다양한 표현형을 기준으로 구별할 수 있습니다9,10,11,12. 성장 기반 선택은 예를 들어 다양한 영양소나 항생제가 포함된 성장 배지를 사용하여 희귀종의 분리를 향상시킬 수 있습니다1,2,13. 질량 분석 스펙트럼은 종14,15을 구별하는 데 사용할 수 있지만 이 접근 방식은 처리량이 낮고 수동 처리가 필요합니다. 다차원 이미지를 기반으로 진핵 세포를 분리하기 위해 이미징 활성화 세포 분류가 개발되었지만 이 방법은 정교한 계측이 필요하며 박테리아에는 구현되지 않았습니다. 다차원 이미징 및 생물학적 데이터17의 미묘한 특징을 식별하도록 훈련된 인공 지능(AI) 및 딥 러닝 모델의 최근 발전으로, 결합된 표현형 및 게놈 데이터 스트림의 기계 학습(ML)은 차세대 미생물 배양학을 변화시킬 준비가 되어 있습니다.

여기에서는 필요에 따라 배양된 바이오뱅크를 신속하고 높은 처리량으로 생성할 수 있는 ML 유도 로봇 균주 분리 및 유전자형 분석 플랫폼에 대해 설명합니다. 이 시스템은 지능형 이미징 기반 알고리즘을 사용하여 무작위 추출 방법에 비해 문화학의 분류학적 다양성을 높입니다. 우리는 20명의 인간 참가자를 위한 맞춤형 분리 바이오뱅크를 혐기적으로 생성하여 394개의 16S 앰플리콘 서열 변형(ASV)에 걸쳐 1,197개의 고품질 초안 게놈을 포함하는 총 26,997개의 분리를 생성함으로써 이 시스템의 유용성을 입증했습니다. 각 분리주에 대해 쌍을 이루는 게놈 및 형태학적 정보를 사용하여 우리는 콜로니 형태만을 기반으로 분류학적 정체성을 예측할 수 있는 ML 모델을 훈련했습니다. 이 ML 모델을 적용하면 관심 미생물의 표적 분리가 개선되었습니다. 한천 플레이트에서 성장한 모든 콜로니에 대한 대규모 영상 분석을 통해 흥미로운 종별 성장 패턴과 종간 상호 작용이 밝혀졌습니다. 개인화된 바이오뱅크의 전체 게놈 분석을 통해 개인별 계통 수준 변화와 주요 장문 내 수평 유전자 전달(HGT)의 특징이 밝혀졌습니다. 우리는 자동화된 배양학에 의해 생성된 모든 분리주의 검색 가능한 유전형, 형태학적 및 표현형 데이터를 포함하는 개방형 웹 기반 데이터베이스(http://미생물-culturomics.com/)를 미생물군유전체 분야에 대한 독특하고 확장된 커뮤니티 리소스로 추가로 개발했습니다.

20 times higher capacity and faster than manual colony isolation by a person. To ensure that our genomic analysis capacity matches the robotic isolation throughput, we also developed a low-cost, high-throughput sequencing pipeline that leverages liquid handling automation to generate barcoded libraries for 16S rRNA sequencing or whole-genome sequencing (WGS; Methods). The cost per isolate in this pipeline is $0.45 for colony isolation and genomic DNA (gDNA) preparation, $0.46 for 16S rRNA sequencing and $6.37 for WGS at a coverage of >60× on an Illumina HiSeq platform, which is substantially cheaper than commercial services (Supplementary Table 2)./p> 0.1% are shown and the side bar on the left represents their family-level taxonomy. ASVs found in personalized biobanks are shown as black bars in the right heatmap and uncultured ASVs not found in any biobank are highlighted. f, Correlation of average relative abundance in original feces sample and number of isolates in entire collection for ASVs. Highly abundant ASVs that are difficult to culture, that is, with fewer isolates, are highlighted. g, Average relative abundance of top abundant ASVs but with no more than 2 isolates in the entire collection. Color of bars represents family-level taxonomy./p> 0.1%) are found in the biobank. Notably, a substantial fraction of the uncultured gut bacteria belonged to the Ruminococcaceae and Lachnospiraceae families (Fig. 2e and Supplementary Table 6), which has also been previously documented as ‘unculturable’24. For each ASV, we compared the number of isolates generated in our total isolate collection versus their average abundance in the bulk feces (Fig. 2f), which appeared to be positively correlated. Still, we identified a set of abundant yet difficult-to-culture bacteria, including Faecalibacterium ASV-58, Prevatella ASV-470 and ASV-324, Oscillibacter ASV-215 and Clostridium XlVa ASV-287 (Fig. 2g). Interestingly, Faecalibacterium ASV-58, from which we obtained one isolate and performed WGS, matched with >98% genome-wide average nucleotide identity (ANI) to the metagenome-assembled genome (MAG) of Candidatus cibiobacter qucibialis. This strain in our collection was previously reported as the most abundant uncultured species in human gut25 and is highly depleted in inflammatory bowel disease (IBD) patients, as are other Faecalibacterium strains26./p>3% relative abundance on average in the bulk fecal matter, which further expands the collection of culturable gut microbiomes. Together, these results highlight cultured isolates and the remaining missing diversity based on our current media and growth conditions, and offer directions to guide future culturomics efforts focused on these ‘dark matter’ gut microbiome (Supplementary Table 6)./p> Bacteroides > Dorea), reflecting differences in their growth characteristics. On the other hand, colonies of Faecalibacterium are smaller and fainter, in line with our earlier results of their poor culturability. Furthermore, colony morphologies are significantly clustered according to their phylogeny (P = 0.008 by PERMANOVA test in Fig. 3c). For instance, most genera of Clostridia are closer to each other by morphology-based ordination (Fig. 3c). Therefore, colony morphologies may embed a substantial amount of information that could be linked to taxonomic identities./p>2 kb in length (Methods). Consistent with recent reports38,39, we observed that HGT events were strongly linked to the phylogeny of the isolates, that is, most HGT events occurred within the same phyla but were also quite prevalent across different families and between distinct species (Fig. 5c and Supplementary Table 10). Interestingly, we observed that HGTs were predominantly enriched between isolates with the same Gram staining, with Gram-negative species showing more prevalent HGTs than Gram-positive species (P = 0.0005 by Pearson's chi-squared test). This result is consistent with recent finding39 and suggests that different cell wall structures may play an important role in HGTs. Notably, HGTs between Gram-positive and -negative species were also observed in our dataset, inspiring future studies to study the effect of cell wall structures on HGTs and engineer these HGT elements into a microbiome editing tool. Next, to examine whether these HGTs occurred recently, we calculated the mean HGT frequency between all species pairs (Methods). We hypothesized that if HGTs occurred recently between two species, they would be only associated with a small proportion of isolates, resulting in a low frequency between species, while if HGTs occurred earlier and provided growth benefits, they would be enriched and vertically inherited by later generation, resulting in a high frequency. Interestingly, we found most HGT elements were frequently present across isolates (71.5% HGTs with >50% frequency), especially for ones within Bacteroidaceae species (Fig. 5c), suggesting that they occurred in the distant past and were enriched under strong selection within the gut environment./p>80% of all microbiota by abundance present. This isolate collection covers a majority of microbial diversity in the healthy gut and is one of the most extensive personalized isolate biobanks described to date. Using this resource, we demonstrated that quantitative analysis of colony morphologies can predict taxonomy, enhance the isolation of targeted genera and reveal potential interactions between microbes. Systematic analysis of genomic differences between isolates within and across people revealed interesting patterns of population selection, adaptation and HGT./p>100 isolates across all 20 individuals) were subjected to model training and testing. Considering the potential impact of antibiotics perturbation and neighbor colonies, a multilabel random forest model was trained on 70% of isolates, which was randomly sampled using 14 colony morphological features, antibiotics condition and number of nearby colonies, and the performance (precision and recall) of the model was evaluated on the remaining 30% of isolates. The procedure of model training and evaluating was bootstrapped 20 times with different randomization settings to minimize bias, and the background performance of the model was calculated by null model (prediction based on the number of isolates). To perform targeted microbial isolation, a multilabel random forest model was trained on colonies of data-rich genus (>15 isolates from the same individual) from individuals H12, H13 and H14 separately as described above. The same fecal samples were then plated out and the model was applied to the new plates after bacterial growth to screen all colonies on plates and predict colonies of targeted genus-level taxonomy. All colonies of the plates were then isolated on CAMII and subjected to 16S V4 sequencing to identify their taxonomy and evaluate the performance of targeted isolation./p> 20×; N50 > 5,000 bp; completeness > 80%; contamination < 5%) and used for downstream genomic variation and HGT analysis. To identify strain-level genomic variation of gut microbiota isolates within and between individuals, draft assemblies with the highest completeness and N50 of each species were selected as the reference genomes for reads alignment, and processed Illumina reads of isolates were aligned to reference genomes of the same species by Bowtie2 v2.3.4 (ref. 55) in paired-end mode with ‘--very-sensitive’ setting. Resulting reads alignments were then processed by SAMtools v1.9 and BCFtools v1.9 (ref. 56) with ‘--ploidy 1’ setting to call genomic variation (SNPs and Indels). Resulting variations were then subjected to quality filtering to identify ‘reliable’ genotypes (covered by ≥5 reads; with ≥0.9 haploidy) and only SNP variations with more than 90% ‘reliable’ genotypes across all isolates were used for downstream analysis. To construct SNP-based phylogeny, base profiles of isolates at SNP sites were concatenated together and UPGMA tree was then calculated by MEGA v11.0.11 with the default setting./p>95% ANI were considered to be the same species./p>20 and query coverage >50. Secretion systems were also predicted on CDS of HGT elements by EffectiveDB62 with the default setting./p>