1. Đặc điểm chính của Bulk RNA-seq và single cell RNA-seq
2. Các bước cơ bản trong thí nghiệm scRNA-seq
-
Phân lập tế bào từ mô
-
Phân tách RNA từ từng tế bào
-
Tổng hợp cDNA, nhân lên cDNA bằng phản ứng PCR hoặc nhân lên cDNA thông qua phản ứng phiên mã trong ống nghiệm (in vitro transcription) kết hợp với phiên mã ngược
-
Tạo thư viện DNA giải trình tự và giải trình tự
-
Phân tích kết quả

4. Các bước cơ bản trong phân tích dữ liệu scRNA-seq
Phân tích dữ liệu scRNAseq thường bắt đầu với “Expression matrix”. Trong Expression matrix, mỗi hàng biểu diễn một gene và mỗi cột biểu diễn một tế bào. Như vậy, mỗi ô biểu diễn mức độ biểu hiện của một gene trong một tế bào. Các bước xây dựng một “Expression matrix” bao gồm:
- Read Quality control: Đọc và kiểm tra chất lượng đoạn giải trình tự. (Công cụ: FastQC hay Karen).

- Alignment: Liên kết đoạn giải trình tự với hệ genome tham khảo (reference genome) để tìm gene tương ứng với đoạn giải trình tự. (Công cụ sử dụng: STAR, TopHat)

- Mapping Quality control: Kiểm tra độ chính xác của bước liên kết đoạn giải trình tự với reference genome dựa trên các chỉ số như: tỉ lệ giữa ribosome RNA và transposon RNA, tỉ lệ các đoạn nối đặc hiệu, độ sâu (read depth), đoạn đọc trải dài qua các điểm nối (splice junctions).

- Reads Quantification: Tính toán mức độ biểu hiện của mỗi gene trong một tế bào. Với phương pháp scRNA-seq sử dụng kỹ thuật “tag-base”, UMI có thể được dùng để tính số lượng tuyệt đối của một phân tử RNA.
Sau khi được xây dựng, “Expression matrix” được dùng trong phân tích tiếp theo thông qua các nền tảng thiết kế riêng cho scRNA-seq.
Hiện nay, có rất nhiều nền tảng dùng để phân tích dữ liệu scRNA-seq. Tuy nhiên trong tutorials này chúng ta sẽ chủ yếu sử dụng các nền tảng sau:
-
Scanpy trong Python
-
Seurat trong R
-
Bioconductor: nguồn mở, chứa các phần mềm dùng cho phân tích dữ liệu genomics trong R
5. Thách thức
Sự khác biệt lớn nhất giữa phân tích Bulk RNA-seq và scRNA-seq là mỗi thư viện giải trình tự là đặc trưng của một tế bào thay vì của một quần thể tế bào. Vì vậy chúng ta cần lưu ý khi so sánh giữa các tế bào khác nhau. Những yếu tố có thể dẫn đến sự không tương quan khi so sánh bao gồm:
-
Sự nhân lên thiếu đồng đều của cDNA (Bias amplification)
-
Gene “bị loại bỏ” (Gene dropout) là trường hợp gene biểu hiện ở mức độ trung bình hoặc yếu trong một tế bào, nhưng không xuất hiện trong tế bào khác.
Nguyên nhân của việc này là do số lượng đầu vào thấp của RNA trong một tế bào. Làm thế nào để cải thiện hiệu suất và giảm sự không đồng đều vẫn đang được tiếp tục nghiên cứu
6. Phương pháp thí nghiệm

Có rất nhiều phương pháp thí nghiệm, tuy nhiên, các phương pháp này có thể được phân nhóm dựa trên hai đặc điểm sau: (1) Cách định lượng RNA (2) Cách “bắt giữ” từng tế bào
Có hai cách định lượng chính. Một là giải trình tự toàn bộ đoạn RNA (full-length). Hai là dùng “đầu dò” gắn đầu 3’ hoặc 5’, và chỉ giải trình tự đoạn gắn “đầu dò” (tag-based). Nên sử dụng phương pháp nào phụ thuộc vào mục đích tạo dữ liệu, vì cả hai đều có ưu và nhược điểm riêng. Về lí thuyết, “full-length” sẽ bao phổ (coverage) đồng đều đoạn phiên mã RNA. Tuy nhiên, thực tế cho thấy sự bao phổ (coverage) là không đồng đều. Nghĩa là có phần của đoạn phiên mã được bao phổ nhiều hơn so với các phần khác. Ưu điểm lớn nhất của phương pháp “tag-based” là có thêm trình tự nhận dạng phân tử đặc hiệu (Unique Molecular Identifier - UMI) trong đoạn mồi. Trình tự này là đặc trưng cho từng loại RNA khác nhau, vậy nên có thể được sử dụng trong định lượng. Tuy nhiên, nhược điểm của phương pháp này là bị giới hạn ở một đầu của RNA, và gây khó khăn trong việc phân biệt các isoform.
Khi nghĩ về phương pháp “bắt giữ” từng tế bào, chúng ta có thể xem xét ba sự lựa chọn sau: microwell, microfluidic, và droplet:
-
Microwell: sử dụng các phương pháp phân tách như FACS, pippette, laser capturing, để đưa từng tế bào vào trong một giếng có kích thước micro. Ưu điểm của microwell là có thể chụp hình ảnh của tế bào trong một giếng. Nhược điểm là quy mô nhỏ và khối lượng công việc lớn.
-
Microfulidic (Fluidigm C1): sử dụng nguyên lý thuỷ động lực học để dẫn dắt từng tế bào vào một buồng phản ứng. Ưu điểm là tính tự động hoá và quy mô cao hơn so với microwell. Tuy nhiên, hiệu suất thấp, chỉ có 10% số lượng tế bào được giữ lại ở các buồng phản ứng; và giá thành cho một đĩa “chip” quá đắt đỏ.
-
Droplet (10X Genomics, in-Drop): ý tưởng của phương pháp droplet là bao bọc một tế bào trong một giọt dầu đã có sẵn bead gắn đoạn mồi và nguyên liệu cho phản ứng tạo cDNA. Đây là phương pháp có hiệu suất và quy mô cao nhất trong ba loại.
Nguồn:
https://scrnaseq-course.cog.sanger.ac.uk/website/introduction-to-single-cell-rna-seq.html
Hoặc