Các nhà khoa học phát triển thuật toán để so sánh các bộ gen thực vật có liên quan chặt chẽ với nhau

Các nhà khoa học tại Viện Max Planck về nghiên cứu giống cây trồng ở Đức đã phát triển một thuật toán mới để so sánh các bộ gen có liên quan chặt chẽ với nhau, không phân biệt các loài. Các thuật toán xác định hiệu quả các trình tự làm cho các bộ gen khác nhau. Điều này cũng bao gồm việc xác định các đột biến làm cho thực vật ứng xử hoàn toàn khác nhau.

Nhóm nghiên cứu đã phát triển một phương pháp mà không cần tham khảo các trình tự. Dựa trên lý thuyết đơn giản rằng DNA của cây trồng đời cha mẹ khác với DNA của cây đột biến về đột biến có liên quan nên phương pháp này tìm cách đưa ra sự so sánh trực tiếp những bản đồ gen liên quan chặt chẽ với nhau.

Nếu các trình tự giống hệt nhau được loại bỏ bằng một thuật toán, điều này có nghĩa là chỉ những những trình tự này khác hai bộ gen còn lại. Những bộ gen này được phân tích bằng cách sử dụng cái gọi là “k-mer”, tức là những đoạn có chiều dài khoảng ba mươi cặp cơ sở có thể đếm được và phân nhóm rất dễ dàng và hiệu quả. Tất cả các k-mer giống nhau, tức là tất cả các chuỗi ADN giống hệt nhau, được nhóm lại với nhau thành một stack.

Vì các đoạn có đột biến liên quan có trình tự khác với trình tự của của đời cha mẹ, một stack k-mer mới được mở ra để chứa các thông tin trình tự cụ thể của chúng. Cuối cùng, thuật toán mới cho biết các stacks mới được phát sinh từ việc so sánh và các gen mà các stacks thuộc về.

Xem thêm tại http://www.mpipz.mpg.de/441094/schneeberger. Truy cập đầy đủ bài viết của nghiên cứu tại http://www.nature.com/nbt/journal/v31/n4/abs/nbt.2515.html.