USA: nowa metoda zapisu danych dotyczących ludzkiego genomu

Church

 

Church Genetyk z Harvard University opracował metodę ułatwiającą sekwencjonowanie genomu ludzkiego przez znaczne zmniejszenie rozmiarów plików zawierających dane genomu.

 

Prof. George Church opracował metodę zachowywania danych dotyczących genomu ludzkiego, pozwalająca na wprowadzenie niewielkich plików zamiast pełnego zapisu danych odnoszących się do każdego genomu.

 

Każda z 3,2 mld par nukleotydowych DNA zakodowana przez dwa bity oznacza 800 MB danych dla każdego genomu. Jednak konieczność powtarzania sekwencjonowania oraz umieszczenie danych pomocniczych dotyczących każdej bazy powoduje, że zapisanie danych wygenerowanych przez urządzenie do sekwencjonowania, opracowane przez firmę Ilumina – jedną z największych na tym rynku – tworzy plik o wielkości 100 GB.

 

Oznacza to, że przy próbie zsekwencjonowania genomów wszystkich ludzi mieszkających na Ziemi nie wystarczyłoby ani mocy obliczeniowej ani pamięci czy zasobów dyskowych wszystkich komputerowych urządzeń do składowania danych znajdujących się na naszej planecie.

 

Prof. Church stworzył rozwiązanie umożliwiające ominięcie tego problemu. Z sekwencjonowanego genomu tworzony jest tzw. genom wzorcowy. W kolejnych powtórzeniach sekwencjonowania zapisywane są tylko różnice w stosunku do genomu wzorcowego. Pozwala to na zmniejszenie rozmiaru pliku podstawowego. Skrócenie opisów zmniejsza ostatecznie cały plik danych genomu do 4 MB.

 

Rynek Zdrowia.pl