Breaking News

구글, 유전체 염기서열 분석 AI 개발…게놈 시퀀싱 기술 급진전


 

▲출처=마크제이킬

휴먼 게놈 프로젝트(HGP·Human Genome Project)가 시작된 이후 10여년간 과학자들은 큰 문제없이 DNA 염기서열을 분석해왔지만 구글의 새로운 인공지능(AI) 툴이 등장해 또 한번 혁신이 예고된다. 구글의 설명에 따르면 이 회사가 개발한 ‘딥배리언트(DeepVariant)’를 통해 기존의 방식들 보다 더 정확하게 유전적 데이터 분석을 할 수 있게 됐다.

인간 유전체 염기서열 분석이 처음으로 성공한 역사적 성취 이후 대량의 유전체 분석이 놀라운 속도로 이뤄지며 게놈 시퀀싱은 일상적인 것이 됐다.

유전체 염기 서열 분석 기술은 지난 1977년 영국의 화학자 프레더릭 생어가 개발했으며 ‘생어 시퀀싱’이라는 이름이 붙었다. 이 기술 덕분에 과학자들은 인간의 유전체 염기 서열을 분석할 수 있게 됐다. 하지만 당시 이 기술로는 전체 염기 서열 중 극히 일부를 차지하는 유전자 1개를 해독하는 데 두 달의 시간이 소모됐다. 이후 1990년에 시작한 휴먼 게놈 프로젝트는 2003년 전체 염기 서열을 분석 할 수 있었다.

하지만 지금까지는 뉴클레오타이드를 정렬하는 것과 정해진 틀 안에서의 추측을 하는 것만 할 수 있었다. 이 가운데 구글이 최근 AI 기술과 머신러닝을 활용해 더 정확하게 한 사람의 유전체 그림을 완성할 수 있는 툴 ‘딥배리언트’를 발표해 관심을 끌고 있다.

(출처:TED-마크제이킬)

스스로 유전체 염기서열 분석 능력 향상, 더 정확한 시퀀싱

AI가 가진 능력 중 하나인 머신러닝은 시스템이 외부 프로그램의 개입 없이도 스스로 능력을 향상시킬 수 있는 애플리케이션이다. AI 기반의 유전체 분석 기술인 딥배리언트는 자동으로 작은 삽입·결실 돌연번이 및 단일 염기쌍 돌연변이 등을 식별하고, 빠른 속도의 대량 분석을 실시함으로써 적은 노력으로 전체 유전체의 그림을 더 정확히 그릴 수 있는 것으로 알려졌다.

딥배리언트 초기 버전을 테스트한 하버드 연구원 브래드 챕맨은 MIT 테크놀로지 리뷰와의 인터뷰를 통해 “유전체 분석에 어려운 부분들이 있는데 기존 시퀀싱 프로그램들의 문제점은 각각의 툴마다 어려운 영역이 다르고 각자의 장단점이 있다는 것”이라며 “이 때문에 임상적 시퀀싱을 실시할 때 다양한 방법들을 이용하는 게 중요하다”라고 말했다

2000년대 초반, 유전체 분석이 처음으로 널리 가능해졌지만 과학자들은 수집된 데이터들을 해석하는 데 어려움을 겪었다. DNA는 분석될 수 있었지만 거대한 데이터 집합체는 부정확하고 불완전한 유전체 그림을 초래했다.

딥배리언트를 만든 ‘구글 브래인’ 팀은 이 같은 기존 방식을 이용한 대량 분석의 오류를 방지하기 위해, 그들의 딥러닝 시스템에 전체 유전체 분석 뿐 아니라 대량 분석으로부터 얻은 데이터를 보강하고, 이 시스템이 분석된 데이터를 높은 정확도로 해석할 수 있을 때까지 계속 오류를 바로 잡아 나갔다.

AI 의료 소프트웨어 회사인 딥 제노믹스의 CEO 브렌던 프레이는 테크리뷰와의 인터뷰를 통해 “딥배리언트는 유전학에서 딥러닝은 복잡한 수작업 시스템보다 더 뛰어난 성능의 시스템을 자동으로 훈련시키는 데 활용될 수 있음을 입증한다. 그래서 딥배리언트의 성공이 중요하다”고 말했다.

이와 함께 암, 당뇨병부터 심장병 등에 이르는 다양한 질병들은 유전적으로 연결된다고 알려졌으며, 의사들은 이미 환자의 상태를 진단하는 데 가족력을 고려한다. AI는 환자가 이미 가지고 있는 질병과 어떤 질병이 발생할 위험에 처해있는지에 대한 진단을 더욱 빠르고 정확하게 할 수 있다는 게 구글의 설명이다.

(출처:셔터스톡)

“30억달러 들던 유전체 분석, 10만원대 시대로”

구글 외에도 유전체 염기서열 분석 기술을 급 진전 시키고 있는 기업들이 있으며 대표적으로 미국 일루미나를 들 수 있다. 올해 초 일루미나 최고경영자(CEO)는 앞으로 몇년 내에 한 사람의 유전체 서열 전체를 분석하는 비용이 현재의 10분의 1 수준으로 떨어질 것이라 장담한 바 있다.

일루미나는 유전체 해독 장비 시장 글로벌 리더로 유전체 분석 비용을 낮추는 데 큰 역할을 해왔다. 짧은 시간 동안 여러 명의 유전체를 동시에 분석할 수 있는 차세대 염기 서열 분석 장비를 제작하는 이 업체는 지난 2014년 1,000달러의 비용으로 2주 만에 유전체 서열 해독을 할 수 있는 장비를 발표해 이목을 집중시켰다. 이 회사는 올해 60명의 유전체 염기 서열을 48시간 만에 분석할 수 있는 ‘노바식 6000’을 발표했으며, 이 장비를 기반으로 향후 3~4년 내 1명의 유전체 염기 서열 전체 분석 비용이 10만 원대로 떨어질 것으로 전망했다.

인간 게놈 프로젝트는 아직 발병하지 않은 질병에 대한 대비를 가능하게 한 다는 데 의의가 있다.정밀 의학이라 불리는 이 분야는 30억 쌍의 염기 배열에서 유전자를 찾아냈고, 정상 유전자와 변이 유전자를 구분할 수 있는 자료를 축적해 암에 걸릴 확률 등을 찾아내 질병이 발생하기 전에 예방치료를 할 수 있게 해준다.

지난 2013년 미국 영화배우 앤젤리나 졸리는 자신의 유전체 염기서열을 표준 모델과 비교해 본후, 자신의 ‘브라카(BRCA)1’ 유전자에 변이가 있다는 사실을 알아냈다. 이 유전자 변이형을 갖고 있으면 유방암에 걸릴 확률이 80%가 넘기 때문에, 졸리는 암에 걸리기 전에 예방 치료를 실시했다.

하지만 유전체 염기서열 분석 분야는 비용 문제가 큰 걸림돌이었다. 2013년 당시 개인의 유전체 염기 서열을 해독하려면 수천만 원이 넘는 비용을 들었기 때문에 일반인들이 혜택을 누리기가 어렵다. 이에 일루미나는 유전체 분석 40주년을 맞아 100달러 시대를 선언한 것이다.

생어 시퀀싱이 처음으로 등장할 당시 15년이 소요되던 유전체 전체 분석기간은 2년으로, 30억 달러였던 비용은 100만달러까지 낮아졌지만 여전히 너무 부담스런 비용이다.

하지만 일루미나의 선언대로 유전체 분석 비용이 10만 원대로 떨어진다면 건강검진 항목에 혈액 유전자 검사를 포함하는 등 본격적으로 의료에 이용할 수 있게 된다. 환자가 현재 발생한 질병 뿐 아니라 발생 가능성이 있는 질병까지도 적은 비용과 시간으로 쉽게 찾아낼 수 있는 시대가 온다는 얘기다.

(출처:NIH)

 


Popular News

Recent News

  • (주)에이플에이디 / 등록번호 : 서울, 아01384 / 등록일자 : 2017-10-18 / 제호 : 메디컬리포트 / 발행인 : 주두철 / 편집인 : 이용준 / 주소 : 서울특별시 금천구 가산디지털1로 168 (가산동, 우림라이온스밸리) C동 707호 / 발행일자 : 2017-10-18 / 전화번호 02-1688-4615 / 청소년보호책임자: 이찬건