소프트웨어를 통한 생명과학 논문의 유전자 서열 오류 검사

38VIEWS
  Dec 07, 2017   Enago Academy   : Comments Off on 소프트웨어를 통한 생명과학 논문의 유전자 서열 오류 검사

  : 업계동향, 출판소식

많은 의사는 인공지능 암 진단이 암 발병 확률과 진단 확률을 높일 수 있을 것이라 말합니다. 빅데이터 분석에 기반을 둔 인공지능 의사인 IBM 왓슨은 이미 의료진에게 긍정적인 평가를 받고 있습니다. 환자의 상태, 즉 혈압, 증상, 조직 검사 결과 등을 입력하면, 수십억 개의 기존 자료와 비교하여 진단을 내리는 형식으로, 통계학과도 밀접하게 관련되어 있습니다.

 

엄청난 속도로 발전하고 있는 빅데이터 관련 기술은 일상에서 주변 음식점을 추천하는 수준을 넘어 유전체를 분석하는데도 적극적으로 활용되고 있습니다. 수십억 쌍의 유전체를 분석하는 데 수십 년이 걸리던 것이 하루 이틀 만에 완료되는 상황이 온 것이라 할 수 있습니다. 다른 예로는 지문인식을 꼽을 수 있습니다. 특정 지문을 인식하는데 사람이 하면 몇 년이 걸릴 것이지만, 컴퓨터 소프트웨어로는 하루 안에 가능한 것과 비슷한 원리입니다.

 

최근 생명과학 연구학계에서는 새로운 소프트웨어를 통해 출판된 논문 상의 유전자 서열 오류를 발견하여 화제가 되고 있습니다. 특히, 암 연구 관련 자료에서 많은 오류를 찾아냈다고 하는데요, 자세한 내용을 알아보도록 합시다. 호주 시드니 웨스트미드 소아과 연구소 제니퍼 번 (Jennifer Byrne)과 프랑스 그르노블 알르 대학의 컴퓨터공학 전공자인 시릴 라베 (Cyril Labbé)는 “Seek & Blastn”이라는 유전자 서열 오류 검사 프로그램을 개발했습니다. 제니퍼의 생명과학 지식을 바탕으로 소프트웨어 전문가인 시릴 라베가 협력하여 획기적인 생명과학 소프트웨어를 만들 수 있었습니다. 참고로 “Blastn”이라는 프로그램명은 “Nucleotide Basic Local Alignment Search Tool”의 약자에서 따왔습니다.

 

제니퍼 번은 암 세포의 유전자 기능에 대한 오류를 여러 논문에서 발견한 것을 계기로 2015년부터 암 관련 논문의 오류 분석하기 시작했습니다. 그녀는 “Seek & Blastn” 소프트웨어를 사용한 검사에서 25개가 넘는 논문에서 뉴클레오티드 배열 (nucleotide sequence) 오류를 발견하게 됩니다. 이 소프트웨어를 사용해 해당 논문을 열면 유전자 서열 오류 가능성이 높은 부분을 보여줍니다. 이를 연구자와 저널 편집자가 최종 확인 후 오류를 공식화하게 됩니다. 실제로 그녀가 발견한 뉴클레오티드 배열 오류로 인해 4건 논문의 출판 철회가 확정되기도 했습니다.

 

“Seek & Blastn” 소프트웨어를 통해 유전자 배열 상의 불일치 오류를 발견할 수 있으며, 검사 과정을 기존의 표절 검사 소프트웨어가 작동하는 방식과 비슷하다고 합니다. 현재는 테스트 단계로 아직 완벽한 수준은 아니라고 합니다. 그녀는 더 많은 생명과학 연구자들이 이 프로그램을 활용하여, 학계 발전에 도움을 주고 싶다고 말합니다.

 

프로그램 개발을 담당한 시릴 라베는 현재로서는 인간의 유전자 배열 자료에서만 오류 확인이 가능하다고 합니다. 추후 업그레이드를 통해 동식물의 유전자 배열 오류 검색도 가능할 것으로 기대하고 있다고 하네요. 그는 논문의 유전자 배열 자료가 명확하게 표기되지 않은 경우, 이 역시 프로그램이 오류로 인식할 수 있다고 밝혔습니다. 때문에 반드시 연구자가 소프트웨어가 오류로 표기한 부분을 재확인해야 한다고 덧붙였습니다.

 

참고자료:

  1. https://www.youtube.com/watch?v=G8m0IUuVUzM
  2. https://www.nature.com/news/online-software-spots-genetic-errors-in-cancer-papers-1.23003?utm_source=TWT_NatureNews&sf174026034=1
  3. http://peerreviewcongress.org/prc17-0177
  4. http://scigendetection.imag.fr/TPD52/
  5. http://scigendetection.imag.fr/TPD52/0-Seek-169.pdf
  6. http://scigendetection.imag.fr/TPD52/



Comments are closed for this post.