검색 알고리즘에 대한 이슈

13VIEWS
  Feb 12, 2016   Enago Academy   : 0

  : 업계동향, 전문가견해

논문 검색을 위해 pubmed나 구글 스칼러 등을 이용하는 연구원 수가 증가하고 있습니다. 이들 논문검색 시스템은 저자, 논문 제목, 키워드 등에 기반하여 보다 편리하고 정확한 검색 서비스를 제공하고 있습니다. 특히 구글 스칼러의 경우, 새로운 논문 통계 지표로 각광 받고 있으며, 많은 연구자들이 구글 스칼러를 통해 연구에 실질적 도움을 받고 있습니다.  이러한 검색 알고리즘이 마냥 축복이라고  받아들이기만 할 수 있는가에 대한 논란이 있습니다.

-검색 알고리즘이란?

알고리즘은 계산 또는 문제 해결을 위한 컴퓨터 명령 및 코딩 규칙을 말합니다. 검색 알고리즘을 이용하면, 대규모의 데이터베이스 내에서 특성 속성을 가진 항목들을 찾을 수 있습니다. 우리가 흔히 알고 있는 네이버, 구글 등의 검색 엔진은 물론, 논문 전문 검색 엔진은 연구원들이 보다 쉽게 원하는 자료를 찾을 수 있게 해줍니다. 연구원들은 자료 검색에 소요되는 시간을 줄일 수 있고, 절약되는 시간을 활용하여 창조적인 연구 활동에 매진할 수 있습니다. 그리고 연구에 도움이 되는 자료들을 찾음으로써, 연구의 질적 향상을 기할 수도 있습니다.

-알고리즘의 종류

알고리즘에는 여러 종류가 있습니다. 먼저 선형 검색의 경우, 특정 항목을 찾을 때까지 각 항목들을 순서대로 검색하게 됩니다. 순서대로 검색해 나가기 때문에 보다 정밀하고 오차가 적은 검색을 할 수 있지만, 검색 속도가 느리다는 단점이 있습니다. 다음으로 2진 검색의 경우, 수치 키 또는 필드의 태그 기록을 찾게 됩니다. 컴퓨터 시스템의 2진수 기록을 이용하는 방식으로써 보다 신속한 검색이 가능합니다. 예를 들어, 운전면허증 번호나 주민등록번호의 경우 숫자로만 이뤄져 있는데,  0,1의 2진수 코드로 저장된 수치 정보를 보다 신속하게 검색할 수 있게 됩니다. 다음으로, 트리 검색이라는 것이 있습니다. 트리 검색은 일종의 계층형 검색 시스템입니다. 나무의 뿌리에 해당되는 항목으로부터 여러 가지에 해당되는 검색 결과를 찾아가게 됩니다. 자료 유형에 따른 보다 전문화된 검색이 가능합니다. 마지막으로 유전자 알고리즘의 경우, 데이터의 문자열을 검사하여 부정확한 결과를 배제하는 단계를 거칩니다. 이러한 단계를 반복하게 되면 최종적으로는 가장 연관성이 높은 결과만 남게 됩니다.

– 구글 검색

전세계의 인터넷 이용자에게 가장 친숙하고 대중적인 검색은 바로 구글 검색입니다. 한국의 경우, 네이버가 주류 서비스라고 할 수 있지만, 전문 자료의 검색을 위해 구글 검색을 이용하는 연구자의 수가 크게 증가하고 있습니다. 네이버 검색과는 달리 구글 검색을 이용하면 광고를 배제한 보다 스마트한 결과를 찾을 수 있습니다. 게다가 구글 스칼러를 이용하면 전문 학술검색도 가능합니다.

구글 검색의 장점이자 단점은 한 번에 너무 많은 검색 결과를 보여준다는 것입니다. 따라서, 자신이 원하는 정보를 적절히 필터링 할 수 있는 능력이 중요하며, 구글 스칼러는 이를 위해 많은 시스템적 지원을 제공합니다. 단, 구글 스칼러의 경우, 피어 리뷰를 거친 연구와 그렇지 않은 연구를 구분하지 못한다는 점에 주의해야 합니다. 즉, 검색 결과가 모두 피어리뷰를 거친 연구는 아니라는 사실을 고려하고, 검색 결과를 무조건 신뢰해서는 안됩니다.

– 검색 기술의 혁신

오늘날, 각종 데이터 양은 크게 증가로 인하여, 정보의 홍수 속에 살고 있습니다. 따라서 유용한 정보를 적절히 찾아내는 능력이 더욱 중요해지고 있습니다. 잘못된 입력 값을 넣으면 잘못된 결과 값이 도출될 수 밖에 없기 때문입니다. 연구원들의 검색 알고리즘에 관한 기본적인 훈련 교육이 필요할 때입니다.

 

이나고영문교정 서비스, 영어논문교정 서비스 그리고 저널투고 지원 서비스를 제공해드리고 있습니다.




Be the first to write a comment.

Your email address will not be published.

You must be logged in to post a comment.