10

컴퓨터 정보과학 학과를 위한 검색 엔진 및 온라인 디지털 도서관, CiteSeerX

CiteSeerX이란?

CiteSeer는 1998년에 컴퓨터 정보과학 학과를 중심으로 설립된 검색 엔진 및 디지털 도서관입니다. 이 엔진은 처음으로 인용정보의 자동생성 기능 (autonomous citation indexing)을 세계적으로 소개하여 그 당시의 온라인 연구의 환경에 큰 영향을 미쳤습니다. 그럼에도 불구하고 이 엔진은 다양한 약점이 있습니다. 첫째, 오픈 액세스 자료 (open-access data) 통해서만 데이터를 얻을 수 있습니다. 또한, 이 CiteSeer를 시작했을 때 원형 시스템으로 출시했습니다. 그러하여 데이터가 커지면서 시스템이 과부하 됐습니다. 이로 인해 같은 시스템을 더 이상 사용할 수 없기에 새롭게 더 든든한 시스템을 만들었습니다. 그것은 바로 2008년에 출시된 CiteSeerX이란 프로그램입니다.

CiteSeerX는 CiteSeer의 약점을 극복하여 2008년에 새롭게 시작하는 시스템입니다. 그래서 하루에 150만의 검색어를 나타내도 CiteSeer에서 보였던 문제가 없습니다. CiteSeerX는 그냥 디지털 도서관이 아니라 다른 디지털 도서관도 홍보하기 위한 다양한 재원을 (예컨대, 알고리즘, 데이터, 메타데이터, 등등) 제공하는 시스템입니다. 이 시스템은 새로운 방법 및 알고리즘을 사용하여 포스트스크립트 (Postscript) 및 PDF 문서들을 색인합니다.

CiteSeerX 기능

CiteSeerX는 CiteSeer보다 더 많은 기능을 가지고 있습니다. 연구하는 것을 더 쉽게 할 수 있는 인용정보의 자동생성뿐만 아니라 기타 유용한 기능이 많아졌습니다. 이런 다양한 기능이 생겼기 때문에 2010년도에 세계 1위 온라인 보관소로 선정됐습니다.

첫째, CiteSeerX는 정기적으로 가장 최근의 내용을 갱신합니다. 그러하여 CiteSeerX에 있는 문서 및 논문들은 항상 업데이트가 됩니다. 2010년에 150만 논문이 있었는데 2016년에도 이 시스템을 통하여 약 700만 논문이 있습니다. 이 정보를 보면 CiteSeerX의 보관소가 짧은 기간에 확대된 것을 알 수 있습니다. 그러하여 여러분의 연구 주제에 관련된 더 많은 논문을 찾을 수 있습니다.

둘째, 강력한 검색 기능이 있으니 저자의 이름, 성 아니면 머리글자로만 논문을 찾을 수 있습니다. 기초 검색 뿐만 아니라 복합 검색도 가능합니다. 그래서 여러분이 필요한 논문을 정확하게  찾을 수 있습니다. 특히 한글로 작성된 이름은 영문으로 표기하면 철자를 틀릴 수 있습니다. 이때에는 저자의 이름을 정확하게 알지 않아도 다른 조건으로 필터링함으로써 여러분이 찾는 논문을 찾을 수 있습니다.

셋째, 특정 논문을 검색하면 그와 비슷한 주제의 논문도 보여줍니다. 논문을 작성할 때 문헌조사가 있어야 그 분야에 현재 무슨 문제가 있는지, 또한 어떤 주제를 연구해야 하는지 알 수 있습니다. 유사한 주제의 논문을 읽음으로써 더 많은 정부를 얻을 수 있으며, 결과적으로 심도 깊은 연구를 수행하는데 도움이 됩니다.


넷째, CiteSeerX에서는 자료 검색 뿐만 아니라 연구자들이 자기가 쓴 논문을 이 시스템에 올릴 수 있습니다. 그래서 다른 비슷한 웹사이트와 비하면 CiteSeerX는 더 많은 논문을 검색할 수 있습니다.

 나를 위한 MyCiteSeerX

My CiteSeerX의 가장 유용한 기능이 MyCiteSeerX이란 기능입니다. 이 기능은 여러분만을 위한 서비스입니다. 이 기능이 편리한 이유는 여러분이 직접 검색 설정 및 필터를 조절할 수 있는 것입니디. 이런 기능을 통하여 여러분이 찾는 논문을 더 정확하게 찾을 수 있습니다. 왜냐하면 여러분의 관심이 있는 분야를 저장할 수 있기 때문에, 알고리즘을 통하여 여러분을 위한 가장 유용한 결과를 줄 수 있습니다.

그것뿐만 아니라 여러분이 찾은 논문은 “개인 수집품” (personal collection)이나 개인 목록에 저장할 수 있습니다. 이러하여 논문을 찾자 마자 바로 읽지 않아도 됩니다. 저장하고 다시 웹사이트에 들어가면 다시 쉽게 찾을 수 있습니다.

또한, 여러분이 저장한 논문이 편집되거나 수정되면 알림을 받아 항상 업데이트된 문서를 얻을 수 있습니다. 그것뿐만 아니라 SNS과 비슷한 기능도 있으니 여러분과 비슷한 주제에 관심이 있는 전 세계 연구자들하고 쉽게 연결될 수도 있습니다.

현재 이런 검색 엔진이 CiteSeerX뿐만 아니라 다른 검색 예컨대 Web of Science 및 SciELO도 존재합니다. CiteSeer와 같이 무료로 찾을 수 있는 논문 및 문서만 이 검색 엔진에 포함되었으니 어떤 논문은 이 시스템에 검색해도 안 나올 논문이 있습니다. 참고로 CiteSeerX에서 찾을 수 없는 정보는 다른 인용 색인 데이터베이스의 URL를 그 웹사이트에 찾을 수 있습니다. 예컨대 DBLP Computer Science BibliographyAllenAl Semantic Scholar의 URL입니다. 그럼에도 불구하고 현재 무료로 사용할 수 있는 CiteSeerX는 새롭고 다양한 기능들이 생겼으니 특히 MyCiteSeerX을 사용하여 여러분이 여러분의 연구 주제에 관련된 논문이 더 편하고 쉽게 찾을 수 있습니다. CiteSeerX의 발전은 멈추지 않고 보관소도 커질 테니 여러분의 연구에 더 큰 도움이 될 겁니다.

참고자료

  1. https://pdfs.semanticscholar.org/dfb2/5cf7efec9a7c114f6327e4b06a306cce5cb6.pdf
  2. http://csxstatic.ist.psu.edu/about
  3. http://csxstatic.ist.psu.edu/about/history
  4. http://csxstatic.ist.psu.edu/about/mycsx
  5. https://twitter.com/CiteSeerX
  6. http://csxstatic.ist.psu.edu/help
  7. http://csxstatic.ist.psu.edu/about/mycsx
X

회원가입 후 더보기

무료로 보실 수 있는 기사 횟수에 제한이 있습니다. 구독하시면 논문작성
및 저널 출판에 관한 다양한 자료를 횟수제한 없이 이용하실수 있습니다.

  • 500개 이상의 출판뉴스
  • 50개 이상 웹세미나
  • 10개 이상 전문가 진행 팟캐스트
  • 10개 이상 이북
  • 10개 이상 체크리스트
  • 50개 이상 인포그래픽
여러분의 의견을 나눠주세요

윤리적 고려 사항 및 준수해야 할 모범적 사례” 관련 웨비나 진행을 위해 관심있는 주제를 선택해 주세요.