10

표절 및 표절 검사의 새로운 동향, 로제팅(Rogeting)과 인용 기반 검사(CbPD)

표절은 학계에서 근절되어야 할 중대한 비위행위입니다. 그런데 연구와 논문 작성의 지난함 때문에 일부 연구자들이 종종 다른 연구자들의 연구 내용을 표절하는 사례가 나오고 있습니다. 이에 대처하기 위해 논문 표절을 검사하는 소프트웨어와 도구들이 개발됐습니다. 그런데 이런 도구들이 만들어지면, 이에 대응하여 표절을 들키지 않으려는 노력도 점점 더 교묘해집니다. 그리고 표절 검사 도구들은 이런 지능적인 대응에 대처하기 위해 기능이 업그레이드됩니다.

컴퓨터와 인터넷이 발전하면서 새로운 형태의 표절 방식이 나타났습니다. 로제팅 (Rogeting)은 표절 검사 소프트웨어를 우회하기 위해 상당수의 단어를 유사어로 대체하는 표절 행위를 말합니다. ‘로제의 시소러스 (Roget’s Thesaurus)’라는 유명한 유의어 사전을 활용한다는 점에서 로제팅으로 불립니다. 인터넷에서 유의어를 자동으로 바꿔 주는 서비스까지 있어 이런 행위를 하기가 쉬워졌습니다. 그런데 전체적인 맥락을 고려하지 않고 많은 단어들을 유의어로 교체하면 문장의 의미를 알아 볼 수 없게 되는 문제가 발생할 수 있습니다. 따라서 결국 사람이 다시 손을 보아야 하는데, 이 과정에서 원문과 유사한 단어를 사용하게 되어 유사어로 대체한 노력이 허사가 될 수 있습니다. 또한 로제팅이 비록 기술적으로 교묘히 단어들을 유의어로 바꾸어 표절 검사 소프트웨어를 속일 수 있다고 해도, 육안으로 보면 원문의 구조와 매우 유사하게 보이므로 그 허점을 파악할 수 있습니다.

이전에는 주로 텍스트를 그대로 가져오는 단순한 형태의 표절이 대부분 이었습니다. 그러나 최근에는 문장 내용을 바꿔 표절을 들키지 않으려는 시도가 생기면서, 이에 대한 대처로 감춰져 잘 보이지 않는 표절까지도 찾아내려는 방법이 개발됐습니다. 대표적인 예가 인용 기반 표절 검사 (CbPD : Citation-based Plagiarism Detection) 입니다.

인용 기반 표절 검사는 벨라 깁 (Bela Gipp) 박사가 개발한 방법으로 인용을 포함하는 어떤 텍스트에도 적용될 수 있습니다. 이는 기존의 텍스트 기반 표절 검사의 단점을 보완한 것입니다. 기존 방식은 일반적으로 단어 중복만을 검사하기 때문에, 번역된 내용이나 아주 교묘하게 위장한 표절은 잡아내지 못했습니다.

이에 대응하여 인용 기반 표절 검사는 논문 상에 인용된 언어의 의미론적 특성을 활용합니다. 자세히 설명하자면, 논문 상의 인용 내용과 순서를 파악, 표절한 텍스트의 원문과 비교하여 유사한 패턴을 보이는지 확인합니다. 문장을 번역했거나, 다른 표현으로 바꿔 표현했더라도 인용 패턴의 유사성을 추적하여 표절 여부를 검사할 수 있습니다. 이 접근법은 미국 국립의학도서관 (National Library of Medicine)의 바이오 의학 및 생명 공학 분야 데이터베이스인 펍메드 센트럴 (PubMed Central) 오픈 액세스 상의 2십만 개 이상의 논문들을 분석해 본 결과, 실제 효과가 있는 것으로 나타났습니다.

인용 기반 표절 검사는 기존의 텍스트 기반 표절 검사를 대체하기 보다는 이를 보완하는 것으로 보는 것이 좋습니다. 텍스트 기반 표절 검사는 텍스트가 많이 변형되지 않았을 경우, 아주 일부의 텍스트만으로도 표절 여부를 검사할 수 있습니다. 여기에 인용 기반 표절 검사를 통해 보다 긴 텍스트를 보완 검사하면 표절 검사의 정확도를 높일 수 있습니다.

표절은 근절되어야 하지만, 연구와 논문 작성의 힘들고 경쟁적인 환경 속에서 그 꼬리가 쉽게 잘리지 않습니다. 표절 방식도 더 지능적으로 변하고 있지만, 기술의 발전으로 그 또한 찾아낼 수 있다는 점을 잊지 말아야 할 것입니다.

 

참고 문헌:

  1. http://www.slate.com/articles/life/education/2014/08/writing_clearly_in_student_papers_the_right_click_thesaurus_and_rogeting.html
  2. https://en.wikipedia.org/wiki/Rogeting
  3. http://sciplore.org/wp-content/papercite-data/pdf/thesisbelagipp.pdf
  4. http://www.sciplore.org/wp-content/papercite-data/pdf/gipp10c.pdf
  5. http://www.sciplore.org/projects/citation-based-plagiarism-detection/
X

회원가입 후 더보기

무료로 보실 수 있는 기사 횟수에 제한이 있습니다. 구독하시면 논문작성
및 저널 출판에 관한 다양한 자료를 횟수제한 없이 이용하실수 있습니다.

  • 500개 이상의 출판뉴스
  • 50개 이상 웹세미나
  • 10개 이상 전문가 진행 팟캐스트
  • 10개 이상 이북
  • 10개 이상 체크리스트
  • 50개 이상 인포그래픽
여러분의 의견을 나눠주세요

대학교 입장에서 연구 및 학문 글쓰기 AI도구 활용에 대한 의견을 공유해 주세요.