학술정보 분야에서도 인공지능이 기여할 수 있을까?
이제 학술정보에도 인공지능기술의 도입이 확산되고 있습니다. 스프링어 네이처(Springer Nature)의 연구 데이터베이스인 “나노(Nano)”는 2016년에 만들어진 나노 기술(nanotechnology)에 관한 정보 데이터베이스입니다. 나노는 약 2십5만 종 이상의 나노 소재(nanomaterials)에 대한 정보들을 요약하여 제공하고 있습니다. 여기에는 나노 물질들의 속성과 응용 분야 등이 담겨 있습니다. 이 정보들은 이 분야의 전문가들이 직접 컨텐츠를 만들고 있고 데이터베이스의 구조가 검색이 용이하도록 제작되어 있습니다.
연구원들은 논문 전체를 읽지 않고도 관련된 나노기술 데이터와 정보를 여기서 쉽게 확인할 수 있습니다. 특히 나노 소재에 관련된 정보를 다양한 정보원으로부터 모아 한 곳에서 확인할 수 있는 것이 큰 도움이 됩니다. 물론 각 나노 소재의 설명에는 원 정보원의 링크가 연결되어 있어 소스 논문에도 쉽게 접근할 수 있습니다.
나노는 이제 인공지능과 결합하여 기능이 더 강화되었습니다. 나노는 UNSILO라는 인공지능 솔루션 회사와 제휴하여 인공지능을 통해 이제 152개 저널의 약 40만개 이상의 관련 연구논문으로부터 데이터를 가져올 수 있게 되었습니다.* UNISILO는 학술 텍스트 기반의 정보들을 검색하는 머신 러닝 툴을 제작하는 학술 분야에 특화된 덴마크의 스타트업입니다. 이들은 이미 인공지능을 통해 스프링어 네이처의 연구 논문들을 대한 검색 서비스를 제공해 주고 있습니다.
스프링어 네이처 측은 나노 소재 연구원들이 보다 최신의 정보를 빨리 습득하기를 희망하여서 기존 데이터베이스에 인공지능을 결합시켰다고 합니다. 인공지능이 결합되면서 기존에 전문가들이 큐레이션 해오던 방식이 아니라 최신의 정보를 자동으로 빨리 더 많이 제공할 수 있게 되었습니다. 나노 측은 인공지능을 통해 더 많은 최신 정보를 제공함으로써 연구자들이 개별 저널을 일일이 확인하지 않더라도 나노 한 곳에서 모든 정보를 확인할 수 있게 되었다고 말합니다. 확실히 특정 분야에 관련된 모든 정보들을 한 곳에서 확인하는 것은 효용성이 있습니다.
이제 나노기술 분야 뿐만 아니라 다양한 학술 분야에서 더 많은 정보의 빠른 공유와 확산을 위해 검색기술이 진화될 필요가 있습니다. 여기에 인공지능의 역할이 생깁니다. 우선 저널의 데이터를 자동으로 색인하는 기술은 가장 기본적입니다. 이것 만으로도 연구원들에게 큰 도움을 줄 수 있습니다.
학술분야는 인공지능이 도입되기에 용이한 측면이 많습니다. 우선 인공지능은 명확한 매개변수가 나올 수 있는 데이터가 유리합니다. 컨텐츠 상에 매개 변수가 너무 적거나 내용이 모호하고 비일관적이면 인공지능이 처리하기가 힘들고 오류 발생 확률이 높습니다. 그런데 대부분의 저널들이 가진 매개 변수가 유사하고 실제 변수들 내에 반영된 컨텐츠도 유사하기 때문에 다양한 저널들을 한꺼번에 검색하면서 유관한 정보와 데이터를 추출해내는 것이 상대적으로 용이합니다. 앞으로 학술 분야에서 다양한 인공지능 솔루션이 발전하면서 연구원들의 연구활동을 도와 주는데 기여하길 기대해 봅니다.