웹사이트에서 자동화된 방법으로 데이터를 수집하는 ‘데이터 크롤링’은 현재 많은 기업이 활용하고 있는 방법 중 하나입니다. 하지만 그 이면에는 법적 함정이 도사리고 있습니다. 데이터베이스의 저작권과 관련된 문제는 생각보다 복잡하게 얽혀 있으며, 무심코 크롤링을 시도하다가 법적 책임을 지게 될 수도 있습니다.
이번 글에서는 데이터 크롤링을 할 때 반드시 알아야 할 법적 이슈를 짚어보며, 저작권 침해를 피하는 방법을 대법원 판례를 통해 함께 알아보시죠!
데이터 크롤링이란?
우선, 데이터 크롤링이 무엇인지부터 설명하겠습니다. 데이터 크롤링은 컴퓨터 프로그램을 사용하여 웹 사이트에서 원하는 데이터를 자동으로 추출하는 행위입니다. 웹사이트의 내용을 감시하고, 자동으로 데이터를 가져와 분석 및 분류하는 작업을 의미합니다. 이는 ‘스크래핑’이라는 단순한 자료수집과는 차이가 있습니다. 스크래핑은 수집에 중점을 두는 반면, 크롤링은 데이터를 적극 활용하고 체계적으로 분류하는 데 주안점을 둡니다.
하지만, 크롤링 과정에서의 법적 이슈는 매우 민감한 문제로 떠오르고 있습니다. 웹사이트의 데이터는 그 사이트의 저작물로 간주할 수 있으며, 저작권이나 기타 법적 권리의 침해로 이어질 수 있기 때문입니다. 그렇다면, 이러한 크롤링이 언제 법적 문제가 될 수 있는지 살펴보겠습니다.
저작권법과 데이터베이스 보호
먼저, 저작권법의 보호 대상이 되는 저작물은 ‘사람’이 창작한 사상이나 감정을 표현한 ‘창작물’입니다. 저작물은 창작자에게 고유한 권리를 부여하는데, 저작자는 자신의 저작물을 복제, 배포, 전시, 공연할 수 있는 권리를 가집니다.
그렇다면, 웹사이트에 있는 데이터베이스가 저작권으로 보호받을 수 있을까요? 일반적으로 데이터 자체는 저작권으로 보호받지 못합니다. 이는 데이터 자체가 창작물이 아닌, 사실이나 정보를 단순히 나열한 것에 불과하기 때문입니다.
하지만 데이터베이스가 저작권법으로 보호받지 않는다고 해서 법적으로 자유롭게 크롤링할 수 있는 것은 아닙니다. 우리 법에서는 데이터베이스 제작자에게 일정 조건을 만족할 경우, ‘데이터베이스권’을 부여하고 있습니다. 이 권리는 저작권과는 다르게 데이터베이스의 구성을 보호하는 것이 목적입니다.
1. 데이터베이스 권리와 데이터 크롤링
데이터베이스권이 보호받는 데이터에 대해서는, 그 데이터를 무단으로 크롤링하거나 복제할 경우 법적 문제가 발생할 수 있습니다. 이와 관련된 대표적인 법적 근거로는 저작권법 제93조가 있습니다. 해당 조항은 데이터베이스 제작자에게 그 데이터베이스의 전부 또는 상당한 부분을 복제, 배포, 방송 또는 전송할 권리를 부여하고 있습니다.
또한, 데이터베이스의 개별적인 소규모 데이터를 반복적으로 크롤링해도, 그것이 체계적이거나 목적성을 가진 행동이라면 해당 데이터베이스의 권리를 침해하는 것으로 판단될 수 있습니다.
이에 따라, 데이터베이스의 상당한 부분을 무단으로 복제하거나 수집하는 경우는 저작권법에 따라 처벌될 수 있습니다.
2. 정보통신망법과 부정경쟁방지법
이외에도 데이터 크롤링은 정보통신망법과 부정경쟁방지법에 따라서도 규제될 수 있습니다.
정보통신망법 제48조는 정보통신망에 정당한 접근 권한 없이 침입하는 행위를 금지하고 있습니다. 즉, 웹사이트의 서버에 접근하는 것이 허가되지 않았다면, 크롤링을 통해 데이터를 수집하는 행위는 불법이 될 수 있습니다.
부정경쟁방지법 제2조 제1항 카목 또한 크롤링에 대한 규제를 담고 있습니다. 이 조항은 불법적인 방법으로 데이터를 취득하거나, 이를 이용하는 행위를 제한하고 있습니다. 즉, 데이터가 허용된 범위 내에서 제공되지 않았거나, 이를 무단으로 취득한 경우 부정경쟁으로 간주할 수 있습니다.
데이터 크롤링에 대한 법원의 판단: 권리침해 기준
1. 데이터베이스 제작자의 권리 침해 판단 기준
1) 내부 서버 접근 여부
크롤링 프로그램이 데이터베이스의 내부 서버에 접근할 수 있는지 살펴봐야 합니다. 만약 무단으로 접근하게 되면, 이는 법적으로 문제가 될 수 있습니다.
2) 크롤링된 정보의 양
수집한 데이터가 전체 데이터베이스에서 차지하는 비율이 얼마나 되는지를 판단해야 합니다. 만약 크롤링한 정보가 데이터베이스의 상당한 부분을 차지한다면, 권리 침해로 간주할 수 있습니다.
3) 정보의 질
수집한 정보의 공개성과 질적인 수준도 중요합니다. 공개된 데이터라도, 그 정보가 고유하고 가치 있는 내용이라면 권리 침해로 이어질 수 있습니다.
2. 관련 판례
실제 판례에서는 데이터 크롤링이 언제 불법으로 간주하는지를 자세히 다루고 있습니다.
예를 들어, 서울고등법원 2017. 4. 6. 선고 사건(201642019365 판결)에서는 크롤링 프로그램을 이용해 API 서버로부터 자료를 수집한 행위가 문제가 되었습니다. 피고인은 앱의 패킷을 분석하여, API 서버에서 정보를 자동으로 호출하는 명령 구문을 알아낸 후, 이를 사용해 다량의 숙박 정보를 수집하였습니다. 이 사건에서 법원은 여러 법률을 고려하여 다음과 같은 결론을 내렸습니다.
1) 정보통신망 침입죄: 피고인이 서버에 접근한 행위가 정보통신망법 제48조에 어긋나는지 여부를 따졌습니다. 하지만 법원은 해당 서버가 누구나 접근할 수 있는 공개된 상태였고, 접근을 제한하는 보호 조치도 없었으므로 침입죄가 성립하지 않는다고 판단했습니다.
2) 저작권법 위반: 피고인이 데이터베이스 제작자의 권리를 침해했는지에 대한 쟁점에서는, 수집된 데이터가 상당한 양이 아니었고, 데이터베이스의 통상적인 이용을 벗어나지 않았다고 보았습니다.
이 사건에서 법원은 데이터베이스 제작자의 권리를 침해하지 않았다고 판결하며, 피고인에게 무죄를 선고하였습니다.
데이터 크롤링 시 고려 사항 : 법적 이슈 예방
인터넷에서 정보를 크롤링할 때는 다음 세 가지 사항을 고려해야 합니다.
1. 저작권법 보호 여부
크롤링하려는 데이터가 저작권법으로 보호받는 데이터베이스인지 확인해야 합니다. 보호받는 데이터라면 적법한 허가가 필요합니다.
2. API 서버 접근 가능성
보호받지 않는 데이터라도, 크롤링을 통해 API 서버와 같은 내부 시스템에 접근하게 된다면 문제가 생길 수 있습니다. 이럴 때에도 법적 책임이 따를 수 있습니다.
3. 데이터의 양적 및 질적 가치
수집한 데이터가 양적으로 충분하고, 질적으로도 의미 있는 정보인지 판단해야 합니다. 중요한 정보가 많다면, 권리 침해로 간주될 가능성이 높습니다.
이렇게 각 요소를 신중히 고려하여 크롤링 대상을 선정해야 법적 문제를 예방할 수 있습니다.
데이터 크롤링과 관련 [FAQ]
Q. 데이터 크롤링을 하면 무조건 불법인가요?
A. 아닙니다. 허락을 받고 합법적인 방법으로 많은 기업이 경우에는 문제가 되지 않습니다.
Q. 데이터 크롤링으로 인해 발생할 수 있는 문제는 무엇인가요?
A. 저작권 침해, 정보통신망 침입, 부정경쟁 등 다양한 법적인 문제가 발생할 수 있습니다.
Q. 데이터 크롤링을 안전하게 하려면 어떻게 해야 하나요?
A. 허락을 받고, robots.txt를 확인하고, 법적인 자문을 구하는 것이 좋습니다.
결론: 데이터 크롤링, 신중해야 합니다
데이터 크롤링을 할 때는 단순히 자료를 수집한다고 해서 법적 책임이 면제되는 것은 아닙니다. 크롤링하려는 데이터가 저작권법으로 보호받는 데이터베이스인지, 정보통신망에 불법적으로 접근하는지, 그리고 수집한 데이터가 질적·양적으로 상당한 수준에 해당하는지 등을 신중하게 고려해야 합니다. 따라서 법적인 문제를 피하고 원활한 데이터 수집을 위해서는 크롤링 대상을 철저히 검토한 후, 필요한 경우 법적인 자문을 받는 것이 좋습니다.